[알고리즘 트레이딩] 주가는 로그정규분포? 로그수익률은 정규분포?
📊 주가는 로그정규분포? 로그수익률은 정규분포? 쉽게 정리해드립니다
주식 투자나 퀀트 모델링을 공부하다 보면 꼭 마주치는 말이 하나 있습니다.
“주가는 로그정규분포를 따르고, 로그수익률은 정규분포를 따른다”
이 말은 도대체 무슨 뜻일까요? 그리고 왜 이렇게 가정하는 걸까요?
이번 글에서는 이 문장을 처음 접하는 분도 이해할 수 있도록 쉽게 설명해보겠습니다.
1️⃣ 주가의 수학적 모델링: 왜 로그를 쓰는가?
우리는 일반적으로 주가 가 시간에 따라 무작위로 움직인다고 생각합니다.
이를 수학적으로 표현하면 다음과 같은 지수 모델을 사용합니다:
여기서
-
: 초기 주가
-
: 평균 수익률
-
: 변동성
-
: 시간에 따라 누적되는 무작위 요소 (브라운 운동)
이 수식은 "주가는 지수적으로 움직인다"는 걸 의미합니다.
즉, 수익이 복리로 누적된다는 가정입니다.
2️⃣ 로그를 취하면? → 정규분포!
위 식에 로그를 취하면:
이제 보세요.
오른쪽은 선형적이고, 무작위 요소 는 정규분포를 따릅니다.
즉, 자체가 정규분포를 따른다는 뜻입니다.
그리고 중요한 사실!
가 정규분포를 따른다면,
는 로그정규분포를 따르게 됩니다.
3️⃣ 로그정규분포는 어떤 분포일까?
로그정규분포는 다음과 같은 특징이 있습니다:
-
항상 0보다 큼 (주가가 음수가 될 수 없다는 현실을 반영)
-
오른쪽 꼬리가 길고 비대칭적 (급등의 가능성을 내포)
-
로그를 취하면 정규분포가 됨
4️⃣ 로그수익률은 왜 정규분포를 따를까?
로그수익률은 이렇게 정의됩니다:
즉, 정규분포를 따르는 로그 주가 간의 차이입니다.
정규분포끼리의 차이 역시 정규분포입니다.
결국,
이렇게 로그수익률은 평균 중심의 대칭 분포를 가지며, 수학적으로도 다루기 쉬운 정규분포가 됩니다.
5️⃣ 왜 이런 가정을 쓰는 걸까?
이 가정은 현실적인 이유와 수학적인 이유가 모두 있습니다.
이유 | 설명 |
---|---|
현실 반영 | 주가는 절대 음수가 될 수 없음 → 로그정규분포 적합 |
수학적 편리함 | 로그수익률이 정규분포면 수식이 간단해지고, 확률 계산이 쉬워짐 |
금융 모델링 | 블랙-숄즈 옵션 가격 모델도 이 가정을 기반으로 작동 |
🧠 마무리 요약
-
주가 : 로그정규분포를 따름
→ 항상 0보다 크고, 비대칭적 -
로그수익률 : 정규분포를 따름
→ 평균 중심으로 대칭적, 수학적으로 분석 용이
📌 참고: 이 가정은 완벽하지 않습니다
실제 시장은 급락, 변동성 군집, 비대칭 꼬리 등 정규분포보다 더 복잡합니다.
그래서 이 기본 가정 위에 GARCH, 확률적 변동성, 극단값 이론 등의 보완 모델이 개발된 것이죠.
하지만 기초 모델링을 배우거나 퀀트 투자의 첫 단계를 배우는 데 있어
“주가는 로그정규, 로그수익률은 정규”라는 가정은 매우 강력하고 유용합니다.
🔍 원문 다시 보기
“오른쪽은 선형적이고, 무작위 요소 는 정규분포를 따릅니다.”
이 문장은 아래 수식과 관련이 있습니다:
💡 하나씩 해석해봅시다
1. "오른쪽은 선형적이고"란?
오른쪽은 세 개의 항으로 되어 있습니다:
-
: 초기 주가의 로그값 → 상수 (시간 t와 무관)
-
: 평균 수익률 에 시간 를 곱한 것 → 선형적으로 증가함
-
: 무작위성(랜덤성)을 나타내는 항 → 시간에 따라 확산되는 노이즈
➡️ 따라서 전체적으로 보면:
-
평균적으로는 때문에 직선처럼 올라감 (선형적),
-
하지만 거기에 가 더해져서 불규칙하게 흔들리는 형태가 되는 거예요.
2. 는 무엇인가?
는 표준 브라운 운동 (standard Brownian motion) 이라고 부릅니다.
-
평균: 0
-
분산: 시간 에 비례
-
즉, → 정규분포
➡️ 그러므로
즉, 여전히 정규분포를 따르지만, 시간이 갈수록 퍼지는 정도(분산)가 커집니다.
🎯 결론 요약
-
식은 선형적 경향성(rt) + 랜덤 요인() 으로 구성
-
는 시간에 따라 확산되는 정규분포 기반의 랜덤 값
-
따라서 전체 로그 주가 도 정규분포를 따르게 되고,
-
그 결과, 주가 는 로그정규분포를 따르게 되는 것입니다.
댓글
댓글 쓰기