[수학] 정규분포와 로그정규분포의 대칭성: 왜 중요한가?
📊 정규분포와 로그정규분포의 대칭성: 왜 중요한가?
데이터 분석이나 금융 모델링을 하다 보면 자주 마주치는 개념 중 하나가 바로 **정규분포(Normal Distribution)**와 **로그정규분포(Lognormal Distribution)**입니다. 이 두 분포는 겉보기에는 비슷해 보일 수도 있지만, **대칭성(symmetry)**이라는 측면에서 아주 중요한 차이를 가지고 있습니다. 오늘은 이 두 분포의 대칭성과 그 의미에 대해 쉽게 풀어보겠습니다.
✅ 정규분포(Normal Distribution): 완벽한 대칭
정규분포는 종 모양(bell-shaped curve)의 그래프로 가장 잘 알려져 있습니다. 평균을 기준으로 좌우가 완벽하게 대칭이며, 대부분의 자연현상(키, 시험 점수 등)이 정규분포를 따른다고 알려져 있죠.
-
중심: 평균 = 중앙값 = 최빈값
-
대칭성: 평균을 중심으로 좌우 대칭
-
값의 범위: 음수, 양수 모두 가능 (-∞ ~ ∞)
-
활용 예시: 시험 점수, IQ, 키, 기온 등
정규분포는 통계학과 머신러닝에서 매우 중요한 분포로, 다양한 이론이 이 분포를 기반으로 만들어졌습니다.
📈 로그정규분포(Lognormal Distribution): 오른쪽으로 치우친 분포
로그정규분포는 이름 그대로, 로그를 취하면 정규분포가 되는 분포입니다. 즉, 어떤 변수가 로그를 취한 후 정규분포를 따른다면, 원래 그 변수는 로그정규분포를 따른다고 볼 수 있습니다.
-
중심: 평균 > 중앙값 > 최빈값
-
대칭성: 비대칭 – 오른쪽으로 꼬리가 길다 (skewed right)
-
값의 범위: 0보다 큰 값만 존재 (0 ~ ∞)
-
활용 예시: 주식 가격, 소득 분포, 생존 시간, 옵션 가격 등
로그정규분포는 특히 금융 분야에서 자산 가격 모델링에 자주 사용됩니다. 왜냐하면 가격은 0보다 작을 수 없기 때문입니다.
📊 두 분포 비교 정리
항목 | 정규분포 | 로그정규분포 |
---|---|---|
대칭성 | 좌우 대칭 | 오른쪽으로 비대칭 (우측 치우침) |
값의 범위 | -∞ ~ ∞ | 0 ~ ∞ |
중심 척도 관계 | 평균 = 중앙값 = 최빈값 | 평균 > 중앙값 > 최빈값 |
활용 예시 | 키, IQ, 시험 점수 등 | 주식 가격, 소득, 생존 시간 등 |
🔍 왜 이 차이가 중요할까?
데이터 분석에서 대칭성 여부는 매우 중요합니다.
정규분포는 많은 통계 기법이 가정하는 분포입니다. 하지만 데이터가 로그정규분포를 따르고 있다면, 그대로 정규분포 기반 분석을 수행하는 건 잘못된 결론을 초래할 수 있습니다.
이럴 땐 어떻게 해야 할까요?
바로 데이터를 **로그 변환(log transformation)**해서 정규분포처럼 다룰 수 있습니다. 이를 통해 더 정확한 통계 분석과 예측 모델을 만들 수 있습니다.
📝 마무리
정규분포와 로그정규분포는 모두 매우 중요한 분포입니다. 하지만 그 대칭성의 차이는 데이터 분석 결과를 완전히 다르게 만들 수 있습니다.
데이터가 한쪽으로 치우쳐 있거나 음수 값이 없을 경우, 로그정규분포일 가능성을 염두에 두고 로그 변환을 고려해보는 것이 좋습니다.
댓글
댓글 쓰기