[수학] 정규분포와 로그정규분포의 대칭성: 왜 중요한가?

 

📊 정규분포와 로그정규분포의 대칭성: 왜 중요한가?

데이터 분석이나 금융 모델링을 하다 보면 자주 마주치는 개념 중 하나가 바로 **정규분포(Normal Distribution)**와 **로그정규분포(Lognormal Distribution)**입니다. 이 두 분포는 겉보기에는 비슷해 보일 수도 있지만, **대칭성(symmetry)**이라는 측면에서 아주 중요한 차이를 가지고 있습니다. 오늘은 이 두 분포의 대칭성과 그 의미에 대해 쉽게 풀어보겠습니다.


✅ 정규분포(Normal Distribution): 완벽한 대칭

정규분포는 종 모양(bell-shaped curve)의 그래프로 가장 잘 알려져 있습니다. 평균을 기준으로 좌우가 완벽하게 대칭이며, 대부분의 자연현상(키, 시험 점수 등)이 정규분포를 따른다고 알려져 있죠.

  • 중심: 평균 = 중앙값 = 최빈값

  • 대칭성: 평균을 중심으로 좌우 대칭

  • 값의 범위: 음수, 양수 모두 가능 (-∞ ~ ∞)

  • 활용 예시: 시험 점수, IQ, 키, 기온 등

정규분포는 통계학과 머신러닝에서 매우 중요한 분포로, 다양한 이론이 이 분포를 기반으로 만들어졌습니다.


📈 로그정규분포(Lognormal Distribution): 오른쪽으로 치우친 분포

로그정규분포는 이름 그대로, 로그를 취하면 정규분포가 되는 분포입니다. 즉, 어떤 변수가 로그를 취한 후 정규분포를 따른다면, 원래 그 변수는 로그정규분포를 따른다고 볼 수 있습니다.

  • 중심: 평균 > 중앙값 > 최빈값

  • 대칭성: 비대칭 – 오른쪽으로 꼬리가 길다 (skewed right)

  • 값의 범위: 0보다 큰 값만 존재 (0 ~ ∞)

  • 활용 예시: 주식 가격, 소득 분포, 생존 시간, 옵션 가격 등

로그정규분포는 특히 금융 분야에서 자산 가격 모델링에 자주 사용됩니다. 왜냐하면 가격은 0보다 작을 수 없기 때문입니다.


📊 두 분포 비교 정리

항목정규분포로그정규분포
대칭성좌우 대칭오른쪽으로 비대칭 (우측 치우침)
값의 범위-∞ ~ ∞0 ~ ∞
중심 척도 관계평균 = 중앙값 = 최빈값평균 > 중앙값 > 최빈값
활용 예시키, IQ, 시험 점수 등주식 가격, 소득, 생존 시간 등

🔍 왜 이 차이가 중요할까?

데이터 분석에서 대칭성 여부는 매우 중요합니다.
정규분포는 많은 통계 기법이 가정하는 분포입니다. 하지만 데이터가 로그정규분포를 따르고 있다면, 그대로 정규분포 기반 분석을 수행하는 건 잘못된 결론을 초래할 수 있습니다.

이럴 땐 어떻게 해야 할까요?
바로 데이터를 **로그 변환(log transformation)**해서 정규분포처럼 다룰 수 있습니다. 이를 통해 더 정확한 통계 분석과 예측 모델을 만들 수 있습니다.


📝 마무리

정규분포와 로그정규분포는 모두 매우 중요한 분포입니다. 하지만 그 대칭성의 차이는 데이터 분석 결과를 완전히 다르게 만들 수 있습니다.
데이터가 한쪽으로 치우쳐 있거나 음수 값이 없을 경우, 로그정규분포일 가능성을 염두에 두고 로그 변환을 고려해보는 것이 좋습니다.

댓글

이 블로그의 인기 게시물

공압 속도 제어: 미터인 vs 미터아웃

[PLC] PLC 아날로그 입출력 기본

[주식] 한국거래소(KRX) 데이터 API 입문 가이드

[PLC] 절연 변압기 (Isolation Transformer)

[수학] 정규 분포란? 왜 종 모양을 띠고 있을까?

제너 다이오드에 저항을 연결하는 이유

[농사] 식물의 광합성과 호흡

[자동화] 안쓰는 안드로이드폰을 활용한 식물 성장 타임랩스 촬영

[PLC] 래더 다이어그램과 PLC

[아두이노] 가변저항(Potential Divider)과 전압분배(Voltage Divider)