[수학] 분산 공식이 두 개?

 

📊 분산 공식이 두 개? 전개해보면 같은 식!

통계학을 공부하다 보면, **분산(Variance)**이라는 개념에서 두 가지 수식을 마주치게 됩니다. 한쪽은 직관적인 정의식이고, 다른 하나는 약간 수학적으로 전개된 형태입니다. 그런데 이 두 식이 정말 같은 걸까요?

이번 글에서는 그 궁금증을 해결해보겠습니다.


🎯 분산이란?

분산은 데이터가 평균에서 얼마나 퍼져 있는지를 나타내는 지표입니다. 수학적으로는 다음과 같이 정의되죠:

✅ 분산의 정의식

V(x)=1Ni=1N(xixˉ)2
  • xix_i: 데이터의 i번째 값

  • xˉ\bar{x}: 데이터의 평균

  • N: 전체 데이터 개수

이 식은 데이터 값과 평균 간의 거리의 제곱을 평균한 값입니다.


🧮 그런데 이런 식도 봤어요:

✅ 분산의 전개식

V(x)=(1Ni=1Nxi2)(1Ni=1Nxi)2=E[x2](E[x])2

이 식은 좀 더 수학적으로 보이지만, 계산에는 더 편리할 때가 많습니다. 이 두 식이 정말 같은 걸까요?


🧠 직접 증명해보자

Step 1. 정의식을 전개합니다:

(xixˉ)2=xi22xixˉ+xˉ2

이를 모두 더하면:

V(x)=1Ni=1N(xi22xixˉ+xˉ2)

Step 2. 합을 항별로 나눕니다:

V(x)=1N(xi22xˉxi+Nxˉ2)

여기서 xi=Nxˉ\sum x_i = N\bar{x}임을 이용하면:

V(x)=1N(xi22Nxˉ2+Nxˉ2)=1N(xi2Nxˉ2)

즉,

V(x)=(1Nxi2)xˉ2

이는 바로 전개식이죠!


✅ 결론

두 수식은 수학적으로 완전히 동일합니다.

  • 정의식: 직관적이고 개념 설명에 적합

  • 전개식: 계산 시 더 편리함 (특히 평균이 이미 있는 경우)

따라서, 상황에 따라 편한 쪽을 사용하면 됩니다. 특히 코딩이나 실전 통계 분석에서는 전개식이 자주 사용됩니다.


💡 보너스: 파이썬으로 실습해보기

import numpy as np x = np.array([2, 4, 6, 8, 10]) mean = np.mean(x) # 정의식 var1 = np.mean((x - mean)**2) # 전개식 var2 = np.mean(x**2) - mean**2 print(f"정의식: {var1:.2f}, 전개식: {var2:.2f}")

결과:

정의식: 8.00, 전개식: 8.00

같은 값이죠!

댓글

이 블로그의 인기 게시물

공압 속도 제어: 미터인 vs 미터아웃

[PLC] PLC 아날로그 입출력 기본

[주식] 한국거래소(KRX) 데이터 API 입문 가이드

[PLC] 절연 변압기 (Isolation Transformer)

[수학] 정규 분포란? 왜 종 모양을 띠고 있을까?

제너 다이오드에 저항을 연결하는 이유

[농사] 식물의 광합성과 호흡

[자동화] 안쓰는 안드로이드폰을 활용한 식물 성장 타임랩스 촬영

[PLC] 래더 다이어그램과 PLC

[아두이노] 가변저항(Potential Divider)과 전압분배(Voltage Divider)