[수학] 왜 표본이 많을수록 정확할까?

 

🎯 왜 표본이 많을수록 정확할까? — 표본분포와 표준오차 이야기

통계학에서는 자주 들리는 말이 있습니다.

“표본의 크기가 클수록 더 정확하다.”

하지만 왜 그런 걸까요? 단순히 ‘많을수록 좋다’는 막연한 느낌이 아니라, 이것은 엄밀한 수학적 원리로 뒷받침됩니다. 오늘은 표본분포(sampling distribution)와 표준오차(standard error)를 중심으로, 이 원리를 직관적으로 이해해보겠습니다.


🔍 표본분포란 무엇인가?

모집단 전체를 조사하는 것이 불가능할 때, 우리는 일부만 뽑아(표본) 그 평균이나 비율 등을 계산합니다. 이걸 한 번이 아니라, 같은 크기의 표본을 여러 번 뽑아서 평균을 구한다면 어떤 일이 벌어질까요?

그 평균값들은 매번 조금씩 달라집니다. 이 표본평균들이 이루는 분포가 바로 표본분포입니다.


📉 표본이 크면 평균값은 덜 흔들린다

예를 들어 생각해보죠.

  • 어떤 변수의 모집단에서 표준편차가 100이라고 가정합시다.

  • 표본 크기가 10이면, 표본 평균은 이리저리 널뛰듯 변할 수 있습니다.

  • 그런데 표본 크기를 100으로 늘리면, 각 표본 평균들은 훨씬 모집단 평균 근처에 모이게 됩니다.

즉, 표본의 크기가 커질수록, 표본 평균들이 덜 흔들리게 되고, 추정의 신뢰도가 높아집니다.


📐 공식으로 보는 표준오차

통계학에서는 표본평균의 변동성을 다음과 같이 계산합니다:

표준오차 (Standard Error)=σn\text{표준오차 (Standard Error)} = \frac{\sigma}{\sqrt{n}}
  • σ\sigma: 모집단의 표준편차

  • nn: 표본 크기

이 식을 보면, **표본의 크기 nn**가 커질수록 분모가 커지고, 전체 값이 작아지죠. 즉, 표준오차가 작아진다 = 표본 평균의 불확실성이 줄어든다는 뜻입니다.


🧠 간단한 수치 예시

  • 모집단 표준편차가 100일 때,

    • 표본 크기 10 → 표준오차 = 100 ÷ √10 ≈ 31.6

    • 표본 크기 100 → 표준오차 = 100 ÷ √100 = 10

표본을 10배로 늘리면, 표준오차는 약 3.16배 감소합니다. 즉, 폭이 1/3로 줄어든다는 느낌으로 이해하시면 좋습니다.


📎 중요한 교훈

  • 표본 크기 1일 때의 분포는 모집단 분포 그 자체로 볼 수 있습니다.

  • 표본 크기 100일 때의 분포는 그보다 10배 좁은 형태가 됩니다.

  • 다시 말해, 표본이 커질수록 평균 추정의 정밀도가 높아집니다.


📚 대수의 법칙과 연결

이 개념은 **대수의 법칙(Law of Large Numbers)**의 직관과도 연결됩니다:

표본의 크기가 커질수록, 표본 평균은 모집단 평균에 가까워진다.

따라서 우리는 분석을 할 때 가능한 한 많은 표본을 확보하는 것이 유리합니다. 물론, 현실적인 제약은 있지만요.


✅ 정리하며

  • 표본의 크기가 크면, 표본평균의 분포는 더 좁아지고, 이는 곧 추정의 정확도가 높아진다는 뜻입니다.

  • 이때 줄어드는 정도는 표본 크기의 제곱근에 반비례합니다.

  • 통계분석의 신뢰도를 높이고 싶다면, 표본 수부터 챙기세요.

댓글

이 블로그의 인기 게시물

[PLC] PLC 아날로그 입출력 기본

공압 속도 제어: 미터인 vs 미터아웃

전력(kW) 계산하기 (직류, 교류 단상, 교류 삼상)

[주식] 한국거래소(KRX) 데이터 API 입문 가이드

3선 결선식 센서의 타입 PNP, NPN

[아두이노] 가변저항(Potential Divider)과 전압분배(Voltage Divider)

제너 다이오드에 저항을 연결하는 이유

[스마트팜] EC/pH 미터 만들기: 아두이노로 전기 전도도 및 pH 측정

[투자] TIGER 미국30년국채커버드콜액티브(H) 매수 타이밍은?

[PLC] 래더 다이어그램과 PLC