[수학] 표본 평균을 믿으려면, 얼마나 많은 표본이 필요할까?

 

📊 표본 평균을 믿으려면, 얼마나 많은 표본이 필요할까?

통계에서는 흔히 **"표본 평균은 모집단 평균의 좋은 추정치다"**라고 합니다. 하지만 이 말은 충분한 표본 크기 NN 이라는 전제가 있어야 성립합니다.
그렇다면, 도대체 '충분한 표본 크기'는 어떻게 구할까요?


✅ 표본 크기 공식

표본 평균이 얼마나 정확하게 모집단 평균을 추정할 수 있을지는 다음 공식으로 계산할 수 있습니다.

N=(ZσE)2N = \left( \frac{Z \cdot \sigma}{E} \right)^2
기호의미
NN
필요한 표본 크기
ZZ
신뢰수준에 해당하는 Z-값 (예: 95% → 1.96)
σ\sigma
모집단의 표준편차
EE
허용 가능한 오차 한계 (예: ±5)

🧮 예시 계산

모집단의 표준편차가 10이고, 오차를 ±2로 제한하고 싶고, 신뢰수준을 95%로 잡는다면?

N=(1.96102)2=(9.8)2=96.04N = \left( \frac{1.96 \cdot 10}{2} \right)^2 = (9.8)^2 = 96.04

⇒ 즉, 약 97개의 표본이 필요하다는 뜻입니다.


❓ 모집단의 표준편차를 모를 땐?

많은 경우 실제 모집단의 표준편차 σ\sigma를 모릅니다.
이럴 때는 다음 방법을 씁니다:

  • 파일럿 조사로 표준편차를 추정

  • 데이터 범위(Range)를 4로 나눠서 사용:
    σrange4\sigma \approx \frac{\text{range}}{4}

  • 보수적으로 σ=0.5\sigma = 0.5 (데이터 범위가 [0,1]일 때)


✅ 경험적 기준: 30법칙

**중앙극한정리(Central Limit Theorem)**에 따르면,
표본 크기가 30 이상이면 표본 평균은 대체로 정규분포를 따른다고 알려져 있습니다.

즉, 모집단 분포가 어떤 모양이든 간에:

  • N30N \geq 30 → 통계적으로 꽤 괜찮은 정규 근사

  • 하지만 정확한 추정이 필요하다면 더 큰 표본이 필요


🔧 실용 팁: 계산기 사용

복잡한 계산이 부담스럽다면,
다음 키워드로 검색해보세요 👉 sample size calculator

입력 항목:

  • 신뢰수준 (Confidence Level) → 보통 90%, 95%, 99%

  • 허용 오차 (Margin of Error) → 예: ±1%, ±5%

  • 모집단 표준편차(모를 경우 추정값 사용)

  • 모집단 크기 (알고 있다면 더 정확해짐)


🧾 정리 요약

요소영향
오차 허용치 EE ↓표본 크기 NN ↑
신뢰수준 ZZ ↑표본 크기 NN ↑
표준편차 σ\sigma ↑표본 크기 NN ↑
중앙극한정리 기준보통 N30N \geq 30 이상 필요
정확도 높이고 싶을수록표본 더 많이 필요

📌 결론

표본 평균을 믿고 싶다면, 단순히 "적당히" 뽑아서는 안 됩니다.
통계학은 분명한 기준을 제공합니다.
원하는 신뢰수준과 허용 가능한 오차 범위를 정했다면,
그에 맞는 표본 크기를 계산해서 데이터 분석의 신뢰도를 확보하세요.

댓글

이 블로그의 인기 게시물

[PLC] PLC 아날로그 입출력 기본

공압 속도 제어: 미터인 vs 미터아웃

전력(kW) 계산하기 (직류, 교류 단상, 교류 삼상)

[주식] 한국거래소(KRX) 데이터 API 입문 가이드

3선 결선식 센서의 타입 PNP, NPN

[아두이노] 가변저항(Potential Divider)과 전압분배(Voltage Divider)

제너 다이오드에 저항을 연결하는 이유

[스마트팜] EC/pH 미터 만들기: 아두이노로 전기 전도도 및 pH 측정

[투자] TIGER 미국30년국채커버드콜액티브(H) 매수 타이밍은?

[PLC] 래더 다이어그램과 PLC