[수학] 표본 평균을 믿으려면, 얼마나 많은 표본이 필요할까?
📊 표본 평균을 믿으려면, 얼마나 많은 표본이 필요할까?
통계에서는 흔히 **"표본 평균은 모집단 평균의 좋은 추정치다"**라고 합니다. 하지만 이 말은 충분한 표본 크기 이라는 전제가 있어야 성립합니다.
그렇다면, 도대체 '충분한 표본 크기'는 어떻게 구할까요?
✅ 표본 크기 공식
표본 평균이 얼마나 정확하게 모집단 평균을 추정할 수 있을지는 다음 공식으로 계산할 수 있습니다.
기호 | 의미 |
---|---|
필요한 표본 크기 | |
신뢰수준에 해당하는 Z-값 (예: 95% → 1.96) | |
모집단의 표준편차 | |
허용 가능한 오차 한계 (예: ±5) |
🧮 예시 계산
모집단의 표준편차가 10이고, 오차를 ±2로 제한하고 싶고, 신뢰수준을 95%로 잡는다면?
⇒ 즉, 약 97개의 표본이 필요하다는 뜻입니다.
❓ 모집단의 표준편차를 모를 땐?
많은 경우 실제 모집단의 표준편차 를 모릅니다.
이럴 때는 다음 방법을 씁니다:
-
파일럿 조사로 표준편차를 추정
-
데이터 범위(Range)를 4로 나눠서 사용:
-
보수적으로 (데이터 범위가 [0,1]일 때)
✅ 경험적 기준: 30법칙
**중앙극한정리(Central Limit Theorem)**에 따르면,
표본 크기가 30 이상이면 표본 평균은 대체로 정규분포를 따른다고 알려져 있습니다.
즉, 모집단 분포가 어떤 모양이든 간에:
-
→ 통계적으로 꽤 괜찮은 정규 근사
-
하지만 정확한 추정이 필요하다면 더 큰 표본이 필요
🔧 실용 팁: 계산기 사용
복잡한 계산이 부담스럽다면,
다음 키워드로 검색해보세요 👉 sample size calculator
입력 항목:
-
신뢰수준 (Confidence Level) → 보통 90%, 95%, 99%
-
허용 오차 (Margin of Error) → 예: ±1%, ±5%
-
모집단 표준편차(모를 경우 추정값 사용)
-
모집단 크기 (알고 있다면 더 정확해짐)
🧾 정리 요약
요소 | 영향 |
---|---|
오차 허용치 ↓ | 표본 크기 ↑ |
신뢰수준 ↑ | 표본 크기 ↑ |
표준편차 ↑ | 표본 크기 ↑ |
중앙극한정리 기준 | 보통 이상 필요 |
정확도 높이고 싶을수록 | 표본 더 많이 필요 |
📌 결론
표본 평균을 믿고 싶다면, 단순히 "적당히" 뽑아서는 안 됩니다.
통계학은 분명한 기준을 제공합니다.
원하는 신뢰수준과 허용 가능한 오차 범위를 정했다면,
그에 맞는 표본 크기를 계산해서 데이터 분석의 신뢰도를 확보하세요.
댓글
댓글 쓰기