[python] 평균값, 중앙값 (절삭, 가중)
파이썬에서 각종 라이브러리를 통해 절삭 또는 가중 처리된 평균값, 중앙값 등을 구하는 샘플 코드를 정리합니다.
import numpy as np
import pandas as pd
import wquantiles
from scipy.stats import *
# CSV 파일에서 데이터 변환 (컬럼명 포함)
state = pd.read_csv('./stats/state.csv')
print(state)
# 평균값
mean = state['Population'].mean()
print('Mean : ' + str(mean))
# 15% 절삭 평균
trimmed_mean = trim_mean(state['Population'], 0.15)
print('15% Trimmed Mean : ' + str(trimmed_mean))
# 중앙값
median = state['Population'].median()
print('Median : ' + str(median))
# 가중 평균
weighted_mean = np.average(state['Murder Rate'], weights=state['Population'])
print('Weighted Mean of Murder Rate : ' + str(weighted_mean))
# 가중 중앙
weighted_median = wquantiles.median(state['Murder Rate'], weights=state['Population'])
print('Weighted Median of Murder Rate : ' + str(weighted_median))
아래는 출력결과입니다.
State Population Murder Rate Abbreviation
0 Alabama 4779736 5.7 AL
1 Alaska 710231 5.6 AK
2 Arizona 6392017 4.7 AZ
3 Arkansas 2915918 5.6 AR
4 California 37253956 4.4 CA
5 Colorado 5029196 2.8 CO
6 Connecticut 3574097 2.4 CT
7 Delaware 897934 5.8 DE
Mean : 7694135.625
15% Trimmed Mean : 3931483.0
Median : 4176916.5
Weighted Mean of Murder Rate : 4.376359279149048
Weighted Median of Murder Rate : 4.448750497554494
끝.
댓글
댓글 쓰기