[python] 평균값, 중앙값 (절삭, 가중)

파이썬에서 각종 라이브러리를 통해 절삭 또는 가중 처리된 평균값, 중앙값 등을 구하는 샘플 코드를 정리합니다.




import numpy as np
import pandas as pd
import wquantiles
from scipy.stats import *

# CSV 파일에서 데이터 변환 (컬럼명 포함)
state = pd.read_csv('./stats/state.csv')
print(state)

# 평균값
mean = state['Population'].mean()
print('Mean : ' + str(mean))

# 15% 절삭 평균
trimmed_mean = trim_mean(state['Population'], 0.15)
print('15% Trimmed Mean : ' + str(trimmed_mean))

# 중앙값
median = state['Population'].median()
print('Median : ' + str(median))

# 가중 평균
weighted_mean = np.average(state['Murder Rate'], weights=state['Population'])
print('Weighted Mean of Murder Rate : ' + str(weighted_mean))

# 가중 중앙
weighted_median = wquantiles.median(state['Murder Rate'], weights=state['Population'])
print('Weighted Median of Murder Rate : ' + str(weighted_median))


아래는 출력결과입니다.


         State  Population  Murder Rate Abbreviation
0      Alabama     4779736          5.7           AL
1       Alaska      710231          5.6           AK
2      Arizona     6392017          4.7           AZ
3     Arkansas     2915918          5.6           AR
4   California    37253956          4.4           CA
5     Colorado     5029196          2.8           CO
6  Connecticut     3574097          2.4           CT
7     Delaware      897934          5.8           DE
Mean : 7694135.625
15% Trimmed Mean : 3931483.0
Median : 4176916.5
Weighted Mean of Murder Rate : 4.376359279149048
Weighted Median of Murder Rate : 4.448750497554494



끝.

댓글

이 블로그의 인기 게시물

전력(kW) 계산하기 (직류, 교류 단상, 교류 삼상)

[PLC] PLC 아날로그 입출력 기본

제너 다이오드에 저항을 연결하는 이유

공압 속도 제어: 미터인 vs 미터아웃

[python] 파이썬 pyplot 2차원 그래프 샘플 코드

[암호화폐 자동매매] pip install ta-lib 설치오류 해결

3상 모터 전력에서 전류 계산하기 (How to Convert Three-Phase Power to Amps)

[아두이노] 가변저항(Potential Divider)과 전압분배(Voltage Divider)

[PLC] 릴레이 잔류전압와 블리더 저항

[PLC] PLC 입출력 타입 - 싱크 & 소스 (Sink & Source)