[python] 표준편차, IQR, 중간 절대 편차

5월 30, 2023

파이썬을 활용하여 표준편차(Standard Deviation), IQR(interquartile range, 사분범위), 중간 절대 편차(Median Absolute Deviation)를 구하는 방법을 정리합니다. 계산은 알고리즘 구현을 하지 않고 기존 라이브러리를 활용하여 진행합니다. 샘플 데이터는 아래와 같습니다.

아래는 샘플코드입니다.


import pandas as pd
import statsmodels.api as sm

# CSV 파일에서 데이터 변환 (컬럼명 포함)
state = pd.read_csv('./statistics/state.csv')
print(state)

# 표준편차
std = state['Population'].std()
print('Standard Deviation : ' + str(std))

# IQR : Interquartile Range, 4분위 범위 (25~75%)
IQR = state['Population'].quantile(0.75) - state['Population'].quantile(0.25)
print('IQR : ' + str(IQR))

# 중간 절대 편차(Median Absolute Deviation)
MAD = sm.robust.scale.mad(state['Population'])
print('Median Absolute Deviation : ' + str(MAD))

아래는 실행결과입니다.


         State  Population  Murder Rate Abbreviation
0      Alabama     4779736          5.7           AL
1       Alaska      710231          5.6           AK
2      Arizona     6392017          4.7           AZ
3     Arkansas     2915918          5.6           AR
4   California    37253956          4.4           CA
5     Colorado     5029196          2.8           CO
6  Connecticut     3574097          2.4           CT
7     Delaware      897934          5.8           DE
Standard Deviation : 12105745.29585633
IQR : 2958479.25
Median Absolute Deviation : 2576836.044572552

앞서 다루었던 평균값, 중앙값 등은 데이터가 어디에 위치(location)해 있는지 알려주는 지표로 사용되는 반면, 오늘 다룬 편차, IQR 등은 해당 위치를 기준으로 데이터가 얼마나 분산되어 있는지 알려주는 지표라고 합니다.

끝.

이 블로그 검색

Programming for Real-World

[python] 표준편차, IQR, 중간 절대 편차

댓글

댓글 쓰기

이 블로그의 인기 게시물

공압 속도 제어: 미터인 vs 미터아웃

전력(kW) 계산하기 (직류, 교류 단상, 교류 삼상)

[PLC] AWG => SQ 단위 변환

[투자] ETF 투자 가이드 : 카테고리별 ETF 선택 전략

[아두이노] 가변저항(Potential Divider)과 전압분배(Voltage Divider)

[전기실무] 부하 특성 데이터와 KEC 차단기 선정 가이드

[산업자동화] 머신비전 - 프레임 그래버란?

[PLC] 릴레이와 전자 접촉기 (MC)

[수학] 유클리드 기하학, 비-유클리드 기하학, 형식주의란?

Industrial Control with Relay: 파워릴레이와 범용릴레이