[python] 파이썬 pandas DataFrame 객체 생성 (컬럼명이 있는 테이블)

파이썬에서 pandas 모듈을 이용하면, 컬럼명 정보가 존재하는 2차원 테이블 형태의 데이터인 DataFrame을 생성할 수 있습니다. 아래는 컬럼명-값 데이터 형태인 딕셔너리로부터 데이터 프레임 객체를 생성하는 예입니다.


import numpy as np
import pandas as pd

my_dict = {'col1':[1,2], 'col2':np.array([3,4]), 'col3':[5,6]}
df = pd.DataFrame(my_dict)
print(df)


실행결과는 아래와 같습니다.


   col1  col2  col3
0     1     3     5
1     2     4     6


아래는 위와 결과는 동일하나, 기존에 생성된 numpy array에서 데이터 프레임을 생성하는 예입니다.


import numpy as np
import pandas as pd

my_array = np.array([[1, 3, 5], [2, 4, 6]])
alt_df = pd.DataFrame(my_array, columns=['col1', 'col2', 'col3'])
print(alt_df)


CSV 파일에서 데이터 프레임을 생성할 수도 있습니다. 아래는 CSV 파일 내용입니다.


id,name,rating
1,Akhil,4
2,Babu,3
3,Nikhil,5


코드는 아래와 같습니다.


import numpy as np
import pandas as pd

csv_df = pd.read_csv('./test.csv')
print(csv_df)


실행결과는 다음과 같습니다.


   id    name  rating
0   1   Akhil       4
1   2    Babu       3
2   3  Nikhil       5


끝.

댓글

이 블로그의 인기 게시물

공압 속도 제어: 미터인 vs 미터아웃

[주식] 한국거래소(KRX) 데이터 API 입문 가이드

[주식] 나스닥, S&P 500, 다우존스 차이점

[PLC] PLC 아날로그 입출력 기본

[투자] 기하 브라운 운동(Geometric Brownian Motion)이란?

[PLC] 래더 다이어그램과 PLC

[수학] 정규분포의 확률밀도 함수가 이차 함수의 지수 형태를 가지는 이유

전력(kW) 계산하기 (직류, 교류 단상, 교류 삼상)

[주식] 왜 주식 가격은 로그정규분포를 따를까?

3선 결선식 센서의 타입 PNP, NPN