[python] 파이썬 pandas DataFrame 객체 생성 (컬럼명이 있는 테이블)

파이썬에서 pandas 모듈을 이용하면, 컬럼명 정보가 존재하는 2차원 테이블 형태의 데이터인 DataFrame을 생성할 수 있습니다. 아래는 컬럼명-값 데이터 형태인 딕셔너리로부터 데이터 프레임 객체를 생성하는 예입니다.


import numpy as np
import pandas as pd

my_dict = {'col1':[1,2], 'col2':np.array([3,4]), 'col3':[5,6]}
df = pd.DataFrame(my_dict)
print(df)


실행결과는 아래와 같습니다.


   col1  col2  col3
0     1     3     5
1     2     4     6


아래는 위와 결과는 동일하나, 기존에 생성된 numpy array에서 데이터 프레임을 생성하는 예입니다.


import numpy as np
import pandas as pd

my_array = np.array([[1, 3, 5], [2, 4, 6]])
alt_df = pd.DataFrame(my_array, columns=['col1', 'col2', 'col3'])
print(alt_df)


CSV 파일에서 데이터 프레임을 생성할 수도 있습니다. 아래는 CSV 파일 내용입니다.


id,name,rating
1,Akhil,4
2,Babu,3
3,Nikhil,5


코드는 아래와 같습니다.


import numpy as np
import pandas as pd

csv_df = pd.read_csv('./test.csv')
print(csv_df)


실행결과는 다음과 같습니다.


   id    name  rating
0   1   Akhil       4
1   2    Babu       3
2   3  Nikhil       5


끝.

댓글

이 블로그의 인기 게시물

[PLC] PLC 아날로그 입출력 기본

전력(kW) 계산하기 (직류, 교류 단상, 교류 삼상)

공압 속도 제어: 미터인 vs 미터아웃

[PLC] 채터링 현상과 입력 필터

제너 다이오드에 저항을 연결하는 이유

[python] 파이썬 pyplot 2차원 그래프 샘플 코드

[PLC] 래더 다이어그램과 PLC

공압회로 기호

[PLC] PLC 입출력 타입 - 싱크 & 소스 (Sink & Source)

3선 결선식 센서의 타입 PNP, NPN