pandas 데이터 입출력
Updated:
pandas를 이용하여 파일을 입출력해봅시다.
import pandas as pd
가 관례이므로 pd로 사용하겠습니다.
CSV 파일 읽기
pd.read_csv('filename.csv', names=['column 1', 'column 2'], index_col='coulmn 1', skiprows=[0, 1], na_values=['사과'])
'filename.csv'
: 읽을 파일 이름names=[column 1', 'column 2']
: 파일의 column index에 대한 정보가 없었을 때 직접 추가할 수 있음index_col='coulmn 1'
: 특정한 column을 row index로 지정하고 싶을 때 사용skiprows=[0,1]
: 특정 행 뛰어 넘을 때 사용.(해당 예는 0,1번째 행을 skip함)na_values=['사과']
: 특정 value를 NaN값으로 변경(해당 예는 ‘사과’를 NaN값으로 변경 )
txt 파일 읽기
pd.read_table('filename.txt', sep='\s+')
- 데이터를 구분하는 separator가 쉽표가 아니면 sep 인수를 사용하여 separator를 지정
sep='\s+'
: 길이가 정해지지 않은 공백으로 구분할 때
CSV 파일 출력하기
df = pd.dataFrame(data)
로 읽어들였던 데이터프레임 값을 다시 csv파일로 출력해봅시다.
df.to_csv('output.csv', sep='|', na_rep='사과', index=False, header=False)
sep='|'
: 읽을 때와 마찬가지로 separator를 정하여 저장할 수 있음na_rep='사과'
: NaN 값을 ‘사과’로 바꾸어 저장- index, header : index와 header의 출력 여부를 결정
internet 상의 csv 파일 읽기
df = pd.read_csv("주소")
Leave a comment