pandas 데이터 입출력

Updated:

pandas를 이용하여 파일을 입출력해봅시다.

import pandas as pd 가 관례이므로 pd로 사용하겠습니다.

CSV 파일 읽기

pd.read_csv('filename.csv', names=['column 1', 'column 2'], index_col='coulmn 1', skiprows=[0, 1], na_values=['사과'])

  • 'filename.csv' : 읽을 파일 이름
  • names=[column 1', 'column 2'] : 파일의 column index에 대한 정보가 없었을 때 직접 추가할 수 있음
  • index_col='coulmn 1' : 특정한 column을 row index로 지정하고 싶을 때 사용
  • skiprows=[0,1] : 특정 행 뛰어 넘을 때 사용.(해당 예는 0,1번째 행을 skip함)
  • na_values=['사과'] : 특정 value를 NaN값으로 변경(해당 예는 ‘사과’를 NaN값으로 변경 )

txt 파일 읽기

pd.read_table('filename.txt', sep='\s+')

  • 데이터를 구분하는 separator가 쉽표가 아니면 sep 인수를 사용하여 separator를 지정
  • sep='\s+' : 길이가 정해지지 않은 공백으로 구분할 때

CSV 파일 출력하기

df = pd.dataFrame(data) 로 읽어들였던 데이터프레임 값을 다시 csv파일로 출력해봅시다.

df.to_csv('output.csv', sep='|', na_rep='사과', index=False, header=False)

  • sep='|' : 읽을 때와 마찬가지로 separator를 정하여 저장할 수 있음
  • na_rep='사과' : NaN 값을 ‘사과’로 바꾸어 저장
  • index, header : index와 header의 출력 여부를 결정

internet 상의 csv 파일 읽기

df = pd.read_csv("주소")

Leave a comment