본문 바로가기

머신러닝

[ 오류 해결 ] pd.read_csv 에러, Error tokenizing data. C error ~

판다스에서 csv 파일을 읽어올때 Error tokenizing data. C error 와 같은 에러가 발생했다.

이에 대한 원인은 csv파일에서 데이터 일부분의 데이터가 잘못들어갔을 때 발생한다.

해결방법

error_bad_lines=False

한 줄을 추가해주면 에러가 발생하지 않고 넘어간다.

 

pd.read_csv('data/Chicago_Crimes_2005_to_2007.csv', error_bad_lines=False)

 

이는 이상한 행들은 그냥 넘어가고 잘된 행들만 가져오도록 해준다.

한 줄을 추가해주면 에러가 발생하지 않고 넘어간다.

 

 

이러한 warning이 떠도 그냥 넘어가도 된다.

 

/usr/local/lib/python3.7/dist-packages/IPython/core/interactiveshell.py:2882: FutureWarning: The error_bad_lines argument has been deprecated and will be removed in a future version.


  exec(code_obj, self.user_global_ns, self.user_ns)
b'Skipping line 533719: expected 23 fields, saw 24\n'
b'Skipping line 1149094: expected 23 fields, saw 41\n'