판다스에서 csv 파일을 읽어올때 Error tokenizing data. C error 와 같은 에러가 발생했다.
이에 대한 원인은 csv파일에서 데이터 일부분의 데이터가 잘못들어갔을 때 발생한다.
해결방법
error_bad_lines=False
한 줄을 추가해주면 에러가 발생하지 않고 넘어간다.
pd.read_csv('data/Chicago_Crimes_2005_to_2007.csv', error_bad_lines=False)
이는 이상한 행들은 그냥 넘어가고 잘된 행들만 가져오도록 해준다.
한 줄을 추가해주면 에러가 발생하지 않고 넘어간다.
이러한 warning이 떠도 그냥 넘어가도 된다.
/usr/local/lib/python3.7/dist-packages/IPython/core/interactiveshell.py:2882: FutureWarning: The error_bad_lines argument has been deprecated and will be removed in a future version.
exec(code_obj, self.user_global_ns, self.user_ns)
b'Skipping line 533719: expected 23 fields, saw 24\n'
b'Skipping line 1149094: expected 23 fields, saw 41\n'
'머신러닝' 카테고리의 다른 글
데이터 프레임의 날짜 문자열 컬럼을, datetime64로 변경하는 법 (0) | 2022.05.11 |
---|---|
Prophet 라이브러리 사용법 (0) | 2022.05.11 |
Hierarchical Clustering의 Dendrogram (0) | 2022.05.09 |
K-Means의 WCSS와 Elbow Method (0) | 2022.05.09 |
머신러닝 - Linear Regression ( 선형 회귀 ) (2) | 2022.05.06 |