鍍金池/ 問答/Python  HTML/ pandas讀取txt文件的問題

pandas讀取txt文件的問題

一份既有空格又有tab作為分隔符的txt文件,

df = pd.read_table('file.txt',sep=' ',encoding='utf-8')

如上讀取的時候中途發(fā)現(xiàn)錯誤,
ParserError: Error tokenizing data. C error: Expected 1 fields in line 2709, saw 2

查詢源文件發(fā)現(xiàn)該行存在同一字段有逗號分開的情況:
圖片描述

請問如何可以正確讀取該文件?
另外sep=' '這樣在后面碰到tab做分隔的時候不知道會不會報錯。

回答
編輯回答
笨笨噠

試試這樣:

df = pd.read_table('file.txt', sep='[ |\t]', encoding='utf-8', engine='python')

sep='[ |t]'表示用空格或tab做分隔符。

2017年10月23日 07:06