pandas读csv出现uncodeDecodeError UTF-8问题
1、先看错误提示信息,曾经出过汉字显示问题,于是首先怀疑是否还是汉字显示问题,是否是设置问题。经检查pycharm设置正确,没问题。
2、import numpy as npimport pandas as pd#显示所有列pd.set_option('display.max_columns', None)#显示所有行pd.set_option('display.max_rows', None)#设置value的显示长度为100,默认为50pd.set_option('max_colwidth',100)filename = "c:\\gdp.csv"filename = "c:\\WirelessDiagLog.csv"df=pd.read_csv(filename,header=None,sep='/t')经检查 发现pd.read_csv 少加了encoding='utf-8' 或者encoding='gb18030' 参数。
3、运行,结果发现还是有问题,这就比较奇怪了,参数加了问题依旧!更换另一个"c:\\gdp.csv"的CSV文件 还是同样问题!
4、检查文件保存类型 发现问题! 适合参数UTF-8不匹配造成的。按照以下步骤修改之.1) 记事本打开csv文件
5、2) 打开 文件 菜单 --下拉列表点击 另存文件 ;在新打开的另存为菜单进行下一步操作。
6、在另存为界面,会看到以下内容:注意修改:1)文件类型;2)编码
7、注意修改:1)文件类型 为 *.*2)编码修改ASNI 为 UTF-83)保存。
8、然后运行程序import numpy as npimport pandas a衡痕贤伎s pd#显示所有列pd.set_option('颊俄岿髭display.max_columns', None)#显示所有行pd.set_option('display.max_rows', None)#设置value的显示长度为100,默认为50pd.set_option('max_colwidth',100)filename = "c:\\gdp.csv"filename = "c:\\WirelessDiagLog.csv"df=pd.read_csv(filename,sep='\t',encoding='utf-8')print(df)#print(df.head(3))终于OK,这个问题开始没有想到是编码问题,耽误了很多时间。