Python解析html出错

发布网友

我来回答

1个回答

热心网友

自然是文件编码的问题,文件读取utf-8格式,建议使用codecs模块,不用安装,直接import就行,使用fp = codecs.open(filename,'r','utf-8')读取utf-8编码文件,python自带的open是默认gbk的。此外,建议文件都使用utf-8格式,gbk实在是windows的遗留问题,utf-8本来可以一统天下,就是windows一直不改,才使得windows下文件编码一直很麻烦。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com