给python的requests提交了关于中文乱码的pull request

前面提到 python 的 requests 默认只从http返回的headers去获取页面编码,如果获取不到就用默认的 ISO-8859-1,这样一来很多中文的页面抓取回来都乱码了。

为了解决这个办法,我改了一点代码,基本上达到了这个目标,虽然代码一点都不优雅。

requests 的代码结构十分复杂,为了实现这一愿望折腾了很久,包括改代码的位置、方法等都折腾了很久才达到效果。

最后推上去发现python3下一直无法通过自动测试,这里又折腾了很久,主要还是 byte 和 str 的一些问题。

问题都解决了,自动测试也写了,代码也推了,最后自动测试也终于通过了,现在只等着看他们愿意不愿意合并了。

不管怎样,这是我第一次在github提交pull request,不管结果怎样,都是折腾得很高兴的。

给python的requests提交了关于中文乱码的pull request 图1

给python的requests提交了关于中文乱码的pull request 图2

给python的requests提交了关于中文乱码的pull request 图3

2014年08月07日