如何用python写爬虫
1、创建项目
2、安装requests模块
3、模块安装成功
4、创建py文件
5、编写爬虫代码
6、编辑界面右键菜单中选择Run 'Spider'
7、运行结束,输出“baidu.html is got!!”,文件夹中得到一个新文件“baidu.html”
8、使用浏览器打开本地文件“baidu.html”
9、打开文件后发现页面中存在乱码
10、修改代码,修改请求到的响应的编码格式
11、再次运行代码,打开重新得到的“baidu.html”,乱码消失,爬取到的页面正常
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:41
阅读量:86
阅读量:91
阅读量:57
阅读量:40