如何采集孔夫子旧书网书籍数据及图片
1、步骤一:采集结果预览
2、步骤二:新建采集任务1、复制网址
3、新建智能模式采集任务您可以在软件上直接新建采集任务,也可以通过导入规则来创建任务。
4、步骤三:配置采集规则1、设置提取数据字段新建任务输入网址后,软件会自动识别分殳陌抻泥页及字段,我们可以右击字段进行相关设置,包括修改字段名称、增减字段、处理数据等。
5、字段设置效果如下:
6、使用深入采集功能提取详情页数据由于我们需要采集更多的信息,因此我们需要右击书籍链接使用“深入采集”功能,跳转到详情页进行采集。
7、在详情页上,我们可以看到很多的宝贝图片,我们可以选中这个图片,然后在修改字段属性为“提取外部html”,具体操作如下动图所示:
8、详情页的字段设置效果如下:
9、步骤四:设置并启动采集任务
10、步骤五:导出并查看数据
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:95
阅读量:35
阅读量:85
阅读量:31
阅读量:70