多数情况下免费版本的功能,已经可以满足绝大多数采集需求,想了解八爪鱼采集器,我写了一套系列教程,请访问这篇帖子:【完结】无代码网页爬虫软件——八爪鱼采集器入门基础教程-CSDN博客
免费版八爪鱼采集器下载https://affiliate.bazhuayu.com/retrieve
我们在设计采集规则的时候,可能会需要判断,比如采集评论的时候“展开N条回复”,就点击这个按钮,像这种情况就可以设计一个判断模块进入
判断模块添加后会自动生成两个,默认都是不判断直接执行,如果我们需要设定判断,就需要把做判断的这个条件放在前面,否则就会直接执行,而不进行判断力。
在判断条件里面有多种方式:当前页面包含文本、当前循环包含文本、当前页面包含元素、当前循环项包含元素
怎么理解这四种情况呢?我们一个一个说
当前页面包含文本
只要页面中有你设定的文本文字,就是判断-有,则执行这个判断模块里面的其他动作,比如:“发布文章”这4个字在整个页面有,就会判断为有
当前循环包含文本
循环包含文本,就是你设定的判断文本文字,是基于这个循环的,比如我们采集所有的评论,里面含有“定制”二字,就判断为有,一条条评论是基于这个循环的,所以只判断这个循环列表里面的文字即可。
当前页面包含元素
这里说的元素指的就是判断是否有这个指定的xpath,例如://div[@class="title"]/a
当前循环项包含元素
这个循环项和前面的循环文本是一个意思,只是这里是xpath,前面是文本
无代码爬虫软件下载:1.软件分享[耶]八爪鱼,爬取了几百条网站上的公开数据,不用学代码真的很方便。[得意]2.发现了一个很棒的软件,?不用学python也可以爬数据!用它爬了n多数据。3.微博、电商、各大新闻平台的数据,很多可以用模版一键爬取数据,非常方便!4.做科研项目要采集很多数据,[耶]科研人的救命神器,推荐!5.实时获取楼市动态,用八爪鱼收集网上关于楼盘的用户评价,不用学代码直接爬了很多数据6.用八爪鱼实时爬取电商数据,追踪竞争对手价格,商品信息一手掌握[得意]7.用八爪鱼自动收集全网最新新闻,迅速获取热点资讯,超方便?