首先,多数情况下免费版本的功能,已经可以满足绝大多数采集需求,想了解八爪鱼采集器版本区别的详情,请访问这篇帖子: https://blog.csdn.net/cctv1123/article/details/139581468
八爪鱼采集器免费版和个人版、团队版下载链接:1.软件分享[耶]八爪鱼,爬取了几百条网站上的公开数据,不用学代码真的很方便。[得意]2.发现了一个很棒的软件,?不用学python也可以爬数据!用它爬了n多数据。3.微博、电商、各大新闻平台的数据,很多可以用模版一键爬取数据,非常方便!4.做科研项目要采集很多数据,[耶]科研人的救命神器,推荐!5.实时获取楼市动态,用八爪鱼收集网上关于楼盘的用户评价,不用学代码直接爬了很多数据6.用八爪鱼实时爬取电商数据,追踪竞争对手价格,商品信息一手掌握[得意]7.用八爪鱼自动收集全网最新新闻,迅速获取热点资讯,超方便?https://affiliate.bazhuayu.com/retrieve
通过前面的学习,我们已经进入到设计采集规则的实操课程。下面以一个实际案例来解答今天的课程要点:
在有些网站进入后会直接弹出一个浮层,不同意就无法进行下一步操作,例如奥迪授权经销商页面的访问,就需要同意cookie的使用。
那么如何解决这个问题呢?
其实很简单,只要在采集器里面网址打开后,
增加一个点击操作,这个点击动作的xpath定位就是“同意”
有些网站点击之后才会重新加载数据,那我们下一个执行动作就需要做一些延时等待的执行
然后再往下的采集规则设计就正常进行就好了。
另外还有一些复杂一些的弹出情况,需要具体情况具体分析,如果你遇到了,欢迎你在评论区提问。
这贴是教程专栏的目录链接:
八爪鱼采集器入门基础教程,日常更新中-CSDN博客