首先,多数情况下免费版本的功能,已经可以满足绝大多数采集需求,想了解八爪鱼采集器版本区别的详情,请访问这篇帖子: 3.无代码爬虫八爪鱼采集器工具介绍——个人版本、团队版本的适用性_八爪鱼采集器 有单机版本吗-CSDN博客
免费版八爪鱼采集器下载https://affiliate.bazhuayu.com/retrieve
昨天我们的教程分享是:何运行采集规则任务
16.零代码八爪鱼采集器数据采集与数据导出——如何运行采集规则任务-CSDN博客
今天我们来说过说,如何导出不同格式数据和数据推送到数据库
通常情况下,我们在采集任务结束后,或者直接终止采集任务,就可导出数据,点击蓝色的“导出数据”按钮。
八爪鱼采集器可以导出多种文件格式:excel(xlsx)、CSV文件、html文件、json文件、xml文件
前面2个格式刷表格文件,区别是csv是去掉了表格样式,数据更纯粹,一般表格文件大,就适合用这个格式存储,这个格式里面是无法保存图片的。excel是大家通常用的文件格式,也方便编辑和转发。
HTML格式和XML格式,有些类似,都可以用记事本工具打开,里面就是文本内容,html是浏览器渲染的文件,直接双击会直接打开浏览器查看,会联网加载图片等素材。XML是一个记事本一样的文件,点开后可以查看、修改等
json格式一般的网站的数据传输都用这个,有固定的格式,一组一组的数据结构。很多数据库或者网站也是支持这个格式导入的。数据分析的时候也可以直接使用这个格式。
没有PDF和word格式,但是有变通方案实现格式转换,这个帖子是基础普及贴,如果有需求,可以私聊我或着留言提问。
还有导出到数据库的方案:sqlserver mysql oracle(甲骨文数据库),国内中小企业用的比较多的是前两种,甲骨文的数据库,基本都是一线大公司了。
使用数据库,需要开启团队版及以上,把数据库链接地址和的口令信息,还有字段映射关系填写正确,否则没有办法使用或无法正确传入数据到库里面。
另外还有API点方式调取数据,
这些都是高阶玩法,不在这个小白初级入门课程中进行讲解,大家先大体的了解一下这个软件的功能。
好了,整套八爪鱼采集器的入门基础教程就全部以图文的方式介绍完了,如果有大家想深入体验这款无代码网页爬虫软件,可以进行体验:八爪鱼采集器免费版下载https://affiliate.bazhuayu.com/retrieve
教程目录在这一篇帖子,可以更加方便的了解整套课程说了什么。
无代码网页爬虫软件——八爪鱼采集器入门基础教程,日常更新中-CSDN博客