1,浏览器与网络爬虫的区别
答:
对于浏览器而言:浏览器打开一个网站,会对网站服务器发送一个request请求,服务器收到该请求之后,会给浏览器一个respond响应,该响应携带很多数据,之后浏览器收到这些数据进行渲染,最终形成可视化的页面效果。
对于网络爬虫而言:和浏览器几乎一样,唯一不同的地方在于,网络爬虫只会获取这些数据,并不会进行像浏览器那样进行渲染,不会形成一种可视化的效果而已。当让,获取这些数据已经够用了,然后通过一些正则表达式对这些数据进行有用的提取即可。
通俗而言:浏览器–展示数据;网络爬虫–采集数据
2,网络爬虫的定义
答:网络爬虫就是模拟客户端发送网络请求,获取响应数据,一种按照一定的规则,·自动地
抓取Internet(因特网)信息的程序或脚本。
3,网络爬虫的作用
答:从Internet因特网上获取需要的信息数据。