上一篇文章:
Python爬虫从基础到入门:script标签中的数据
- 1. 分析需要抓取的数据的在哪?
- 2. 获取数据、解析数据
- 3. 下载视频、音频文件
- 4. 参考代码
1. 分析需要抓取的数据的在哪?
本篇博文以B站视频为例,B站视频在用户没有登录的状态下,只能观看视频尺寸为360流畅,在登录状态下,可以观看视频尺寸为1080p 高清,因此,如果想要利用爬虫下载1080p 高清的视频需要在请求接口的请求头上家上cookie信息。
通过发现,想要的视频下载链接这个数据在某个script标签下,如下:
2. 获取数据、解析数据
这个数据是在script标签下,也就是说是在一个页面下,直接使用requests模块g