很久之前我写过一篇通过url爬取图片地址的博文,说实在的,利用python实现自动化爬取资源确实很香。我本身是搞前端的。所以对py只是简单看了下,并不算多了解。因此之前写的那篇博文内容也很简单。简单到新手一看就会,一学就能用。方便各位拿来即用吧,所以特意记录下。
python通过url爬取动漫图片_iw233.cn/api/random.php-CSDN博客
python作为大数据分析的御用语言,解析是它最强大的功能,所有得爬取资源,流程都是解析->下载。
爬取视频不同于上一篇的爬取图片,因为之前的图片接口是直接返回图片,而这次的爬取视频,接口返回的是文本,因此要额外做一下二次解析,提取出视频本身的地址,然后再进行下载到本地。所以,这里也给各位提个醒。
废话不多说,先上代码:video.py
import requests
import re
import osprint("可堪回首,佛狸祠下,一片神鸦社鼓")
print("实战场景: 下载一个视频文件到本地 \n")
# 发送请求获取包含视频链接的文本
url = "https://tucdn.wpon.cn/api-girl/index.php"# 下载视频文件
for num in range(2):response = requests.get(url)text = response.text# 使用正则表达式提取视频链接video_url = re.search(r'<video src="(.*?)"', text).group(1)response = requests.get("https:" + video_url, stream=True)if response.status_code == 200:if not os.path.exists('videos'):os.makedirs('videos')video_filename = os.path.basename(video_url)with open(os.path.join('videos', video_filename), 'wb') as
通过控制台命令python video.py启动即可,会将视频下载到当前目录videos。
这里所用的视频接口,每次访问返回的是一串html文本,如果你使用是直接返回视频文件流的接口。记得特殊处理下。
纯技术分享,仅供学习交流