爬虫(一)——爬取快手无水印视频

前言

最近对爬虫比较感兴趣,于是浅浅学习了一些关于爬虫的知识。爬虫可以实现很多功能,非常有意思,在这里也分享给大家。由于爬虫能实现的功能太多,而且具体的实现方式也有所不同,所以这里开辟了一个新的系列——爬虫系列,来介绍爬虫的各种用法。

什么是爬虫

爬虫,简单来说,就是通过一些代码,自动获取网络上的信息的一种手段。而爬虫一般通过python来实现。

在这个信息化的时代,数据纷繁芜杂,如何从网上获取对我们有用的数据,如何获取不带水印的数据,如何绕开VIP的限制免费获得数据,爬虫会给我们答案。

python基础

以防有人不太会python,这里简单介绍一下python基础,懂的可以直接跳过。

创建项目

1.双击打开pycharm,点击新建项目
2.项目设置
- 勾选[继承全局站点软件包]
- 勾选[可用于所有项目]
- 取消勾选[创建main.py欢迎脚本]
- 点击创建
3.项目名称右键–新建–python文件
4.输入文件名–回车

python规范

1.数字和字符串
数字正常写 字符串加引号

2.注释
注释就是对代码的解释和说明。
# 解释的文字

3.标点符号
标点符号都用英文的标点符号!
, . [] < > = ! : 英文的
,。【】《》=!: 中文的不能用!

4.变量
在程序中用来保存数据的可以变化的量!
变量 = 数据
代码示例:

name = '天涯海角'
age = 22
gender = '女装大佬'
money = 100000000000
print(name, age, gender, money)

5.加载模块
在代码下面找到“终端”,点击终端,输入

pip install 模块名

即可加载该模块。

爬取快手无水印视频

这里实现的功能是通过四行代码可以爬取任意一个快手视频,而且无水印哦。

难点:怎么找到网址!以谷歌浏览器为例。

a.点击一条视频--浏览器右上角设置菜单--更多工具--开发者工具。
b.选择网络(network)--选择媒体(media)--刷新页面(不刷新页面可能没有数据)。
c.鼠标点击一条数据进去--复制网址(注意不是网页的网址,而是右下角的视频的网址)

在这里插入图片描述
下面给出四行代码以及详细的代码解释。

# 引号里面放视频的网址
url="https://v2.kwaicdn.com/ksc2/1Z86LBOQcVyaER9aXs4JJfkDlrp6hUK-QPl-gd_f9Woi7p8HKRCmak--7iEqoRXqMIe9PRGrj2bleAfnzUzqqNPGIMLyovVVm8jE65mG9vt1MK13b4mAYWKoSQ9h6Pe0.mp4?pkey=AAWpBlzIENFNqxzwQIaBLoiVu5D5y25UQKpnZLZ8K5Up8ggzeIJ_BoijxP5cU72Nyen-lbR_aqVhBg6hQDSFfKJwyhbI9j4WSnMVeLxt4C5mJ3ZvvF3NoIimnAYNHhAtOl8&tag=1-1721196852-unknown-0-nhcjzzfyru-2d0290527442a5c0&clientCacheKey=3xiu5qcnkkx3ema_aab2f98f&di=IAECUFgAEAIAAAAAAAPgxA==&bp=10004&tt=hd15&ss=vp"# 注意运行代码前要先导入requests模块
import requests# 使用requests的get功能 获取网站的响应
res = requests.get(url)# 打开一个空的视频(快手无水印视频.mp4) 把得到res.content丢进去 得到一个可以播放的视频
open('快手无水印视频.mp4', 'wb').write(res.content)

最后,这个新产生的视频会存在于python代码的同一文件夹下。可以在python代码界面,点击鼠标右键–打开于–Explorer,就可以看到视频了。
在这里插入图片描述

总结

本文运用四行代码,实现了爬虫的最最基础的功能——爬取一条数据(一个视频)。后面将介绍爬虫的一些其它更有用的功能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/47211.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

记录贴-芋道源码-环境搭建

文字讲解 链接: 芋道源码-环境搭建&#xff08;一&#xff09;后端 链接: 芋道源码-环境搭建&#xff08;二&#xff09;前端 链接: 基于FastGPT和芋道源码挑战一句话生成代码 视频讲解 链接: 芋道源码零基础启动教程&#xff08;上&#xff09; 链接: 芋道源码零基础启动教程…

bs4取值技巧的详细介绍

1. 基本取值方法&#xff1a; find()&#xff1a; 查找第一个匹配的标签。soup.find(h1) # 查找第一个<h1>标签find_all()&#xff1a; 查找所有匹配的标签。soup.find_all(a) # 查找所有<a>标签select()&#xff1a; 使用CSS选择器查找标签。soup.select(.item…

进阶篇:如何使用 Stable Diffusion 优化神经网络训练

进阶篇&#xff1a;如何使用 Stable Diffusion 优化神经网络训练 一、引言 随着深度学习的发展&#xff0c;神经网络模型在各个领域取得了显著的成果。然而&#xff0c;在训练复杂神经网络时&#xff0c;模型的稳定性和优化问题始终是一个挑战。Stable Diffusion&#xff08;…

用AI生成Springboot单元测试代码太香了

你好&#xff0c;我是柳岸花开。 在当今软件开发过程中&#xff0c;单元测试已经成为保证代码质量的重要环节。然而&#xff0c;编写单元测试代码却常常让开发者头疼。幸运的是&#xff0c;随着AI技术的发展&#xff0c;我们可以利用AI工具来自动生成单元测试代码&#xff0c;极…

基于单片机的停车场车位管理系统设计

1.简介 停车场车位管理系统是日常中随处可见的一种智能化车位管理技术&#xff0c;使用该技术可以提高车位管理效率&#xff0c;从而减轻人员车位管理工作负荷。本系统集成车牌识别、自动放行、自助缴费等技术&#xff0c;并且具备车位占用状态实时监测与车位数量实时统计、查询…

SQL进阶--条件分支

一、问题引入 在SQL中&#xff0c;虽然不像某些编程语言&#xff08;如C、Java或Python&#xff09;那样直接支持if-else这样的条件分支语句&#xff0c;但它提供了几种方式来实现条件逻辑&#xff0c;这些方式主要通过CASE语句、IF()函数&#xff08;在某些数据库如MySQL中&a…

C# - WINFORM - 控件树遍历与特定控件操作方案概述

1.全局控件遍历 实现了一个通用函数EnumerateAllControls, 它可以遍历指定窗体或容器内的所有控件&#xff0c;打印出每个控件的名称和类型。 private void EnumerateAllControls(Control parent) {foreach (Control control in parent.Controls){Console.WriteLine($"C…

golang mux组件兼容转移url

Go 的mux 遇到%2F、%0A 无法处理的问题&#xff0c;后来有推出UseEncodedPath() 的参数&#xff0c;就不会直接吐404&#xff0c;让程式没办法做后续的处理。 如果请求是 http://localhost:8000/mvfood/aa%2Fbb/exist 此时go服务使用的mux 组件检测到请求路径中有%2F字符串会直…

vue3【详解】单文件组件 SFC(含SFC的优点、缺点、使用场景、原理、使用预处理器、<script setup>语法详解、资源拆分)

SFC 概述 将一个组件的逻辑 (JavaScript)&#xff0c;模板 (HTML) 和样式 (CSS) 封装在同一个.vue 文件里&#xff0c;即单文件组件&#xff08; Single-File Components&#xff0c;缩写为 SFC&#xff09;。 <script setup> import { ref } from vue const count ref…

Java SpringAOP简介

简介 官方介绍&#xff1a; SpringAOP的全称是&#xff08;Aspect Oriented Programming&#xff09;中文翻译过来是面向切面编程&#xff0c;AOP是OOP的延续&#xff0c;是软件开发中的一个热点&#xff0c;也是Spring框架中的一个重要内容&#xff0c;是函数式编程的一种衍生…

SpringBatch文件读写ItemWriter,ItemReader使用详解

SpringBatch文件读写ItemWriter&#xff0c;ItemReader使用详解 1. ItemReaders 和 ItemWriters1.1. ItemReader1.2. ItemWriter1.3. ItemProcessor 2.FlatFileItemReader 和 FlatFileItemWriter2.1.平面文件2.1.1. FieldSet 2.2. FlatFileItemReader2.3. FlatFileItemWriter 3…

opencv—常用函数学习_“干货“_4

目录 十二、图像平滑滤波 均值滤波 (blur) 方框滤波 (boxFilter) 中值滤波 (medianBlur) 高斯滤波 (GaussianBlur) 双边滤波 (bilateralFilter) 自定义滤波器 (filter2D) 边缘保留滤波 (edgePreservingFilter) 快速非局部均值去噪 (fastNlMeansDenoising) 彩色图像的快…

Canvas API

Canvas API中文文档: canvas API中文网 - Canvas API中文文档首页地图 Web 开发技术: Canvas API - Web API | MDN (mozilla.org) HTML5 Canvas: The HTML5 Canvas Handbook (bucephalus.org)

前端内容之常用置标

最近由于换了项目组&#xff0c;目前负责需求全部是前端任务&#xff0c;为了方便后续查看&#xff0c;在此记录下&#xff01; 拓尔思常用置标 获取指定栏目的指定字段(数据库字段)的栏目信息 获取一级栏目的栏目名称 autolink为true,代表产生链接;false为不产生链接。 &l…

AI 绘画|Midjourney设计Logo提示词

你是否已经看过许多别人分享的 MJ 咒语&#xff0c;却仍无法按照自己的想法画图&#xff1f;通过学习 MJ 的提示词逻辑后&#xff0c;你将能够更好地理解并创作自己的“咒语”。本文将详细拆解使用 MJ 设计 Logo 的逻辑&#xff0c;让你在阅读后即可轻松上手&#xff0c;制作出…

R语言学习笔记8-并行计算

R语言学习笔记8-并行计算 简要说明使用parallel包使用foreach和doParallel包使用future包 简要说明 在R语言中&#xff0c;通过并行计算可以显著提升处理大数据集或执行耗时任务的效率。R提供了多种并行计算的方法&#xff0c;包括使用基础的parallel包和更高级的foreach和fut…

打包一个自己的Vivado IP核

写在前面 模块复用是逻辑设计人员必须掌握的一个基本功&#xff0c;通过将成熟模块打包成IP核&#xff0c;可实现重复利用&#xff0c;避免重复造轮子&#xff0c;大幅提高我们的开发效率。 接下来将之前设计的串口接收模块和串口发送模块打包成IP核&#xff0c;再分别调用…

知识加油站

我的&#x1f351;宝店【码猿小铺】持续进行&#xff0c;其中有Linux/shell视频&#xff08;包含项目实操&#xff09;、新版ShardingJDBC分库分表视频&#xff08;包含项目实操&#xff09;、初中高级面试专栏、React全套视频&#xff08;包含项目实操&#xff09;、新版javes…

【深度学习】FaceChain-SuDe,免训练,AI换脸

https://arxiv.org/abs/2403.06775 FaceChain-SuDe: Building Derived Class to Inherit Category Attributes for One-shot Subject-Driven Generation 摘要 最近&#xff0c;基于主体驱动的生成技术由于其个性化文本到图像生成的能力&#xff0c;受到了广泛关注。典型的研…

从MySQL迁移到PostgreSQL的完整指南

1.引言 在现代数据库管理中&#xff0c;选择合适的数据库系统对业务的成功至关重要。随着企业数据量的增长和对性能要求的提高&#xff0c;许多公司开始考虑从MySQL迁移到PostgreSQL。这一迁移的主要原因包括以下几个方面&#xff1a; 1.1 性能和扩展性 PostgreSQL以其高性能…