【前端甜点】某视频网站的m4s视频/音频下载方案(20240420)

引言

Sample:aHR0cHM6Ly93d3cuYmlsaWJpbGkuY29tL3ZpZGVvL0JWMWZKNDExUTdWeA==

我在很久以前写过一个小脚本,发XHR请求来获取某视频网站的m4s视频和音频:

// 唯一要改变的就是url(url must be https),a.download是文件名,只有Chrome和Firefox可用
function downloader(url, fname, rangeStart = 0) {let xhr = new XMLHttpRequest();xhr.open('GET', url, true);xhr.responseType = 'blob';// 啥请求头都没法设置:xhr.setRequestHeader("client_type", "DESKTOP_WEB");xhr.setRequestHeader('Range', `bytes=${rangeStart}-`);xhr.onload = function () {if (this.status === 200 || this.status === 206) {let blob = new Blob([this.response]);const blobUrl = window.URL.createObjectURL(blob);let a = document.createElement('a');a.download = fname;a.target = '_blank';a.href = blobUrl;console.log(a.href, this.response);document.body.append(a);a.click();}};xhr.send();
}// 下载音频(复制到console里,注意分2次执行)
downloader('<m4s audio>', '1.mp3');
downloader('<m4s video>', '1.mp4');

从20年到上个月为止,it just works well。但20240420开始,不知道是Chrome浏览器升级还是什么原因,二进制数据包装的Blob对象转化为a标签后域名变成了https://www.example.comhttps://www.example.com/...,无法方便地下载m4s了,于是这个脚本不能用了。这个原因我一直都没找到。

作者:hans774882968以及hans774882968以及hans774882968

本文52pojie:https://www.52pojie.cn/thread-1915933-1-1.html

本文juejin:https://juejin.cn/post/7359821247676334115

本文CSDN:https://blog.csdn.net/hans774882968/article/details/138015611

正文

好在我很快又摸索出了一个稍微麻烦点的路子:先在浏览器控制台运行JS代码,获取base64字符串,然后在本地用python把它转为mp3。

在上述古老的脚本里,我将XHR返回的类型指定为Blob了,因此我需要将其转为base64字符串。最后我找到的API是FileReaderscrapt_m4s_new.js

// https://www.cnblogs.com/Sherries/p/14840404.html
function blobToDataURI(blob) {return new Promise((res, rej) => {const reader = new FileReader();reader.readAsDataURL(blob);reader.onload = (e) => {res(e.target.result);};reader.onerror = () => {rej(new Error('文件流异常'));};});
}// 唯一要改变的就是url(url must be https),a.download是文件名,只有Chrome和Firefox可用
function sendXhrReq(url, rangeStart = 0) {return new Promise((res, rej) => {const xhr = new XMLHttpRequest();xhr.open('GET', url, true);xhr.responseType = 'blob';// 啥请求头都没法设置:xhr.setRequestHeader("client_type", "DESKTOP_WEB");xhr.setRequestHeader('Range', `bytes=${rangeStart}-`);xhr.onload = function () {if (this.status === 200 || this.status === 206) {res(this.response);return;}rej(`xhr error: ${this.status} ${this.response}`)};xhr.send();})
}async function downloader(url, rangeStart = 0) {const blob = await sendXhrReq(url, rangeStart);console.log(blob); // type is Blobconst dataURI = await blobToDataURI(blob);// data:application/octet-stream;base64,const rawBase64Str = String(dataURI);const base64Str = rawBase64Str.substring(rawBase64Str.indexOf('base64,') + 7);console.log(rawBase64Str.substring(0, 100));console.log(base64Str); // 之后在浏览器控制台复制字符串,粘贴到 base64_str_m4s.txt
}downloader('<m4s file url>');

base64_str_to_m4s.py

import base64def main():with open('base64_str_m4s.txt', 'r', encoding='utf-8') as f_in:inp = f_in.read()data = base64.b64decode(inp)with open('1.mp3', 'wb') as f_out:f_out.write(data)if __name__ == '__main__':main()

福利:赠送mp3截取代码mp3_clip.py,使用的是moviepy

from moviepy.editor import AudioFileClip
import osdef clip_audio(fname, st, ed=None):audio = AudioFileClip(fname).subclip(st, ed)out_file_name = f'{os.path.splitext(fname)[0]}-out.mp3'audio.write_audiofile(out_file_name)def main():clip_audio('1.mp3', 3.5)if __name__ == '__main__':main()

参考资料

  1. blobToDataURI:https://www.cnblogs.com/Sherries/p/14840404.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/1223.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【多线程学习】深入探究阻塞队列与生产者消费者模型和线程池常见面试题

˃͈꒵˂͈꒱ write in front ꒰˃͈꒵˂͈꒱ ʕ̯•͡˔•̯᷅ʔ大家好&#xff0c;我是xiaoxie.希望你看完之后,有不足之处请多多谅解&#xff0c;让我们一起共同进步૮₍❀ᴗ͈ . ᴗ͈ აxiaoxieʕ̯•͡˔•̯᷅ʔ—CSDN博客 本文由xiaoxieʕ̯•͡˔•̯᷅ʔ 原创 CSDN 如…

基于CppHttpLib的Httpserver

1 背景 大多数嵌入式设备由于没有屏幕输出&#xff0c;只能通过Web页面来配置。这里利用CPPHttpLib来实现HttpServer。 2 HttpServer HttpServer是利用CPPHttpLib开源库实现的Http服务器CppHttpLib是基于C11的HTTP开源库&#xff0c;开源协议是MIT. CppHttpLib下载地址 2.1 …

(2022级)成都工业学院数据库原理及应用实验六: SQL DML(增、删、改)

写在前面 1、基于2022级软件工程/计算机科学与技术实验指导书 2、成品仅提供参考 3、如果成品不满足你的要求&#xff0c;请寻求其他的途径 运行环境 window11家庭版 Navicat Premium 16 Mysql 8.0.36 实验要求 在实验三的基础上完成下列查询&#xff1a; 1、在科室表…

神经网络进阶学习文章(一)

1.讲解YOLO有关知识 深入浅出Yolo系列之Yolov5核心基础知识完整讲解 - 知乎 (zhihu.com) 2.目标检测算法综述 目标检测算法综述 - 知乎 (zhihu.com) 3.TensorFlow详解&#xff0c;当然现在用的最多的是Pytorch框架了 谷歌大神带你十分钟看懂TensorFlow - 知乎 (zhihu.co…

黑色主题个人主页HTML源码

源码介绍 黑色主题个人主页HTML源码&#xff0c;源码由HTMLCSSJS组成&#xff0c;记事本打开源码文件可以进行内容文字之类的修改&#xff0c;双击html文件可以本地运行效果&#xff0c;也可以上传到服务器里面 效果预览 源码下载 黑色主题个人主页HTML源码

js的reduce

在JavaScript中&#xff0c;reduce() 是数组&#xff08;Array&#xff09;对象的一个方法&#xff0c;用于将数组中的所有元素归并成一个单一的输出值&#xff08;通常是数字&#xff0c;但也可以是字符串或其他类型&#xff09;。这个方法通过接收一个函数作为累加器&#xf…

LeetCode题练习与总结:编辑距离--72

一、题目描述 给你两个单词 word1 和 word2&#xff0c; 请返回将 word1 转换成 word2 所使用的最少操作数 。 你可以对一个单词进行如下三种操作&#xff1a; 插入一个字符删除一个字符替换一个字符 示例 1&#xff1a; 输入&#xff1a;word1 "horse", word2…

window cmd/PowerShell 实时查看监控日志命令Get-Content,类似与linux shell的tail命令

命令 最近10行&#xff0c;使用UTF8字符编码 Get-Content app.log -Wait -Tail 10 -Encoding UTF8查找“关键字”&#xff0c;忽略大小写&#xff0c;显示关键字的上下1行 Get-Content app.log -Wait -Tail 10 -Encoding UTF8 | Select-String "keyword" -CaseSen…

clickhouse学习笔记04

ClickHouse高可用之ReplicatedMergeTree引擎介绍 ClickHouse高可用架构准备-环境说明和ZK搭建 RPM安装ClickHouse 上传我们的clickhouse rpm文件。 安装&#xff1a; 中途需要输入用户名和密码 可以不设置 直接回车。 启动&#xff1a; 查看状态&#xff1a; 查看端口是否占用…

【状态压缩 并集查找 图论】2157. 字符串分组

本文涉及知识点 状态压缩 并集查找 图论 LeetCode2157. 字符串分组 给你一个下标从 0 开始的字符串数组 words 。每个字符串都只包含 小写英文字母 。words 中任意一个子串中&#xff0c;每个字母都至多只出现一次。 如果通过以下操作之一&#xff0c;我们可以从 s1 的字母集…

Rust常用特型之AsRef和AsMut特型

在Rust标准库中&#xff0c;存在很多常用的工具类特型&#xff0c;它们能帮助我们写出更具有Rust风格的代码。 今天我们要学习的AsRef和AsMut&#xff0c;和前面学习的Deref和DerefMut有那么一点混淆的地方。 当一个类型U实现了AsRef<T>&#xff0c;那么我们可以高效的从…

K8S哲学 - Pod、RC、RS、deployment

pod&#xff08;最小的可部署单元&#xff09; 容器组&#xff08;运行一个或多个容器&#xff09; Pod(容器组&#xff09;是Kubernetes 中最小的可部署单元。 一个Pod(容器组&#xff09;包含了一个应用程序容器&#xff08;某些情况下是多个容器&#xff09;、存储资源、 一…

C++练级之路——类和对象(中二)

1、运算符重载 C为了增强代码的可读性引入了运算符重载&#xff0c;运算符重载是具有特殊函数名的函数&#xff0c;也是具有其返回值类型&#xff0c;函数名字以及参数列表&#xff0c;其返回值类型和参数列表与普通的函数类似。 函数名字为&#xff1a;关键字operator后面接需…

【C++初识继承】

博主首页&#xff1a; 有趣的中国人 专栏首页&#xff1a; C进阶 本篇文章主要讲解 继承 的相关内容 目录 1. 继承的概念和定义 1.1 继承的概念 1.2 继承的定义 1.2.1 继承定义格式 1.2.2 继承方式与访问修饰限定符 2. 基类和派生类对象赋值转换 3. 继承中的作用域 …

npm常用命令详解(二)

npm&#xff08;Node Package Manager&#xff09;是Node.js的包管理器&#xff0c;它允许你安装、共享和管理Node.js代码库。以下是一些常用的npm命令及其详解&#xff0c;以帮助您更好地理解和使用它。 1. npm doc 功能&#xff1a;查看指定包的文档。 语法&#xff1a;np…

linux离线安装mysql

一、下载mysql 地址&#xff1a;MySQL 这里选择64为还是32为要根据操作系统来 uname -m 二、上传解压配置mysql 使用root账户登录linux服务器&#xff0c;在opt文件下创建mysql文件夹 cd /opt sudo mkdir mysql 使用Xftp上传mysql压缩包到此文件夹下(自行决定路径) cd mysql/…

基于Kubernetes集群构建MongoDB

基于Kubernetes集群构建MongoDB 作者:行癫(盗版必究) 一:基础环境 1.Kubernetes集群正常运行 2.Harbor私有仓库正常运行 二:MongoDB项目部署 ​ MongoDB项目对应Kubernetes的yaml文件: --- apiVersion: v1 kind: Namespace metadata:name: m

力扣:104. 二叉树的最大深度(Java,DFS,BFS)

目录 题目描述&#xff1a;输入&#xff1a;输出&#xff1a;代码实现&#xff1a;1.深度优先搜索&#xff08;递归&#xff09;2.广度优先搜索&#xff08;队列&#xff09; 题目描述&#xff1a; 给定一个二叉树 root &#xff0c;返回其最大深度。 二叉树的 最大深度 是指从…

【QT进阶】Qt http编程之后端API测试工具postman使用介绍

往期回顾 【QT进阶】Qt Web混合编程之使用ECharts显示各类折线图等-CSDN博客 【QT进阶】Qt Web混合编程之实现ECharts数据交互动态修改-CSDN博客 【QT进阶】Qt http编程之http与https简单介绍-CSDN博客 【QT进阶】Qt http编程之后端API测试工具postman使用介绍 其实这个工具的…

nextjs getStaticProps 和 getServerSideProps 区别

getStaticProps 和 getServerSideProps 是 Next.js 中用于数据获取的两个重要函数&#xff0c;它们在页面渲染时分别起到不同的作用。 1、getStaticProps&#xff1a; 用途&#xff1a;主要用于静态生成页面&#xff0c;即在构建时获取数据并将其预先注入到页面中。执行环境&…