python网易云_用python爬虫爬取网易云音乐

标签:

使用python爬虫爬取网易云音乐

需要使用的模块

只需要requests模块和os模块即可

开始工作

先去网易云音乐网页版找一下你想要听的歌曲点击进去。按键盘F12打开网页调试工具,点击Network就可以查看网络请求的相关信息,选择XHR,然后可以看到一个.mp3结尾的请求:

?i=20181127173711235.png

直觉告诉我,这个.mp3就是这首歌曲,点击请求,可以看到在General栏下面有Request URL,这个url就是这个歌曲的原始套接字所在的地方了,可以打开这个URL看看。

?i=20181127174046128.png

可以看到,这个网页很明显就是一个播放器的样子,再按F12看看这个界面的Network(什么东西都没有的话按F5刷新一下),这个界面点击All才可以看到一个.mp3结尾的文件,对比一下它的General中的Request URL和这个网站的URL,其实是一样的:

?i=20181127174432143.png

那么,这就算是正是找到了这个歌曲的url,现在要做的就是将这个url原始套接字从服务器上下载下来,代码,起:

import requests

import os

headers={

"Accept": "*/*",

"Accept-Encoding": "identity;q=1, *;q=0",

"Accept-Language": "zh-CN,zh;q=0.9",

"Connection": "keep-alive",

"Host": "m10.music.126.net",

"Range": "bytes=0-",

"Referer": "https://m10.music.126.net/20181127170556/ff68375e7e70bb7dcda8fcc6a572951b/ymusic/c7bc/455e/612c/0d891c5408be6d0af16c7fa64945de75.mp3",

"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36"

}

def download_musics(dir_,arcurl,filename):

os.mkdir(os.path.join(dir_,filename))

print("正在下载%s" %filename)

size=0

session=requests.Session()

response=session.get(arcurl,headers=headers,stream=True)

chunk_size=1025*400

content_size=int(response.headers['content-length'])

filepath=os.path.join(dir_,filename,filename+'.mp3')

print(content_size)

if response.status_code==206:

with open(filepath,'wb') as file:

for data in response.iter_content(chunk_size=chunk_size):

file.write(data)

size+=len(data)

file.flush()

print('下载进度:%.2f%%\n'%(float(size/content_size*100)))

if size/content_size==1:

print("complete download")

else:

print("连接异常")

if __name__=="__main__":

dir_="E:\python小爬虫\download_music"

#这个网址会不停的变化,旧网址会失效

arcurl="https://m10.music.126.net/20181127181327/8a4190b05a43e70fb543ad1b824a21a4/ymusic/c7bc/455e/612c/0d891c5408be6d0af16c7fa64945de75.mp3"

filename="popstar"

download_musics(dir_,arcurl,filename)

这里需要注意几点:

1、headers的值必须从后面打开的那个网页上的Network找,要么会导致请求的信息不完整。

?i=20181127174930878.png

2、每首歌曲的url是不同的,而且,随着时间的变化,同一首歌曲的url也会发生改变。所以在下载之前一定要再去看一次当前的url是什么。

运行结果

?i=20181127175430352.png

标签:

来源: https://blog.csdn.net/qq_41427568/article/details/84570302

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/289319.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

android 固定底部 布局_Android系统列表控件

在android系统控件中,有多个控件可以展示列表数据。一、ListView该组件是android中最常用的一个UI组件,用于实现在屏幕上显示多个内容,以便于我们用手指进行滑动。ListView控件以列表的形式展示具体内容,并且能够根据数据的长度自…

.NetCore中IdentityServer使用nginx-proxy的一次排错经历

前言最近在看 Duende.IdentityServer.Admin,本地使用IIS Express跑了一下源码,也看了一遍的代码,决定使用他们的模板创建一个Demo,部署在本地的Docker环境中,也算是踩一下坑吧。以下不会详细介绍项目的部署&#xff0c…

nmap脚本使用总结

原文链接:http://drops.wooyun.org/tips/2188 0x00 前言: nmap的基本介绍和基本使用方法,在乌云知识库中已经有人提交过,讲的比较详细,在此文中就不再讲述。 具体链接:http://drops.wooyun.org/tips/2002 本…

身份管理软件公司Okta计划IPO,目标融资1亿美元

Okta是一家专门提供身份管理和单点登陆(SSO)软件的公司。今日公司提交了一份S-1表格正式启动了IPO程序。根据文件内容显示,Okta计划在首次公开募股中融资1亿美元。 公司表示,Okta将在纳斯达克上市,股票代码为OKTA。 即…

jmeter对乱码如何处理_JMeter读取 Excel 表中用例数据实现接口压测

传统的接口测试,都是在接口中手动输入不同用例准备的多种场景参数数据,一遍一遍的输入来执行多个不同的用例,但是现在利用excel表格准备各种类型的数据,使用Jmeter中Jmeter CSV Data Set Config参数化实现可设置的、一次性的读取e…

C# 利用.NET 升级助手将.NET Framework项目升级为.NET 6

概述.NET6 正式版本已经发布有一阵子了,今天我就体验一下如何将.NET Framework的项目升级为.NET 6.升级条件:Windows 操作系统.NET 6 SDKVisual Studio 2022 17.0 或更高版本环境准备①首先是VS2022下载,直接上微软官方网站,下载地…

城市遥感动态监测管理系统

1.系统概述 随着全国各城市数字化进程的发展,高分辨率遥感影像和数字航空影像为“数字城市”的建设提供了丰富的数据源。近年来,遥感影像的空间分辨率和光谱分辨率的明显提高,使得高分辨率遥感影像和数字航空影像的应用得到了极大的延伸。在城…

3月第4周全球域名商TOP15:万网第四 涨幅居亚

IDC评述网(idcps.com)04月03日报道:据WebHosting.info公布的最新数据显示,在3月第4周,全球域名商域名总量十五强排行榜中,美国占10个席位,成为最大赢家。其次是中国,有3家域名商上榜…

【Blog.Core开源】框架集成部门权限

(Blog.Core框架功能点概述)Blog.Core开源四年啦,一行行代码凝结了大家的热情和心血,基本功能骨架已完成,欢迎更多的公司和企业使用哟。真实公司留言盖楼可获得一对一技术指导:https://github.com/anjoy8/Bl…

[一个经典的多线程同步问题]解决方案一:关键段CS

前面提出了一个经典的多线程同步互斥问题,本篇将用关键段CRITICAL_SECTION来尝试解决这个问题。 本文先介绍如何使用关键段,然后再深层次的分析下关键段的实现机制和原理。 关键段CRITICAL_SECTION一共就四个函数,下面说一下这四个函数的原型…

服务器线程数一直增加,.NET Core中遇到奇怪的线程死锁问题:内存与线程数不停地增长...

一个 asp.net core 站点,之前运行在Linux 服务器上,运行一段时间后有时站点会挂掉,在日志中记录很多“EMFILE too many open files”的错误:Microsoft.AspNetCore.Server.Kestrel.Internal.Networking.UvException: Error -24 EMF…

python种颜色循环_Python 实现一个颜色色值转换的小工具

需求说明 公司的 UI 设计小哥,已经转用 Zeplin 很久了。Zeplin 的设计稿展示页面的颜色色值使用十进制的 RGB 表示的,在 Android 中的颜色表示大多情况下都需要十六进制的 RGB 表示。我的数学没有好到直接看到十进制就可以心算得到十六进制的结果&#x…

bugly中批量隐藏版本

App项目使用Bugly的内测分发功能进行整包的测试,但日积月累之后,版本就会特别多。而线上同时跑的版本可能不过三个左右,那么多版本会干扰到查看崩溃、选择版本,如何隐藏呢? 右上角,更多 –> 产品设置 –…

检查点(Checkpoint)过程如何处理未提交的事务

每次我讲解SQL Server之前,我都会先简单谈下当我们执行查询时,在SQL Server内部发生了什么。执行一个SELECT语句非常简单,但是执行DML语句更加复杂,因为SQL Server要修改内存中的相关页,并在事务日志里记录整个事务。 …

机器学习工作坊 - 计算机视觉

点击上方蓝字关注我们(本文阅读时间:2分钟)活动介绍四月的 MS Learn 学堂,我们将进入机器学习专题。 本月三期 MS Learn 学堂,我们会以工作坊的形式,结合具体应用实例,带领大家实践计算机视觉、…

arcgis server 无法手动删除切片

背景 问题 场景如下: 切片放置在专门的文件服务器上,通过unc共享路径对外共享。文件服务器的OS为windows server2008R2想手动更新切片服务的切片。发现同一切片服务,有的比例级别文件夹可以删除或者重命名。有的比例级别不可以。不能删除的比…

Hadoop 2.0 中的资源管理框架 - YARN(Yet Another Resource Negotiator)

1. Hadoop 2.0 中的资源管理 http://dongxicheng.org/mapreduce-nextgen/hadoop-1-and-2-resource-manage/Hadoop 2.0指的是版本为Apache Hadoop 0.23.x、2.x或者CDH4系列的Hadoop,内核主要由HDFS、MapReduce和YARN三个系统组成,其中,YARN是一…

React Native实现js调用安卓原生代码

1 问题 实现js调用安卓原始代码,直接上代码,简单粗暴 2 代码实现 1) 实现一个继承ReactContextBaseJavaModule的类,MyToastModule.java文件如下 public class MyToastModule extends ReactContextBaseJavaModule {public MyToastModule(ReactApplicationContext reactContext)…

发布nuget包的正确姿势---cicd自动打包发布

最轻便的发布nuget包方式,方便cicd自动打包发布nuget包首先新建项目项目名随便取,这里就叫它GuiH.ClassLibrary默认即可,需要改目标版本时,等创建好再改项目创建好了随便写个接口方法namespace GuiH.ClassLibrary {public class C…

我的世界服务器物品属性,属性 - Minecraft Wiki,最详细的官方我的世界百科

属性(Attributes)是生物和玩家身上的增益/减益特性系统。属性也存在修饰符(Modifiers)中,用于调整属性的强度。属性应用[]当应用到一个物品,一个物品的修饰符将增加或减少以修正相应的属性下面的命令将给最近的玩家一把增加20( 10)点额外伤害的钻石剑&a…