python 爬虫 音乐下载 歌手_python爬虫批量下载全民K歌音乐

标签:爬虫

网址示例: https://node.kg.qq.com/personal?uid=639e9983222a338a

直接上源码:

import requests

import time

import re

import json

import pprint

import math

import os

header={

'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 SE 2.X MetaSr 1.0'

}

SongList=[]

song_baseurl="http://node.kg.qq.com/play"

album_baseurl="http://node.kg.qq.com/cgi/fcgi-bin/kg_ugc_get_homepage"

def Down(url_file, filePath, FileDir):

if not os.path.isdir(FileDir): os.makedirs(FileDir)

if os.path.isfile(FileDir + "/" + filePath):

print(filePath + " --已存在")

return 0

try:

r = requests.get(url_file, stream=True)

with open(FileDir + "/" + filePath, "wb") as f:

size = int(r.headers['content-length'])

title = " 当前下载-" + filePath + " 文件大小:" + size + "字节"

print('\033[0;31m' + title + "\033[0m")

CurTotal = 0

for chunk in r.iter_content(chunk_size=512 * 1024):

if chunk:

f.write(chunk)

CurTotal += len(chunk)

print("\r" + filePath + "--下载进度:" + '%3s' % (str(CurTotal * 100 // size)) + "%", end='')

print()

r.close()

except Exception as e:

print(filePath + " 下载出错!" + " 错误信息" + str(e.args))

if os.path.isfile(FileDir + "/" + filePath): os.remove(FileDir + "/" + filePath)

def GetData(data,url):

response = requests.get(url,params=data, headers=header)

return response.content.decode("utf-8")

def Parse_Song_Info(content):

jsonobj = re.findall(r'window.__DATA__ = (.*?); ', content)

if len(jsonobj) > 0:

data = json.loads(jsonobj[0])

# pprint.pprint(data)

obj={}

obj[ "name"]=data['detail']['song_name']

if data['detail']['playurl']:

print(data['detail']['song_name']+" 音乐:"+data['detail']['playurl'])

obj["url"]=data['detail']['playurl']

obj["type"]=".mp3"

else:

print(data['detail']['song_name'] + " 视频:" + data['detail']['playurl_video'])

obj["url"] = data['detail']['playurl_video']

obj["type"] = ".mp4"

SongList.append(obj)

else:

print("没有爬取到")

def GetSongsByIndex(uid, Is_Parse, page):

data={

'jsonpCallback':'callback_0',

'g_tk':'5381',

'outCharset':'utf-8',

'format':'jsonp',

'type':'get_ugc',

'start':str(page),

'num':'8',

'touin':'',

'share_uid':uid,

'g_tk_openkey':'5381',

'_':str(int(time.time()*1000))

}

response=requests.get(album_baseurl,params=data,headers=header)

jsonobj=re.findall(r'callback_\d\((.*)\)',response.content.decode("utf-8"))

if len(jsonobj)>0:

data=json.loads(jsonobj[0])

# pprint.pprint(data)

count=data['data']['ugc_total_count']

if Is_Parse:

time.sleep(1)

for obj in data['data']['ugclist']:

print(obj['title']+" -- "+obj['shareid'])

songdata = {

"s": obj['shareid']

}

content=GetData(songdata,song_baseurl)

Parse_Song_Info(content)

else:

pprint.pprint("共计:" + str(count))

return count

else:

print("没有爬取到")

return 0

def Run(uid):

count=GetSongsByIndex(uid, False, 1)

if count!=0:

for page in range(1,math.ceil(count/8)+1):

GetSongsByIndex(uid, True, page)

else:

print("该用户没有歌曲")

if __name__=="__main__":

Run('639e9983222a338a')

for s in SongList:

Down(s["url"],s["name"]+s["type"],"小小")

# print(s)

将Run 括号里面的字符串换为 歌手主页链接后面的uid

“小小” 可自定义文件夹

标签:爬虫

来源: https://www.cnblogs.com/yuanzessrs/p/10247347.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/381135.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机在智能交通应用,计算机技术在智能交通系统的应用

摘要:借助智能交通系统,优化公共交通运行效率,为人们提供更大的便利。文章对智能交通系统内涵进行了简要分析,并从数据处理系统、交通监控系统、车辆导航系统以及车辆辅助驾驶系统4个方面对计算机技术在智能交通系统中的应用展开了…

快乐是什么

有时候快乐就是一只烤鸡腿,耶,就这么简单转载于:https://www.cnblogs.com/haozime/archive/2010/01/11/2639247.html

信息系统项目管理师论文_「高项论文」谨防信息系统项目管理师论文12个写作丢分点...

2020年上半年信息系统项目管理师论文怎么写才能得高分?有些时候洋洋洒洒写下一大篇,自我感觉良好,结果分数不如意。这可能是你触到了丢分点而不自知。慧翔天地给你提供信息系统项目管理师12个论文写作丢分点以及对应解决方法,供你…

html%3ca%3e标签,How do I encode “” in a URL in an HTML attribute value?

click meIs correct, although ‘&’ is more commonly used than ‘&’ or ‘,’.If the ‘stringByAddingPercentEscapesUsingEncoding’ method does what it says on the tin, it should work(*), but the NSString documentation looks a bit unclear on which ch…

java wed登录面 代码_JavaWeb实现用户登录注册功能实例代码(基于Servlet+JSP+JavaBean模式)...

下面通过通过图文并茂的方式给大家介绍JavaWeb实现用户登录注册功能实例代码,一起看看吧。一、ServletJSPJavaBean开发模式(MVC)介绍ServletJSPJavaBean模式(MVC)适合开发复杂的web应用,在这种模式下,servlet负责处理用户请求,jsp…

.net类库学习(一)System.object

System.Object 是基类,.NetFramework 中的所有其他类都从这个类派生而来。派生的.net类可以使用这个类的属性,而且那些类可以使用Object类的成员。 方法: Object.Equals 1 publicstaticboolEquals(object,object);//静态成员2 publicvirtualb…

武汉科技大学计算机生命与科学周海,湖北双胞胎周海周洋:为了母亲,一个放弃清华,一人放弃中科院...

“你要相信命运给你一个比常人较低的出发点,是希望你用一生去奋斗出一个柳暗花明的故事”。人的命运就是这样,从来没有真正“完美”的样子,奋斗和努力是改变命运的最重要力量。高考对于贫困山区或农村的孩子来说:这就是命运转折点…

循环左移和循环右移指令_运用 移位、循环移位指令 实现流水灯

具体要求用 I0.0 控制接在 QB0 上的8个彩灯是否移位,每 2s 左移 1 位。用 I0.1 控制左移,I0.2控制右移,首次扫描时将彩灯的初始值设置为 16#1 ,设计出梯形图程序。先来讲解一下,移位指令和循环移位指令。移位指令这里的…

extjs中xtype类型

xtype Class------------- ------------------box Ext.BoxComponent 具有边框属性的组件button Ext.Button  按钮colorpalette Ext.ColorPalette 调色板component Ext.Component 组件container Ext.Container 容器…

vb.net html转xml文件,VB.Net将XSL转换应用于XML文件

我有一些由我的应用程序构建的XML。此XML将被删除为XML文件,然后我希望将XSL样式表应用于该文件,以便将其转换为HTML页面。但是,每次,它都会继续使用原始XML而不是转换后的HTML这是XML:MrGregoryHouseasasasas11:41asa…

PowerSocket对象与HostName

其实是因为,最近调用PowerSocket对象,PowerSocket需要取HostName的值,然后转换成IP地址。 来看看HostName命令,对了还要说明的是系统是Windows 2000 Professional。 HostName命令:作用:打印当前计算机(主机&#xff09…

当前计算机无法连接,win7系统无法连接wifi提示此计算机当前已将连接限制为xxx的解决方法...

许多win7系统用户在工作中经常会遇到win7系统无法连接wifi提示此计算机当前已将连接限制为xxx的情况,比如近日有用户到本站反映说win7系统无法连接wifi提示此计算机当前已将连接限制为xxx的问题,但是却不知道要怎么解决win7系统无法连接wifi提示此计算机…

git设置master权限_git怎么控制成员的权限?

回答什么GIT权限管理的真的知道GIT的权限管理意味着什么么?GIT的权限管理是说控制用户能不能PUSH或者DELETE分支,或者能不能PUSH代码,而不是能不能访问某个目录的文件。对目录和文件的可读是GIT的最基本要求,不可能做到针对目录级…

计算机论文外文翻译,计算机专业毕业论文外文翻译2篇

《计算机专业毕业论文外文翻译2篇》由会员分享,可在线阅读,更多相关《计算机专业毕业论文外文翻译2篇(15页珍藏版)》请在人人文库网上搜索。1、武汉理工大学本科生毕业设计(论文)英文翻译毕业设计题目:会务管理系统的设计与实现学院(系)&…

转载 从SRAM中读写一个数据问题——Verilog

从SRAM中读写一个数据问题——Verilog2009-04-24 14:21从SRAM中读写一个数据问题——Verilog操作SRAM(IS63lv1024),向SRAM写入一个数据;并从SRAM中读出数据;如果读出的数据与写入的一样,说明写读成功,LED2闪烁&#xf…

js能订阅mq吗_测试工程师,必须了解的MQ知识!

什么是消息中间件?通过提供某种规范实现在不同系统之间传递语义准确的消息。专注于数据的发送和接收,利用高效可靠的异步消息传递机制的集成分布式系统。什么是MQ?MQ全称为Message Queue, 消息队列(MQ)是应用程序“对”应用程序的通信方法,也…

98k计算机版教程,绝地求生正式版八倍镜98k瞄准教程 新版98K怎么用?

《绝地求生大逃杀》正式版已经更新,新版本中官方对原有的四倍镜和八倍镜进行了不小的改动。正式版98K怎么用?接下来就为大家带来新版八倍镜98k瞄准教程,感兴趣的玩家一起来看看吧!教程:新版本的八倍镜更新了新的瞄准样…

python 图 鼠标 显示_在matplotlib图形窗口(带imshow)中,如何删除、隐藏或重新定义鼠标的显示位置?...

是的,你可以。但比你想象的要难。您看到的鼠标跟踪标签是根据鼠标跟踪调用matplotlib.axes.axes.format_coord生成的。您必须创建自己的Axes类(重写format_coord以执行您希望它执行的操作),然后指示matplotlib使用它来代替默认的Axes类。具体来说&#x…

转:修改Content Server管理员密码 - [Documentum 实施开发记录]

修改Content Server管理员密码 - [Documentum 实施开发记录] 2010-02-25 Tag:版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明http://fanlb.blogbus.com/logs/59357766.html修改documentum content server 管理员用户dmadmin的密码 (…

同等学力申硕计算机科学与技术参考书,2017同等学力申硕计算机科学与技术综合备考规划...

2017同等学力申硕计算机科学与技术综合备考规划,详情如下一、复习时间:现在开始至2017年5月(考试前)二、复习科目:计算机科学与技术三、复习计划:第一个阶段 (现在--2016.12)整体把握大纲结构,通读大纲,先把…