最炫国漫《雾山五行》用 Python 了解一下到底有多优秀

看动漫的小伙伴应该知道最近出了一部神漫《雾山五行》:

1、极具特色的水墨画风和超燃的打斗场面广受好评

2、首集播出不到 24 小时登顶 B 站热搜第一,豆瓣开分 9.5,

火爆程度可见一斑,就打斗场面而言,说是最炫动漫也不为过,当然唯一有一点不足之处就是集数有点少,只有 3 集。

下面放几张动图,一起欣赏一下。

看过动图之后,是不是觉得我所说的最炫动漫,并非虚言,接下来我们爬取一些评论,了解一下大家对这部动漫的看法,这里我们选取 B 站来爬取数据。

我们先来爬取 B 站弹幕数据,动漫链接为:https://www.bilibili.com/bangumi/play/ep331423,弹幕链接为:http://comment.bilibili.com/186803402.xml,爬取代码如下:

import jieba
import pandas as pd
import requests
from PIL import Image
from bs4 import BeautifulSoup
from wordcloud import WordCloudurl = "http://comment.bilibili.com/218796492.xml"
req = requests.get(url)
html = req.content
html_doc = str(html, "utf-8")  # 修改成utf-8
print(html_doc)
# 解析
soup = BeautifulSoup(html_doc, "html.parser")
results = soup.find_all('d')
contents = [x.text for x in results]
# 保存结果
dic = {"contents": contents}
df = pd.DataFrame(dic)
df["contents"].to_csv("bili.csv", encoding="utf-8", index=False)def jieba_():# 打开评论数据文件content = open("bili.csv", "rb").read()# jieba 分词word_list = jieba.cut(content)words = []# 过滤掉的词# 需新建文本stopwordsstopwords = open("stopwords.txt", "r", encoding="utf-8").read().split("\n")[:-1]for word in word_list:if word not in stopwords:words.append(word)global word_cloud# 用逗号隔开词语word_cloud = ','.join(words)def cloud():# 打开词云背景图cloud_mask = pd.np.array(Image.open("bg.png"))# 定义词云的一些属性wc = WordCloud(# 背景图分割颜色为白色background_color='white',# 背景图样mask=cloud_mask,# 显示最大词数max_words=500,# 显示中文font_path='./fonts/simhei.ttf',# 最大尺寸max_font_size=60,repeat=True)global word_cloud# 词云函数x = wc.generate(word_cloud)# 生成词云图片image = x.to_image()# 展示词云图片image.show()# 保存词云图片wc.to_file('cloud.png')jieba_()
cloud()

效果如下:

素材及来源:https://www.cnblogs.com/ityard/p/13435685.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/473236.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 982. 按位与为零的三元组(位运算+计数)

文章目录1. 题目2. 解题1. 题目 给定一个整数数组 A&#xff0c;找出索引为 (i, j, k) 的三元组&#xff0c;使得&#xff1a; 0 < i < A.length 0 < j < A.length 0 < k < A.length A[i] & A[j] & A[k] 0&#xff0c;其中 & 表示按位与&…

Windows下免费软件的首选推荐

PS&#xff1a;以下按装机顺序排列&#xff0c;“|”号后面是备选软件。 启动引导&#xff1a;EasyBCD 虚拟机&#xff1a;VirtualBox Linux&#xff1a;Zorin | Linux Mint(Mate) | Ubuntu 驱动工具&#xff1a;驱动精灵 | 鲁大师 虚拟光驱&#xff1a;DAEMON Tools Lite 系统…

雷军一往无前的十年(小米十周年公开演讲)附赠《一往无前》电子书籍

▲雷军 | 中国企业家俱乐部理事、小米科技董事长 做全球最好的手机&#xff0c;只卖一半的价钱&#xff0c;让每个人都能买得起——如何能够实现这个看上去、听上去都不靠谱的目标&#xff1f; 来源 | 雷军公众号分享 | 雷军 2020年8月11日19:30&#xff0c;小米十周年&#x…

LeetCode 1147. 段式回文(贪心)

文章目录1. 题目2. 解题1. 题目 段式回文 其实与 一般回文 类似&#xff0c;只不过是最小的单位是 一段字符 而不是 单个字母。 举个例子&#xff0c;对于一般回文 "abcba" 是回文&#xff0c;而 "volvo" 不是&#xff0c;但如果我们把 "volvo"…

利用python批量修改文件名称

一、基础知识&#xff1a; 通过查阅资料os模块中rename和renames都可以做到 他们的区别为.rename:只能修改文件名 renames:可以修改文件名,还可以修改文件上级目录名称 另一个用到的方法是os.listdir(path) path为路径 此方法可以将指定路径文件夹中的文件名录入一个列表…

多个域名向主域名自动跳转的Nginx配置

if ($host "bbs.umiwi.com"){ rewrite ^/(.*)$ http://bbs.youmi.cn/$1 permanent; } 多个域名向主域名自动跳转的Nginx配置&#xff0c;可用于URL搜索引擎优化等。nginx语法检测特别严格&#xff0c;if和后面括号以及变量等号这些元素都要有空格&#xff0c;否则会…

LeetCode 464. 我能赢吗(状态压缩+记忆化递归 / 博弈)

文章目录1. 题目2. 解题1. 题目 在 “100 game” 这个游戏中&#xff0c;两名玩家轮流选择从 1 到 10 的任意整数&#xff0c;累计整数和&#xff0c;先使得累计整数和达到或超过 100 的玩家&#xff0c;即为胜者。 如果我们将游戏规则改为 “玩家不能重复使用整数” 呢&…

简单聊一聊Python工程师任职要求及未来发展方向

一、不同阶段Python工程师任职要求及标准 1、新手入门 任职要求&#xff1a; 熟练掌握python编程语言&#xff0c;熟悉flask或django开发框架者&#xff1b; 一名Python开发工程师的职业规划 熟练使用Windows系统&#xff0c;能使用Word&#xff0c;Excel&#xff0c;Powe…

总结python换源的方法:Linux与windows系统

一、命令行方式&#xff1a; 1、清华源地址&#xff1a; 可以在使用pip的时候加参数-i https://pypi.tuna.tsinghua.edu.cn/simple 例如&#xff1a;pip install -i https://pypi.tuna.tsinghua.edu.cn/simple gevent&#xff0c;这样就会从清华这边的镜像去安装gevent库。 …

LeetCode 880. 索引处的解码字符串(找规律)

文章目录1. 题目2. 解题1. 题目 给定一个编码字符串 S。请你找出 解码字符串 并将其写入磁带。 解码时&#xff0c;从编码字符串中 每次读取一个字符 &#xff0c;并采取以下步骤&#xff1a; 如果所读的字符是字母&#xff0c;则将该字母写在磁带上。如果所读的字符是数字&a…

C、C++ 学习经历

1、可以考虑先学习C。 大多数时候&#xff0c;我们学习语言的目的&#xff0c;不是为了成为一个语言专家&#xff0c;而是希望成为一个解决问题的专家。做一个有用的程序员&#xff0c;做一个赚钱的程序员。我们的价值&#xff0c;将体现在客户价值上&#xff0c;而不是语言写得…

python中遇到循环import即circular import的问题原理剖析及解决方案

在python中常常会遇到循环import即circular import的问题&#xff0c;今天主要给大家介绍了关于Python中循环引用&#xff08;import&#xff09;失败的解决方法&#xff0c;文中通过示例代码介绍的非常详细&#xff0c;需要的朋友可以参考借鉴。 一、前言 最近在开发智能家居…

LeetCode 1711. 大餐计数(map计数 + 二分查找)

文章目录1. 题目2. 解题1. 题目 大餐 是指 恰好包含两道不同餐品 的一餐&#xff0c;其美味程度之和等于 2 的幂。 你可以搭配 任意 两道餐品做一顿大餐。 给你一个整数数组 deliciousness &#xff0c;其中 deliciousness[i] 是第 i​​​​​​​​​​​​​​ 道餐品的美…

node.js初入手

今天突然看到《node.js开发指南》的pdf文件&#xff0c;感觉封面不错&#xff0c;就看看。发现写的挺好的。 一、mac下安装 http://nodejs.org/download/ //官网下载mac版 二、用npm安装supervisor (检测修改&#xff0c;则重启node进程) sudo npm install -g supervisor //…

总结与整理:Ubuntu系统下安装、配置Nginx及其他注意事项

在Ubuntu下安装Nginx有以下方法&#xff0c;但是如果想要安装最新版本的就必须下载源码包编译安装。 一、基于APT源安装 sudo apt-get install nginx 1、安装好的文件位置&#xff1a; /usr/sbin/nginx&#xff1a;主程序 /etc/nginx&#xff1a;存放配置文件 /usr/share/n…

LeetCode 1710. 卡车上的最大单元数(排序,模拟)

文章目录1. 题目2. 解题1. 题目 请你将一些箱子装在 一辆卡车 上。给你一个二维数组 boxTypes &#xff0c;其中 boxTypes[i] [numberOfBoxesi, numberOfUnitsPerBoxi] &#xff1a; numberOfBoxesi 是类型 i 的箱子的数量。numberOfUnitsPerBoxi 是类型 i 每个箱子可以装载…

hdu 1505 City Game

http://acm.hdu.edu.cn/showproblem.php?pid1505 先处理每一行上每一个F为底往上所到达的高度&#xff0c;然后再左右处理。 1 #include <cstdio>2 #include <cstring>3 #include <algorithm>4 #define maxn 10015 using namespace std;6 7 int t;8 int n,m…

使用Python requests post上传图片及示例demo

一、需求&#xff1a; 利用python写demo&#xff0c;上传图片&#xff0c;调用接口&#xff0c;并返回数据 二、requests上传图片参数&#xff1a; resrequests.request("POST",url, dataNone, filesfiles) 三、demo示例&#xff1a; import json import osimpo…

LeetCode 1712. 将数组分成三个子数组的方案数(前缀和 + 二分查找)

文章目录1. 题目2. 解题221 / 3117&#xff0c;前7.1%574 / 9692&#xff0c;前 5.9%周赛前2题如下&#xff1a; LeetCode 5641. 卡车上的最大单元数&#xff08;排序&#xff0c;模拟&#xff09; LeetCode 5642. 大餐计数&#xff08;map计数 二分查找&#xff09; 第4题&am…

总结python处理图片等比例压缩与质量处理的方法

一、使用PIL image 处理 1、在使用PIL image处理图像要获取高质量的关键地方是下面两点&#xff1a; 1、处理时要用 ANTIALIAS&#xff1b;2、保存时是要设置 quality&#xff1b; 2、在python ide 可以这样处理&#xff1a; im.resize(box, Image.ANTIALIAS) im.save(path…