python生成的词云没有图案_还在为专栏封面发愁?我用Python写了个词云生成器!...

50f2d1fcc106a75bd62099e865a965a459e9cb7d.png

妈妈再也不用担心我写专栏找不到合适的封面了!B站专栏的封面至少是我一直头疼的问题,每次写完文章却找不到合适的图片作为封面。

词云是一个很不错的选择,既美观,又提纲挈领。网上也有词云生成的工具,但大多收费/只能试用,很多设置也不能调整。于是我最终决定自己动手丰衣足食。

网上有很多关于词云生成的Python代码,但大多结构松散,要调一项设置要在代码里上上下下各个库里进行修改,不方便使用。于是我想把我们常用的设置封装到一个函数里,这样方便我们日常使用。4adb9255ada5b97061e610b682b8636764fe50ed.png

总的思路是采用Jieba库对中文文章进行词语拆分,使用Matplotlib库进行底层绘图支持,使用WoldCloud库对分词后的文章进行词频统计并画出词云。

原本的WordCloud库是针对英语所开发的,在英文里每个单词都是由空格分开的,所以只需统计一篇文章中单词的频率并画图即可。中文的词语则需要通过Jieba库来进行识别并分词,并再将文中的词语之间插入空格,才算完成对数据的准备工作,可以使用WordCloud库生成词云。WordCloud库默认生成的是充满整个画图区域的词云,效果不够美观。

一般的解决方案是选择一张已有的图片作为mask遮罩,使WordCloud在图形区域进行画图。在本项目中,预设了常用形状的遮罩(圆形、椭圆、矩形、多边形),通过matplotlib.patches模块,进行遮罩的生成,免去了手动上传遮罩图片的麻烦。

代码采用了函数的方式,对每个功能部分进行了封装,便于调用,也便于代码的理解。分成了make_mask生成遮罩图片;jieba_split使用jieba分词并插入空格;以及最后的cloud_generate生成WordCloud对象并调用Matplotlib绘图。

最终只需要调用cloud_generate()函数并填写相应的参数即可:4adb9255ada5b97061e610b682b8636764fe50ed.png

cloud_generate()中的参数:

text_addr:需要生成词云的文本文档的地址

shape:词云的形状

'circle' 或'c':圆形

'ellipse' 或'e':椭圆

'rectangle' 或'r':矩形

'square' 或's':正方形

整数n:正n边形

colormap:Matplotlib中的colormap数据对象,是颜色的组合a61957655dbc537d9c8c8176531d396afae3766c.png部分Colormap预设

dpi:生成图片分辨率(默认为200)

output_addr:输出的图片的地址(默认为当前文件夹下wordcloud_output.png)

stopwords:列表,停止词(即你不希望出现在图片里的词)

例:

cloud_generate(text_addr = '.\\bili.txt', shape = 'e', colormap = 'Set2', dpi = 400, stopwords = ['进行',  '我们'], output_addr = '.\\output.png')

即在当前目录下打开bili.txt作为要生成词云的文章,词云形状是椭圆,颜色组合是Set2,分辨率是400dpi,停止词是‘进行’和‘我们’(因为这两个词在文中出现的频率较高,但对文章内容的提示性不大,所以选择不生成在词云里),最后输出的图片在当前文件夹下,文件名为‘output.png’4adb9255ada5b97061e610b682b8636764fe50ed.png

最后,上代码~eb286979d32151d2b22ff7fcd3eb8eada6ca6a16.png为了语法高亮,以截图的形式发上来,源码评论区自取~注:

1. 本项目依赖Jieba库、wordcloud库、matplotlib库。

2. 与程序文件同一文件夹下要有字体文件:“simhei.ttf”

3. 由于采用了函数的封装,在同一目录下的py文件可以直接将WordCloudGenerate.py当做库来导入,直接使用cloud_generate()函数from WordCloudGenerate import cloud_generate

也可以将WordCloudGenerate.py添加到python的库中,从任意地方调用此库。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/446245.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java 1000以内的完数

题目 代码 package lesson.l6_review;public class PrefectNumber {public static void main(String[] args) {for (int i 1; i <1000 ; i) {int num0;for (int j 1; j <i-1 ; j) {if (i%j0){numj;}}if (inum){System.out.print(i"\t");}}} }

STL源码剖析 map

所有元素会根据元素的键值自动被排序 元素的类型是pair&#xff0c;同时拥有键值和实值&#xff1b;map不允许两个元素出现相同的键值pair 代码 template <class T1,class T2> struct pair{typedef T1 first_type;typedef T2 second_type;T1 first; //publicT2 secon…

java api接口怎么写_Java 如何设计 API 接口,实现统一格式返回?

来源&#xff1a;老顾聊技术前言接口交互返回格式控制层Controller美观美化优雅优化实现方案前言在移动互联网&#xff0c;分布式、微服务盛行的今天&#xff0c;现在项目绝大部分都采用的微服务框架&#xff0c;前后端分离方式&#xff0c;(题外话&#xff1a;前后端的工作职责…

java 二维数组

声明和初始化 静态初始化 // 静态初始化&#xff1a; // 一维数组int[] arr1_1 {1, 2, 4};System.out.println(Arrays.toString(arr1_1)); // 二维数组int[][] arr1_2 {{1, 2}, {4, 5}, {9, 10}};for (int[] i :arr1_2) {System.out.print(Arrays.toS…

STL源码剖析 hashtable

二叉搜索树具有对数平均时间的表现&#xff0c;但是这个需要满足的假设前提是输入的数据需要具备随机性hashtable 散列表这种结构在插入、删除、搜寻等操作层面上也具有常数平均时间的表现。而且不需要依赖元素的随机性&#xff0c;这种表现是以统计为基础的 hashtable的概述 …

append在python里是什么意思_“一棵绿萝七个鬼”是什么意思?卧室里到底能不能养绿萝!...

很多人都喜欢在家里养盆绿萝&#xff0c;一是能净化室内空气&#xff0c;让家里绿意浓浓&#xff0c;更有生机一些&#xff1b;二是绿萝好养&#xff0c;水培土培都行&#xff0c;养着也省心。在养花界有一句俗语&#xff1a;“一棵绿萝七个鬼”&#xff0c;这句话是什么意思呢…

java 二分查找

注意 二分查找要求原数组为有序序列&#xff0c;从小到大 递归解法 public class problem9 {public static void main(String[] args) {int[] arr {1,2,3,4,6,7};int left 0;int right arr.length - 1;int value 2;System.out.println(Arrays.toString(arr));int index …

java三个柱子汉诺塔问题

题目 移动盘子&#xff0c;每一次只能移动一个&#xff0c;小盘子在大盘子上。 打印1 from A to B过程 注意 1&#xff09;盘子编号的变化和辅助柱子的变化 2&#xff09;当盘子编号为1时&#xff0c;结束递归&#xff0c;此时移动结束 代码 package p2;/*** Illustratio…

java杨辉三角形

题目 代码1 public class YangHuiTriangle {public static void main(String[] args) {print(10);}public static void print(int num) {int[][] arr new int[num][];for (int i 0; i < num; i) { // 第一行有 1 个元素, 第 n 行有 n 个元素arr[i] new int[i…

STL源码剖析 基本算法 equal | fill | iter_awap | lexicographical_compare | max | min | swap |mismatch

Equal 两个序列在[first,last)区间内相等&#xff0c;equal()返回true。以第一个序列作为基准&#xff0c;如果第二序列元素多不予考虑&#xff0c;如果要保证两个序列完全相等需要比较元素的个数 if(vec1.size() vec2.size() && equal(vec1.begin(),vec1.end(),vec2…

svm分类器训练详细步骤_「五分钟机器学习」向量支持机SVM——学霸中的战斗机...

大家好&#xff0c;我是爱讲故事的某某某。 欢迎来到今天的【五分钟机器学习】专栏内容 --《向量支持机SVM》 今天的内容将详细介绍SVM这个算法的训练过程以及他的主要优缺点&#xff0c;还没有看过的小伙伴欢迎去补番&#xff1a;【五分钟机器学习】向量支持机SVM——学霸中的…

STL源码剖析 数值算法 copy 算法

copy复制操作&#xff0c;其操作通过使用assignment operator 。针对使用trivial assignment operator的元素型别可以直接使用内存直接复制行为(使用C函数 memove或者memcpy)节约时间。还可以通过函数重载(function overloading)、型别特性(type traits)、偏特化(partial speci…

STL源码剖析 数值算法 copy_backward 算法

copy_backward 时间技巧和copy类似主要是将[first&#xff0c;last)区间范围内的元素按照逆行方向复制到以result-1为起点&#xff0c;方向同样是逆行的区间上返回的迭代器的类型是result - (last - first)copy_backward支持的类型必须是BidirectionalIterators &#xff0c;才…

STL源码剖析 Set相关算法 并集 set_union|交集 set_intersection|差集 set_difference |对称差集 set_symmetric_difference

注意事项 四种相关算法&#xff1a;并集、交集、差集、对称差集本章的四个算法要求元素不可以重复并且经过了排序底层接受STL的set/multiset容器作为输入空间不接受底层为hash_set和hash_multiset两种容器 并集 set_union s1 U s2考虑到s1 和 s2中每个元素都不唯一&#xff0…

python sqlserver 数据操作_python对Excel数据进行读写操作

python对Excel数据进行读写操作将学习到的基础操作记录在这里&#xff0c;便与复习查看1.python读取Excel工作簿、工作表import xlrd # 读取工作簿 wbxlrd.open_workbook(招生表.xls) # 读取工作簿下所有的工作表 wswb.sheets() # 读取工作簿下所有工作表名称 wsnamewb.sheet_n…

Arrays数组工具类

介绍 代码 package lesson.l8_arrays;import java.util.Arrays;/*** Illustration** author DengQing* version 1.0* datetime 2022/6/23 16:53* function Arrays数组工具类*/ public class ArraysUtil {public static void main(String[] args) {int[] arr1 new int[]{1, 12…

通过解析URL实现通过Wifi的用户查找

使用链接 遇见数据仓库|遇见工具|IP地址精确查询|WIFI精确查询|在线语音识别|梦幻藏宝阁估价|福利资源|自定义导航-met.redhttps://sina.lt/ 操作步骤 打开第一个链接&#xff0c;点击高精度IP定位&#xff0c;然后点击右上角&#xff0c;创建一个Key&#xff0c;随便输入一…

anaconda中怎么sh_【好工具】 深度学习炼丹,你怎么能少了这款工具!JupyterLab 远程访问指南...

欢迎来到【好工具】专栏&#xff0c;本次我们给介绍一款可以进行远程深度学习炼丹的工具 JupyterLab 及其配置流程&#xff0c;帮助读者在本地进行调试&#xff0c;Max 开发效率。作者 & 编辑 | Leong导言不知道读者们有没有发现&#xff0c;如果你用 Anaconda 中的 Notebo…

java 类和对象 属性和行为 成员变量和局部变量

概念 使用 案例 public class PersonText {public static void main(String[] args) {Person person new Person();person.name "dq";person.age 11;person.eat("番茄炒蛋");} }class Person {/*** 姓名*/String name;/*** 年龄*/Integer age;/*** 方…

STL源码剖析 数值算法 heap算法

算法 adjacent_findcountcount_iffindfind_iffind_endfor_eachgenerategenerate_nincludesmax_elementmergemin_elementpartitionremoveremoveremove_copyremove_ifremove_copy_ifreplacereplace_copyreplace_ifreplace_copy_ifreversereverse_copyrotaterotate_copysearchsea…