python词云改颜色_一种用Python生成词云

一种用Python生成词云

我们在阅读一篇很长的文章时,总先看看文章的关键词来获知文章的大概内容。今天我们就来制作一个词云程序,将文章中出现次数较多的词语提取出来,生成一张词云图。

377adab44aed2e7317286aa0a4e7d98d85d6fa62.jpeg?token=de4c2bf903fff95d030a940410e39f1d

词云图的生成原理:

程序会将这篇文章中的所有词组识别出来,然后统计每个词组出现的次数,出现次数越多,词组的字号越大,最后把所有词组拼合成一张图像,也就是我们想要的词云图。我们需要把这篇文章储存在一个txt文档里,把这个文档和程序放在同一个文件夹下。

首先需要安装好了python的运行环境,并且以pycharm作为默认工具,安装所需的第三方库,它们分别是jieba 和wordcloud.安装可以参考:

https://www.jb51.net/article/141320.htm

然后开始制作词云程序。在pycharm中新建一个python文件。

首先调用jieba 和worldcloud模块。

import jieba

import worldcloud

接着,我们把储存在程序目录下的txt文档命名为”b站测试题.txt”

在程序中输入以下代码来读取这个文档。

f=open(“b站测试题.txt”,”r”,encoding=”gbk”)

现在我们要读取文档中的文字, 把它储存在一个新的变量t中

t=f.read()

然后关闭文档

f.close()

然后提取词组

Is=jieba.icut(t)

Txt=” ”.join(Is)

现在我们已经将词组提取出来并用空格分开,提取出来的词组保存在一个新的变量txt 里面

下一步我们要新建一个词云的对象, 并设定一些参数

W=wordcloud.wordcloud(width=2000,

Height=1400,

Font_path=”msyh.ttc”

)

在上面这段代码中,我们新建了一个词云的对象并将其命名为w。我们设定生成词云图片的宽度为2000像素,高度为1400像素,设定文字的字体为微软雅黑。

现在我们要把之前生成的词组变量txt导入词云对象w中。

w.generate(txt)

w.to_file(“pic.png”)

然后运行测试

打开程序所在的文件夹, 我们可以看到这里生成了一个名为pic.png的图片文件。

d1a20cf431adcbefff440515884956dba2cc9f99.jpeg?token=7a2ba8053c21896545173758d0486227

还可以进行个性化,譬如换个背景色

只需要加入一行代码:

W=wordcloud.wordcloud(width=2000,

Height=1400,

Background_color=”Grey”

Font_path=”msyh.ttc”

)

颜色可以查询下表

314e251f95cad1c8b4d7c2f85cd81f0fcb3d51e8.jpeg?token=ab671132679d712a905b9f82691c842f

也可以用16进制数值模式,以#开头的6位16进制数表示颜色,你可以在下面这个网站上找到自己想要的颜色的1 6进制颜色数值。

http://tool.oschina.net/commons?type=3

5882b2b7d0a20cf48cebd27d55ef3330adaf9901.jpeg?token=b8f7ada0480aab116f467d905c857729

也可以使用colormap改变文字颜色

还以自定义词云显示行状,譬如奔马、五角星等

我们需要准备一张白色背景的图片,将其放到程序所在的文件夹里,程序会把白色的背景抠除,将文字放在主体部分,再填充上背景颜色。这里我选了一个五角星的图片,将它放置在程序所在的目录下

现在我们需要调用一个新的库:imageio,imageio是python自带的一个库,可以用来读取图

像数据。

在程序开头添加下面的代码:

import imageio

然后建立一个变量mask来读取图像数据

Mask=imageio.imread(“五角星.png”)

然后我们需要在建立词云对象的代码中添加一行代码

W=wordcloud.wordcloud(width=2000,

Height=1400,

Font_path=”msyh.ttc”

Mask=mask,

)

运行,如下图:

8435e5dde71190ef96c6a877edfde510fcfa6041.jpeg?token=9c8b6ce673220d03564e94d26fedef01

思路参考:威海市文登区七里汤中学宋海霞《用python生成词云图》

除了用Pycharm还可以用sublime,可以参考:

https://blog.csdn.net/ydydyd00/article/details/80665028

未来的编程就这样,很多基础的功能已经函数或者库化了,直接调用就可以了。这样避免了频繁的制造锤子,但是这些库大部分都是国外开发的,国内直接“拿来主义”了,未来会有越来越多的国产库了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/454319.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

什么是程序员正确的职场心态?

(本文为《程序员羊皮卷》最新公布的第七章的一部分,下载地址:http://download.csdn.net/source/1868065 或者http://zhaopinpro.com/wordpress/wp-content/uploads/2009/12/《程序员羊皮卷》第7章-程序员职场心态.doc 欢迎大家购买作者签名…

git第一次提交代码至远程仓库步骤

git第一次提交代码至远程仓库步骤在将要提交的文件目录下打开Git Bash Here1.git init git add . 提交该目录下的所有文件 3.git commit -am “qiantai”(提交到本地仓库) 4.git remote add origin *** (***git地址) 5.git push -u -f origin master(提交到远程仓库&#x…

机器学习之 朴素贝叶斯、贝叶斯网络

目录 贝叶斯定理 朴素贝叶斯算法 高斯朴素贝叶斯 伯努利朴素贝叶斯 多项式朴素贝叶斯 贝叶斯网络 最简单的贝叶斯网络 全连接贝叶斯网络 一般化的贝叶斯网络 引子 参赛者会看见三扇关闭了的门,其中一扇的后面有一辆汽车,选中后面有车的那扇门可…

liunx -bash:ls:command not found,执行命令总是报找不到

解决办法: 使用绝对命令vi打开profile /bin/vi /etc/profile 添加: export PATH/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin 简便方法: 直接执行 export PATH/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin export PA…

Nginx的Web管理界面收集

Nginx实在是太强大了!灰度发布、金丝雀发布、负载均衡就只需要简单的几行配置就可以实现,这些特性嗾使微软无法比拟的。 原来Nginx除了使用ngx_http_stub_status_module模块(http://127.0.0.1/ngx_status)实现Web页面上的监控外&a…

attention机制_简析Attention机制—优缺点,实现,应用

什么是Attention机制?Attention机制的本质来自于人类视觉注意力机制。人们在看东西的时候一般不会从到头看到尾全部都看,往往只会根据需求观察注意特定的一部分。简单来说,就是一种权重参数的分配机制,目标是协助模型捕捉重要信息…

高级程序员如何面对职场压力?(2)--受伤的总是我

版权声明:原创作品,允许转载,转载时请务必以超链接形式标明文章原始出版、作者信息和本声明。否则将追究法律责任。本文地址:http://tech.it168.com/a2008/0911/204/000000204752.shtml 课程上线消息:Leo讲的《初入公司…

pycharm Debug问题

pycharm Debug问题 参考链接:https://blog.csdn.net/weixin_43472408/article/details/85072640 Debug的调试方式如下所示: 1.show execution point (F10) 显示当前所有断点 2.step over(F8) 单步调试。 若函数A内存在子函数a时,不会进入子函数a内执…

vue表单的用法

你可以用 v-model 指令在表单控件元素上创建双向数据绑定。它会根据控件类型自动选取正确的方法来更新元素。尽管有些神奇,但 v-model 本质上不过是语法糖,它负责监听用户的输入事件以更新数据,并特别处理一些极端的例子。 v-model 会忽略所有…

php执行npm命令_npm系列之命令执行

当我想使用vue的脚手架来创建一个项目的时候,我应该怎么做?执行命令 npm install -g vue/cli 全局安装,之后就可以在控制台中使用vue create programName 来创建一个项目。为什么可以直接使用vue命令?这类支持命令的依赖会在项目中…

模拟产品展示 Flash无法展示的追踪过程

鼠标滑过小图时,左侧前四张大图可以,但是最后那张大图无法展示: falsh产品展示需要通过参数传递,把关联产品id的图片get出来,如: http://192.168.8.166:90/category/prod_img.aspx?prodid101 结果&#xf…

git提交 本地分支和远程分支断开连接

1级标题 当 git push origin branch_name时遇到报错如下: fatal:‘origin’ does not appear to be a git repository fatal:Could not read from remote repository 原因: 本地分支和远程分支断开连接 解决方法: cd 本地分支里 1、git…

编程高手箴言

本书是作者十余年编程生涯中的技术和经验的总结。内容涵盖了从认识CPU、Windows运行机理、 编程语言的运行机理,到代码的规范和风格、分析方法、调试方法和内核优化,内有作者对许多问题 的认知过程和透彻的分析,以及优秀和精彩的编程经验。…

nodejs里的module.exports和exports

引 在node.js中我们可以使用module.exports和exports导出模块,设置导出函数、数组、变量等等 为什么可以用这两个模块? 或者直接问,node.js的模块功能是怎么实现的。 这样得益于javascript是函数性的语言,并支持闭包。 js的闭包 直…

c语言贪吃蛇最简单代码_C语言指针,这可能是史上最干最全的讲解啦(附代码)!!!...

点击上方“大鱼机器人”,选择“置顶/星标公众号”福利干货,第一时间送达!指针对于C来说太重要。然而,想要全面理解指针,除了要对C语言有熟练的掌握外,还要有计算机硬件以及操作系统等方方面面的基本知识。所…

SpringSecurity深度解析与实践(3)

这里写自定义目录标题 引言SpringSecurity之授权授权介绍java权限集成 登录失败三次用户上锁 引言 SpringSecurity深度解析与实践(2)的网址 SpringSecurity之授权 授权介绍 Spring Security 中的授权分为两种类型: 基于角色的授权&#…

简单解释什么是 依赖注入 和 控制反转

简单解释什么是 依赖注入 和 控制反转2017-07-09 关于 依赖注入 与 控制反转 的概念有些人觉得很难理解,最近在给别人讲这个概念的时候梳理了一个比较好理解的解释,而且我认为非技术人员也应该能听的懂,因此分享给大家,希望下次你…

python pip install指定国内源镜像

有时候安装一些依赖包,网不好,直接超时,或者这个包就是死都下不下来的时候,可以指定国内源镜像。 pip install -i 国内镜像地址 包名 清华:https://pypi.tuna.tsinghua.edu.cn/simple 阿里云:http://mirr…

机器学习之单标签多分类及多标签多分类

单标签二分类算法 Logistic算法 单标签多分类算法 Softmax算法 One-Versus-One(ovo):一对一 One-Versus-All / One-Versus-the-Rest(ova/ovr): 一对多 ovo和ovr的区别 Error Correcting Output code…

ionic3 隐藏子页面tabs

看了几天ionic3 问题还挺多的,今天想把所有子页面tabs 给去掉,整了半天,发现app.Module 是可以配置的 修改 IonicModule.forRoot(MyApp) imports: [BrowserModule,// IonicModule.forRoot(MyApp),HttpModule,IonicModule.forRoot(…