词云图 - WorldCloud - Python代码实现

目录

第一步:安装必要的包WorldCloud(安装好并且没有出错的可跳过这一步)

第二步:准备文件,词云图的图片和文章,按照自己喜好准备吧

第三步:Python实现-源码


第一步:安装必要的包WorldCloud(安装好并且没有出错的可跳过这一步)

pip install wordcloud

 如果出现错误,那么看看是什么错误:

  1. 提示pip“不是内部命令”,那就先安装pip吧;
  2. 提示其他“某某某 is required”,那么意思就是“某某某”是安装worldcloud时必须安装的东西,缺什么就安装什么就好了;
  3. 提示其他无法安装的问题,那么试试下面这个办法:

--安装whl文件

worldcloud包下载链接

找到对应的版本下载就好,我电脑是64位的,但是下载的64的包也报错,但是下载的32位的包却没有报错,给参考。

--下载完成以后打开cmd,安装wheel 执行命令

pip install wheel

--安装完wheel之后,安装whl文件,install后面跟的一大串其实就是你下载的worldcloud的文件名

pip install wordcloud-1.3.3-cp27-cp27m-win32.whl

--最后再pip一次就好

pip install wordcloud

 

第二步:准备文件,词云图的图片和文章,按照自己喜好准备吧

我准备的是罗伊·克里夫特的《爱》,很喜欢,来一句感受一下:

  I love you,
  Not only for what you are,
  But for what I am
  When I am with you.

第三步:Python实现-源码

from os import path
from PIL import Image
import numpy as np
import matplotlib.pyplot as plt
from wordcloud import WordCloud, STOPWORDS# 读取本地文件
d = 'F:\huanghaixia'
text = open(path.join(d, 'test.txt')).read()#读取文章
test_mask = np.array(Image.open(path.join(d, "lover.png")))#读取背景图片#设置
stopwords = set(STOPWORDS)
stopwords.add("end")#设置结束字符
wc = WordCloud(background_color="black", max_words=9999, mask=test_mask,stopwords=stopwords)#设置背景颜色是黑色,最大字符数是9999
wc.generate(text)# 画词云图
plt.imshow(wc, interpolation='bilinear')
plt.axis("off")#词云图的背景图,即原图。可以选择不展示
plt.figure()
plt.imshow(test_mask, cmap=plt.cm.gray, interpolation='bilinear')
plt.axis("off")plt.show()#存储
wc.to_file(path.join(d, "love.png"))

词云图:

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/475586.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

运行命令

cmd--------CMD命令提示符ipconfig-------检查IPtsshutdn-------60秒倒计时关机命令cleanmgr-------垃圾整理calc-----------启动计算器notepad--------打开记事本logoff---------注销命令winver---------检查Windows版本mstsc----------远程桌面连接转载于:https://www.cnblog…

[Hands On ML] 2. 一个完整的机器学习项目(加州房价预测)

文章目录1. 项目介绍2. 性能指标3. 确定任务类型4. 查看数据5. 创建测试集6. 数据可视化7. 查找数据关联8. 特征组合9. 为算法准备数据9.1 数据清洗9.2 处理文本特征10. 自定义转换器11. 特征缩放12. 转换流水线Pipeline13. 训练模型14. 交叉验证15. 微调模型15.1 网格搜索15.2…

线性回归 - 机器学习多元线性回归 - 一步一步详解 - Python代码实现

目录 数据导入 单变量线性回归 绘制散点图 相关系数R 拆分训练集和测试集 多变量线性回归 数据检验(判断是否可以做线性回归) 训练线性回归模型 先甩几个典型的线性回归的模型,帮助大家捡起那些年被忘记的数学。 ● 单变量线性回归&…

Checking battery state… ubuntu

Checking battery state… 当ubuntu启动的时候遇到 “Checking battery state….”时, 按下ctrl alt F1,进入终端,使用管理员权限执行下列代码 sudo rm /etc/X11/xorg.confsudo reboot 转载于:https://www.cnblogs.com/hjslovewcl/archive/2011/06/30/…

层次分析法AHP - 代码注释多 - ( 数据建模 Python代码)

实际生活中,往往有一些很复杂的系统,我们没办法直观草率的确定权重,比如甲、乙、丙三人竞选总统,严谨的说,需要从三人的社交能力、管理能力、经济能力等方面来考虑,在每个方面,三位候选人的得分…

LeetCode 1155. 掷骰子的N种方法(DP)

1. 题目 这里有 d 个一样的骰子,每个骰子上都有 f 个面,分别标号为 1, 2, …, f。 我们约定:掷骰子的得到总点数为各骰子面朝上的数字的总和。 如果需要掷出的总点数为 target,请你计算出有多少种不同的组合情况(所…

Android 之自定义组件

1、如何在一个按钮上放上一张图片&#xff1f;把按钮和图片套在一个FrameLayout中 <!-- 必须将button和ImageView分别嵌套在两个LinearLayout中才能 实现将图片放在按钮上 --> <FrameLayout android:orientation"horizontal" android:layout_width&…

职业规划之后,还需要什么?职业规划与职业选择 - 续集

一时的想法写下&#xff0c;竟没想到会有很多的朋友的共鸣&#xff0c;几天前写下了一则文章&#xff1a;职业规划与职业选择 &#xff0c;写的目的只是自己的心得所绘。很多朋友朋友给我的写作提供了宝贵意见&#xff0c;自己以后也会注意的写作的。但是不免有时候是个人的及时…

LeetCode 1223. 掷骰子模拟(DP)

1. 题目 有一个骰子模拟器会每次投掷的时候生成一个 1 到 6 的随机数。 不过我们在使用它时有个约束&#xff0c;就是使得投掷骰子时&#xff0c;连续 掷出数字 i 的次数不能超过 rollMax[i]&#xff08;i 从 1 开始编号&#xff09;。 现在&#xff0c;给你一个整数数组 ro…

聚类分析 - K-means - Python代码实现

算法简介 K-means算法是很典型的基于距离的聚类算法&#xff0c;采用距离作为相似性的评价指标&#xff0c;即认为两个对象的距离越近&#xff0c;其相似度就越大。该算法认为簇是由距离靠近的对象组成的&#xff0c;因此把得到紧凑且独立的簇作为最终目标。 算法过程如下&…

安装“消息队列 (MSMQ)”

在 Windows Server 2008 or Windows Server 2008 R2 上安装消息队列 4 在服务器管理器中&#xff0c;单击“功能”。 在“功能摘要”下的右窗格中&#xff0c;单击“添加功能”。 在生成的窗口中&#xff0c;展开“消息队列”。 展开“消息队列服务”。 单击“目录服务集成…

数据归一化 - MinMaxScaler()/MaxAbsScaler() - Python代码

目录 归一化 数据归一化的背景介绍 MinMaxScaler&#xff1a;归一到 [ 0&#xff0c;1 ] MaxAbsScaler&#xff1a;归一到 [ -1&#xff0c;1 ] 标准化 去均值&#xff0c;方差规模化 归一化 数据归一化的背景介绍 在之前做聚类分析的时候我们发现&#xff0c;聚类的…

LeetCode 673. 最长递增子序列的个数(DP)

1. 题目 给定一个未排序的整数数组&#xff0c;找到最长递增子序列的个数。 示例 1: 输入: [1,3,5,4,7] 输出: 2 解释: 有两个最长递增子序列&#xff0c;分别是 [1, 3, 4, 7] 和[1, 3, 5, 7]。示例 2: 输入: [2,2,2,2,2] 输出: 5 解释: 最长递增子序列的长度是1&#xff0c;…

loadrunner 配置远程监控windows服务器系统资源

今天决定监控远程windows xp上的系统资源&#xff0c;本来以为应该很好连接&#xff0c;在同一个局域网内&#xff0c;结果出了一堆问题&#xff0c;可能是第一次就让我遇到了一个棘手的操作系统&#xff0c;郁闷&#xff01; &#xff08;1&#xff09;保证装有loadrunner的测…

Python数据清洗 - 洗什么?怎么洗?看完就明白了

目录 缺失值处理 删除缺失值 插补缺失值 不处理缺失值 重复值处理 异常值处理 遍历查找异常值&#xff0c;并根据规则调整大小 删除异常值 视为缺失值后进行插补 数据挖掘过程中&#xff0c;采集的原始数据里存在着各种不利于分析与建模工作的因素&#xff0c;比如数…

LeetCode 1090. 受标签影响的最大值(优先队列)

1. 题目 我们有一个项的集合&#xff0c;其中第 i 项的值为 values[i]&#xff0c;标签为 labels[i]。 我们从这些项中选出一个子集 S&#xff0c;这样一来&#xff1a; |S| < num_wanted对于任意的标签 L&#xff0c;子集 S 中标签为 L 的项的数目总满足 < use_limit…

PHP中的get_defined_funciton和get_defined_vars

1 <?php 2 $zongzi "adfasdf"; 3 //将$zongzi作为数组的key,adfasdf作为数组的值返回 4 $val (get_defined_vars()); 5 echo $val[zongzi]; 6 7 8 function zongzi(){ 9 echo "adfads";10 }11 1…

合并数据 - 合并多个Excel文件并转成CSV - Python代码

在工作中&#xff0c;有时候因为部门间的数据权限问题&#xff0c;推送数据的时候往往是通过邮件完成&#xff0c;对于量大的数据&#xff0c;往往会拆成很多个excel发送&#xff0c;到下一个部门导入数据库之前&#xff0c;总是需要先将所有excel合成一个excel&#xff0c;再导…

LeetCode 524. 通过删除字母匹配到字典里最长单词(双指针)

1. 题目 给定一个字符串和一个字符串字典&#xff0c;找到字典里面最长的字符串&#xff0c;该字符串可以通过删除给定字符串的某些字符来得到。 如果答案不止一个&#xff0c;返回长度最长且字典顺序最小的字符串。如果答案不存在&#xff0c;则返回空字符串。 示例 1: 输入…

poj 3748 位操作

#include<iostream> //位运算using namespace std;int main(){int r,x,y; scanf("%x,%d,%d",&r,&x,&y); rr&(~(1<<x)); rr|(1<<y); rr|(1<<(y-1)); rr&(~(1<<(y-2))); printf("%x\…