python打开文件要wordcloud吗,使用python创建wordcloud

我正在尝试在清理文本文件后在python中创建wordcloud,

我得到了所需的结果,即大多数在文本文件中使用但无法绘制的单词.

我的代码:

import collections

from wordcloud import WordCloud

import matplotlib.pyplot as plt

file = open('example.txt', encoding = 'utf8' )

stopwords = set(line.strip() for line in open('stopwords'))

wordcount = {}

for word in file.read().split():

word = word.lower()

word = word.replace(".","")

word = word.replace(",","")

word = word.replace("\"","")

word = word.replace("“","")

if word not in stopwords:

if word not in wordcount:

wordcount[word] = 1

else:

wordcount[word] += 1

d = collections.Counter(wordcount)

for word, count in d.most_common(10):

print(word , ":", count)

#wordcloud = WordCloud().generate(text)

#fig = plt.figure()

#fig.set_figwidth(14)

#fig.set_figheight(18)

#plt.imshow(wordcloud.recolor(color_func=grey_color, random_state=3))

#plt.title(title, color=fontcolor, size=30, y=1.01)

#plt.annotate(footer, xy=(0, -.025), xycoords='axes fraction', fontsize=infosize, color=fontcolor)

#plt.axis('off')

#plt.show()

编辑:

用以下代码绘制wordcloud:

wordcloud = WordCloud(background_color='white',

width=1200,

height=1000

).generate((d.most_common(10)))

plt.imshow(wordcloud)

plt.axis('off')

plt.show()

但是得到TypeError:预期的字符串或缓冲区

当我用.generate(str(d.most_common(10))尝试上述代码时

形成的单词云在几个单词之后显示’trotrophe(‘)符号

using Jupyter Notebook | python3 | Ipython

解决方法:

首先将此文件Symbola.ttf下载到以下脚本的当前文件夹中.

架构文件:

file.txt Symbola.ttf my_word_cloud.py

file.txt的:

foo buzz bizz foo buzz bizz foo buzz bizz foo buzz bizz foo buzz bizz

foo foo foo foo foo foo foo foo foo foo bizz bizz bizz bizz foo foo

my_word_cloud.py:

import io

from collections import Counter

from os import path

import matplotlib.pyplot as plt

from wordcloud import WordCloud

d = path.dirname(__file__)

# It is important to use io.open to correctly load the file as UTF-8

text = io.open(path.join(d, 'file.txt')).read()

words = text.split()

print(Counter(words))

# Generate a word cloud image

# The Symbola font includes most emoji

font_path = path.join(d, 'Symbola.ttf')

word_cloud = WordCloud(font_path=font_path).generate(text)

# Display the generated image:

plt.imshow(word_cloud)

plt.axis("off")

plt.show()

结果:

Counter({'foo': 17, 'bizz': 9, 'buzz': 5})

lAu9B.png

请参阅许多其他示例,在这里我为您创建了一个简单示例:

标签:word-cloud,python,matplotlib,plot

来源: https://codeday.me/bug/20191013/1905740.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/428393.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java商城_java开源商城系统的优势是什么?

电商平台开发大家都知道,java开放性源码提供了开发商便利,经过开发商对源码的二次修改,在系统的易用性和实用性方面都得到了空前的突破,真正达到了只要会打字就能够建设专业水准的商城系统。采用java开源商城系统的商城都有安全、…

裸奔浏览器_躲进浏览器隐私模式就安全了吗?相当于闭着眼睛裸奔

「隐私模式」是浏览器的一个功能,记得小淙第一次看到这个充满安全感的名字时,心中一阵狂喜,如获珍宝,从此走上了不归路。多少个寂寞难耐的夜,我默默打开隐私模式,页面中间黑色的小人是我最默契的战友&#…

什么是ie浏览器_?IE 浏览器为什么不招人待见?

在一篇博客中,微软将 Internet Explorer 称为「兼容性解决方案」,而不是浏览器。在全球最大的桌面操作系统上推广浏览器,成功看起来是理所当然的,但 IE 却没能做到。在上周发布的一篇博客中,微软将 Internet Explorer …

富士通台式电脑_电脑bios怎么进入-电脑bios进入方法介绍

很多用户在使用电脑时候想要进入BIOS系统,但是不知道该按那个按键操作,其实不同品牌的电脑和不同主板的电脑进入BIOS按键都是不一样的,小编整理了一写不同电脑进入BIOS的方法,一起来看看吧~ 电脑bios进入方法介绍: 一、…

四阶混合累积量matlab_12m氢燃料电池城市客车电电混合动力系统设计方案

文章来源:《12m氢燃料电池城市客车电电混合动力系统设计方案》随着氢燃料电池技术的进步,氢燃料电池客车的优势越发明显,和传统客车比,零污染、零排放;和纯电动客车比,加注燃料速度快、续航里程更…

bzoj1094[ZJOI2007]粒子运动 计算几何

1094: [ZJOI2007]粒子运动 Time Limit: 10 Sec Memory Limit: 162 MBSubmit: 658 Solved: 164[Submit][Status][Discuss]Description 阿Q博士正在观察一个圆形器皿中的粒子运动。不妨建立一个平面直角坐标系,圆形器皿的圆心坐标为(x0, y0),半径为R。器…

linux自动挂载磁盘命令,使用mount命令配置Linux自动挂载

使用mount命令来挂载硬件,在Linux重启后这些挂载信息会丢失,因此对应磁盘这类硬件,需要配置自动挂载来保证系统重启时进行自动挂载。自动挂载信息保存在文件/etc/fstab文件中查看该文件的数据:rootlocalhost dev]# cat /etc/fstab…

webview 防止js注入_天台县js聚合物水泥防水涂料的作用

天台县js聚合物水泥防水涂料的作用 2、JS防水涂料建筑胶粉与801建筑胶水的区别在哪?彩色聚氨酯防水涂料施工要点: 彩色聚氨酯防水涂料注意事项:1、材料必须按配比混合搅拌均匀,混合后的物料应在20分钟内用完。2、施工温度宜在5℃以上&#x…

10年老电脑如何提速_电脑越用越卡?如何简单升级,让你的旧笔记本瞬间提速...

很多人的笔记本电脑使用几年之后往往越来越卡,体验也随之下降。其实,很多时候你无需购置新品,对现有的电脑进行简单的配置升级就能让它提速,变得更为流畅,如果只是用于日常码字、办公,完全还能胜任&#xf…

linux服务器每次重启卡住,运维如何解决Linux服务器重启后命令无法正常使用的问题...

原标题:运维如何解决 Linux 服务器重启后命令无法正常使用的问题前提:在Linux系统中安装ASM,安装完ASM和Oracle数据库时都是正常使用的,但在重启服务器后Oracle相关命令不识别。1、截图如下:2、查看环境变量是否正常命…

web 三联发票针式打印_打印机共享操作,其实没想象的那么难

工作中桌面型的打印机一般是用USB直连一台主机,然后共享给其它电脑进行打印的,如:针式发票打印机、喷墨打印机等,这时就会涉及到一个打印机共享的操作,今天就跟大家分享下共享操作。共享操作:在主机安装好打…

linux网卡IO,浅谈Linux 网络 I/O 模型简介(图文)

1、介绍Linux 的内核将所有外部设备都看做一个文件来操作(一切皆文件),对一个文件的读写操作会调用内核提供的系统命令,返回一个file descriptor(fd,文件描述符)。而对一个socket的读写也会有响应的描述符,称为socket fd(socket文…

win10远程桌面连接_如何正确选择WIN10系统版本,Windows10系统各版本之间的区别...

截至2020年,Windows 10的市场份额达到了54.62%,成为了Windows家庭中占比最高的成员。微软也于2020年初对Windows 7做了不再进行技术支持的声明!毋庸置疑的是,Windows 10的系统会逐渐占有更多的比例,并且逐步取代现有的…

win10进程太多怎么优化_用过最好用的Win10优化软件,全方面优化和管理!

文 | Allen 主播 | 蓝儿喵本文首发:www.zylxb.comHi,大家好,欢迎来到:无优质,不分享!搜罗君的藏宝阁:优搜罗(id:usouluo),由于公众号改版,建议大家星标置顶…

vb.net怎么调用fastreport报表_财务分析-企业财务管理报表模板制作实现智能化的财务运营...

随着我国经济的不断发展,企业在市场环境中的竞争压力也越来越大,只有具备充足的活力和竞争力的企业才可以在竞争激烈的市场环境中处于不败之地。财务分析作为企业财务管理的重要手段之一,它能够为企业的一切财务活动提供必要的依据&#xff0…

linux编译ffmepg,在Ubuntu下编译FFmpeg

在之前,我们成功地使用mingwmsys在Windows平台下编译FFmpeg(见 http://www.linuxidc.com/Linux/2014-11/109839.htm),并生成了ffplay.exe。现在再在Ubuntu平台上重新编译一次。相对于在Windows平台上编译需要的旷日持久而且异常艰难的工作,Ub…

C++为什么空格无法输出_47个快捷键、50个CAD技巧,终于知道为什么别人用CAD总比我快了!...

终于知道为什么别人用CAD总比我快了,原来他们早就掌握了这些实用的CAD技巧,还没看完我就默默地转了,总有用得到的时候。47个快捷键1. 创建直线的快捷方式是L空格2. 创建圆的快捷方式是C空格3. 创建圆弧的快捷方式是A空格4. 创建矩形的快捷方式…

Flume环境搭建_五种案例(转)

Flume环境搭建_五种案例 http://flume.apache.org/FlumeUserGuide.html A simple example Here, we give an example configuration file, describing a single-node Flume deployment. This configuration lets a user generate events and subsequently logs them to the con…

linux配置服务器超时退出,Linux下实现不活动用户登录超时后自动登出

摘要:方法一:通过修改.bashrc或.bash_profile文件来实现通过修改home目录下的.bashrc或.bash_profile文件...方法一:通过修改.bashrc或.bash_profile文件来实现通过修改home目录下的.bashrc或.bash_profile文件来实现。这两个文件选择其中一个…

只读属性怎么来的初值_设置Mysql表只读,关键时刻或许能救你一命

作为一名数据库运维人员,应该遇到过表记录被异常全表更新,这个时候该怎么办。作为Mysql数据库运维人员,第一反应,应该就是上报,然后联系开发人员,确认此表作用,然后再确定恢复方案。在这里举一个…