python打开文件要wordcloud吗,使用python创建wordcloud

我正在尝试在清理文本文件后在python中创建wordcloud,

我得到了所需的结果,即大多数在文本文件中使用但无法绘制的单词.

我的代码:

import collections

from wordcloud import WordCloud

import matplotlib.pyplot as plt

file = open('example.txt', encoding = 'utf8' )

stopwords = set(line.strip() for line in open('stopwords'))

wordcount = {}

for word in file.read().split():

word = word.lower()

word = word.replace(".","")

word = word.replace(",","")

word = word.replace("\"","")

word = word.replace("“","")

if word not in stopwords:

if word not in wordcount:

wordcount[word] = 1

else:

wordcount[word] += 1

d = collections.Counter(wordcount)

for word, count in d.most_common(10):

print(word , ":", count)

#wordcloud = WordCloud().generate(text)

#fig = plt.figure()

#fig.set_figwidth(14)

#fig.set_figheight(18)

#plt.imshow(wordcloud.recolor(color_func=grey_color, random_state=3))

#plt.title(title, color=fontcolor, size=30, y=1.01)

#plt.annotate(footer, xy=(0, -.025), xycoords='axes fraction', fontsize=infosize, color=fontcolor)

#plt.axis('off')

#plt.show()

编辑:

用以下代码绘制wordcloud:

wordcloud = WordCloud(background_color='white',

width=1200,

height=1000

).generate((d.most_common(10)))

plt.imshow(wordcloud)

plt.axis('off')

plt.show()

但是得到TypeError:预期的字符串或缓冲区

当我用.generate(str(d.most_common(10))尝试上述代码时

形成的单词云在几个单词之后显示’trotrophe(‘)符号

using Jupyter Notebook | python3 | Ipython

解决方法:

首先将此文件Symbola.ttf下载到以下脚本的当前文件夹中.

架构文件:

file.txt Symbola.ttf my_word_cloud.py

file.txt的:

foo buzz bizz foo buzz bizz foo buzz bizz foo buzz bizz foo buzz bizz

foo foo foo foo foo foo foo foo foo foo bizz bizz bizz bizz foo foo

my_word_cloud.py:

import io

from collections import Counter

from os import path

import matplotlib.pyplot as plt

from wordcloud import WordCloud

d = path.dirname(__file__)

# It is important to use io.open to correctly load the file as UTF-8

text = io.open(path.join(d, 'file.txt')).read()

words = text.split()

print(Counter(words))

# Generate a word cloud image

# The Symbola font includes most emoji

font_path = path.join(d, 'Symbola.ttf')

word_cloud = WordCloud(font_path=font_path).generate(text)

# Display the generated image:

plt.imshow(word_cloud)

plt.axis("off")

plt.show()

结果:

Counter({'foo': 17, 'bizz': 9, 'buzz': 5})

lAu9B.png

请参阅许多其他示例,在这里我为您创建了一个简单示例:

标签:word-cloud,python,matplotlib,plot

来源: https://codeday.me/bug/20191013/1905740.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/428393.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

手机百度输入法的用户体验

我的手机用的是手机百度输入法,首先从用户界面来说吧,默认的界面简洁,但是特别大方。不会让人觉得界面简单。而且还提供了几个不同的界面风格,可供不同喜好的用户选择,这就十分人性化了。然后就是从记住用户选择来说&a…

java商城_java开源商城系统的优势是什么?

电商平台开发大家都知道,java开放性源码提供了开发商便利,经过开发商对源码的二次修改,在系统的易用性和实用性方面都得到了空前的突破,真正达到了只要会打字就能够建设专业水准的商城系统。采用java开源商城系统的商城都有安全、…

php无限加载,php递归无限页面加载

我有一个linux bash脚本,它不断运行并请求一个php页面.php页面做了一些魔术,在500ms之后bash脚本再次请求php页面,php做了一些魔术.这日复一日地运行,但有时bash崩溃,这意味着我需要登录到机器并再次运行脚本.不,我正在寻找完全由PHP驱动的解决方案.我做了以下测试,但是不行.文…

hbase rest api接口链接管理【golang语言版】

# go-hbase-resthbase rest api接口链接管理【golang语言版】关于hbase的rest接口的详细信息可以到官网查看[http://hbase.apache.org/book.html#_rest]测试环境:ubuntu16.04hadoop2.4.0hbase1.2.6jdk1.8.0_141联系作者:qizexi163.com快速体验&#xff1…

裸奔浏览器_躲进浏览器隐私模式就安全了吗?相当于闭着眼睛裸奔

「隐私模式」是浏览器的一个功能,记得小淙第一次看到这个充满安全感的名字时,心中一阵狂喜,如获珍宝,从此走上了不归路。多少个寂寞难耐的夜,我默默打开隐私模式,页面中间黑色的小人是我最默契的战友&#…

oracle表回退语句,5 Oracle笔试题

一、选择题(每题2分)1.你要对操纵Oracle数据库中的数据。下列哪个选项表示Oracle中select语句的功能,并且不需要使用子查询?A.可以用select语句改变Oracle中的数据 B.可以用select语句删除Oracle中的数据C.可以用selec…

Linux学习之基本介绍

技术不分年龄高低,只分水平高低。 搞技术25k以下是不看天赋的,25k以上是要看天赋的。 1U服务器,2U服务器,刀片服务器。程序都是运行在服务器上的。 榜样的力量是无穷的。--MK。 汇编语言跟硬件息息相关,汇编语言开发的…

什么是ie浏览器_?IE 浏览器为什么不招人待见?

在一篇博客中,微软将 Internet Explorer 称为「兼容性解决方案」,而不是浏览器。在全球最大的桌面操作系统上推广浏览器,成功看起来是理所当然的,但 IE 却没能做到。在上周发布的一篇博客中,微软将 Internet Explorer …

ORACLE使用copy方式存储迁移,详细讲解Oracle数据库的数据迁移方法

添加所需的表空间和用户到目标数据库中;安装所需的SQL*Net2或者Net8软件,并配置用于连接数据库的别名。在DOS命令提示符下设置oracle_sidOracle7_sid。以Internal用户账号连接SQL*PLUS。创建一个从Oracle7数据库到Oracle8i数据库的…

JS脚本病毒调试脚本-Trojan[Downloader]:JS/Nemucod

1、前言 遇到Trojan[Downloader]:JS/Nemucod需要分析,这款病毒主要为js运行。从网上各种找js调试方法。发现52的帖子还挺沾边的。 TrojanDownloader:JS/Nemucod分析【原创翻译】https://www.52pojie.cn/forum.php?modviewthread&tid513740 结果用帖子里的代码一…

富士通台式电脑_电脑bios怎么进入-电脑bios进入方法介绍

很多用户在使用电脑时候想要进入BIOS系统,但是不知道该按那个按键操作,其实不同品牌的电脑和不同主板的电脑进入BIOS按键都是不一样的,小编整理了一写不同电脑进入BIOS的方法,一起来看看吧~ 电脑bios进入方法介绍: 一、…

四阶混合累积量matlab_12m氢燃料电池城市客车电电混合动力系统设计方案

文章来源:《12m氢燃料电池城市客车电电混合动力系统设计方案》随着氢燃料电池技术的进步,氢燃料电池客车的优势越发明显,和传统客车比,零污染、零排放;和纯电动客车比,加注燃料速度快、续航里程更…

bzoj1094[ZJOI2007]粒子运动 计算几何

1094: [ZJOI2007]粒子运动 Time Limit: 10 Sec Memory Limit: 162 MBSubmit: 658 Solved: 164[Submit][Status][Discuss]Description 阿Q博士正在观察一个圆形器皿中的粒子运动。不妨建立一个平面直角坐标系,圆形器皿的圆心坐标为(x0, y0),半径为R。器…

linux自动挂载磁盘命令,使用mount命令配置Linux自动挂载

使用mount命令来挂载硬件,在Linux重启后这些挂载信息会丢失,因此对应磁盘这类硬件,需要配置自动挂载来保证系统重启时进行自动挂载。自动挂载信息保存在文件/etc/fstab文件中查看该文件的数据:rootlocalhost dev]# cat /etc/fstab…

webview 防止js注入_天台县js聚合物水泥防水涂料的作用

天台县js聚合物水泥防水涂料的作用 2、JS防水涂料建筑胶粉与801建筑胶水的区别在哪?彩色聚氨酯防水涂料施工要点: 彩色聚氨酯防水涂料注意事项:1、材料必须按配比混合搅拌均匀,混合后的物料应在20分钟内用完。2、施工温度宜在5℃以上&#x…

10年老电脑如何提速_电脑越用越卡?如何简单升级,让你的旧笔记本瞬间提速...

很多人的笔记本电脑使用几年之后往往越来越卡,体验也随之下降。其实,很多时候你无需购置新品,对现有的电脑进行简单的配置升级就能让它提速,变得更为流畅,如果只是用于日常码字、办公,完全还能胜任&#xf…

linux服务器每次重启卡住,运维如何解决Linux服务器重启后命令无法正常使用的问题...

原标题:运维如何解决 Linux 服务器重启后命令无法正常使用的问题前提:在Linux系统中安装ASM,安装完ASM和Oracle数据库时都是正常使用的,但在重启服务器后Oracle相关命令不识别。1、截图如下:2、查看环境变量是否正常命…

Linux下DNS简单部署(主从域名服务器)

一、DNS简介DNS(Domain Name System),域名系统,因特网上作为域名和IP地址相互映射的一个分布式数据库,能够使用户更方便的访问互联网,而不用去记住能够被机器直接读取的IP数串。通过主机名,最终…

web 三联发票针式打印_打印机共享操作,其实没想象的那么难

工作中桌面型的打印机一般是用USB直连一台主机,然后共享给其它电脑进行打印的,如:针式发票打印机、喷墨打印机等,这时就会涉及到一个打印机共享的操作,今天就跟大家分享下共享操作。共享操作:在主机安装好打…

linux网卡IO,浅谈Linux 网络 I/O 模型简介(图文)

1、介绍Linux 的内核将所有外部设备都看做一个文件来操作(一切皆文件),对一个文件的读写操作会调用内核提供的系统命令,返回一个file descriptor(fd,文件描述符)。而对一个socket的读写也会有响应的描述符,称为socket fd(socket文…