python词云的简单使用

词云的生成

  • 所需库
  • 代码实现
    • wordclod参数说明
    • 具体实现
  • 效果展示

所需库

  • wordcloud, jieba, imageio
  • wordcloud 词云库,用来统计文本文档里面出现的高频词汇,或者句子,以图片可视化的方式显示出来
  • jieba库,分割中文的库,把较长的句子分割成有意义的词汇
  • imageio库, 读取图片,把词云图片以你对应的图片样式显示
  • 安装方式
pip install wordcloud, jieba, imageio

代码实现

wordclod参数说明

width 词云图片宽度,默认400像素height 词云图片高度 默认200像素background_color 词云图片的背景颜色,默认为黑色background_color='white'font_step 字号增大的步进间隔 默认1号font_path 指定字体路径 默认None,对于中文可用font_path='msyh.ttc'mini_font_size 最小字号 默认4号max_font_size 最大字号 根据高度自动调节max_words 最大词数 默认200stop_words 不显示的单词 stop_words={"python","java"}Scale 默认值1。值越大,图像密度越大越清晰prefer_horizontal:默认值0.90,浮点数类型。表示在水平如果不合适,就旋转为垂直方向,水平放置的词数占0.9?relative_scaling:默认值0.5,浮点型。设定按词频倒序排列,上一个词相对下一位词的大小倍数。有如下取值:“0”表示大小标准只参考频率排名,“1”如果词频是2倍,大小也是2倍mask 指定词云形状图片,默认为矩形注意增加参数contour_width和contour_color设置轮廓宽度和颜色 # 轮廓线通过以下代码读入外部词云形状图片(需要先pip install imageio安装imageio)

具体实现

  • 这里拿来诗人舒婷的《致橡树》作为demo
  • https://zhidao.baidu.com/question/13111198
  • coding
import os
if not os.path.exists('E:\\python\\joy\\wordcloud'): # 创建文件夹os.mkdir('E:\\python\\joy\\wordcloud')os.chdir('E:\\python\\joy\\wordcloud')def jieba_deom3(shape, input_txt, output_img):import imageioimport jieba mk = imageio.imread(shape)# 五角星形状的词图w = wordcloud.WordCloud(mask=mk)# 词图对象w = wordcloud.WordCloud(width=100, height=100,scale=15, background_color='white',font_path='msyh.ttc', # 针对中文,微软雅黑mask=mk # imageio读取的形状)# 用jieba分割词txt = ''with open(input_txt, encoding='utf-8') as f:txt += f.read()text_list = jieba.lcut(txt)# 把分割好的词组列表转换为有空格的字符串string = " ".join(text_list)w.generate(string)w.to_file(output_img)passjieba_deom3('wjx1.png', 'zxs.txt', 'zxs.png')
# 注意这个形状的图片,一定要对,不然报错,或者是个正方形
  • 送上小星星

效果展示

  • 写在最后

诗人也不愿要奉献施舍的爱情,不愿作整日为绿阴鸣唱的小鸟,不愿作一厢情愿的泉源,不愿作盲目支撑橡树的高大山峰。诗人不愿在这样的爱情中迷失自己。爱情需要以人格平等、个性独立、互相尊重倾慕、彼此情投意合为基础。

最后,关注,点赞,收藏😄😀

学习地址:
https://github.com/TommyZihao/zihaowordcloud

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/420904.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

(一)Neo4j在Centos7虚拟机上的安装

1、什么是图数据库? 图数据库是基于数学里图论的思想和算法而实现的高效处理复杂关系网络的新型数据库系统。图形数据库善于高效处理大量的、复杂的、互连的、多变的数据。其计算效率远远高于传统的关系型数据库。图形数据库在社交网络、实时推荐、征信系统、人工智…

(二)Cypher语言常用方法举例

1、概述 “Cypher”是一个描述性的类Sql的图操作语言。相当于关系数据库的Sql,可见其重要性!其语法针对图的特点而设计,非常方便和灵活。没有Join,是一大特点!学好Cypher是学好Neo4j的关键,也是核心所在&a…

github 人像卡通化探索项目

把项目下载到本地 下载地址 https://github.com/minivision-ai/photo2cartoon安装依赖库 python 3.7 # 3.x版本都可 pytorch 1.4 tensorflow-gpu 1.14 # tesorflow 得是1.0版本,2.0版本语法部分改变,不然项目运行会出错 face-alignment dlibpytorch …

CVE-2013-3897漏洞成因与利用分析

CVE-2013-3897漏洞成因与利用分析 1. 简介 此漏洞是UAF(Use After Free)类漏洞,即引用了已经释放的内存。攻击者可以利用此类漏洞实现远程代码执行。UAF漏洞的根源源于对对象引用计数的处理不当,比如在编写程序时忘记AddRef或者多…

(三)Neo4j自带northwind案例--Cypher语言应用

0、概述 通过该案例,应用Cypher查询语言,感受Neo4j套路。官方的用此案例的用意: The Northwind Graph demonstrates how to migrate(迁移) from a relational database to Neo4j(把一个负责的多表关系数据…

RDIFramework.NET 中多表关联查询分页实例

RDIFramework.NET 中多表关联查询分页实例 RDIFramework.NET 中多表关联查询分页实例 RDIFramework.NET,基于.NET的快速信息化系统开发、整合框架,给用户和开发者最佳的.Net框架部署方案。该框架以SOA范式作为指导思想,作为异质系统整合与互操…

(六)Neo4j综合项目

0、概述 本文以热播电视剧《人民的名义》中的人物关系为数据基础,抛开案例本身的内容,本项目的意义在于指出使用Neo4j数据库的一般流程是什么?包括数据的导入、操作、查询、展示,从而体会出与传统数据库相比Neo4j在处理图数据的巨…

过滤器filter,监听器listener

目录1. filter过滤器1.1 原理1.2 配置1.3 过滤掉脏话demo2. listener监听器2.1 作用2.2 ServletContextListener demo1. filter过滤器 作用:过滤servlet,jsp,js,css,图片对象,以及一切在服务器,客户端想访…

(一)elasticsearch6.1.1安装详细过程

1、配置java环境 检查java环境 满足elasticsearch6.1.1java环境要求; 2、安装ElasticSearch6.1.1 ①为es新生成用户、用户组 su root groupadd esgroup useradd ela -g esgroup -p 5tgbhu8[rootlocalhost fibonacci]# su ela Attempting to create directory /h…

使用jdk DOM,SAX和第三方jar包DOM4J创建,解析xml文件

xml的创建,解析1. 什么是xml文件1.1 什么是xml文件1.2 解析xml的方式,优缺点2. 使用dom操作xml文件2.1 使用dom创建xml文件2.2 使用dom解析xml文件2.3 使用dom对xml文件增删改3. 使用SAX解析xml文件4. 使用DOM4J操作xml文件4.1 使用DOM4J创建xml文件4.2 …

(二)ElasticSearch6.1.1 Python API

0、准备开启数据库 ① 关闭Linux防火墙,这个很重要,否则API总是报错连不上。 # 查看防火墙状态 firewall-cmd --state# 关闭防护墙 systemctl stop firewalld.service# 开启防火墙 systemctl start firewalld.service# 重启防火墙 systemctl restart f…

sqlite3数据库使用

SQLite简介 SQLite是一个软件库,实现了自给自足的、无服务器的、零配置的、事务性的 SQL 数据库引擎。SQLite是一个增长最快的数据库引擎,这是在普及方面的增长,与它的尺寸大小无关。SQLite 源代码不受版权限制。 什么是sqlite SQLite是一…

(三)ElasticSearch的基本概念

0、面向文档 应用中的对象很少只是简单的键值列表,更多时候它拥有复杂的数据结构,比如包含日期、地理位置、另一个对象或者数组。 总有一天你会想到把这些对象存储到数据库中。将这些数据保存到由行和列组成的关系数据库中,就好像是把一个丰…

ajax下拉框省市级联动

目录效果sql数据前后台代码实现效果 初始访问页面 选中省会,自动刷新页面 sql数据 -- 省市联动数据CREATE TABLE PROVINCE (PID NUMBER PRIMARY KEY,PNAME VARCHAR(20) NOT NULL )SELECT * FROM PROVINCEINSERT INTO province VALUES (1, 北京市); INSERT I…

python的with关键字

with语句适用于对资源进行访问的场合,确保不管使用过程中是否发生异常都会执行必要的“清理”操作,释放资源,比如文件使用后自动关闭、线程中锁的自动获取和释放等。with表达式其实是try-finally的简写形式。但是又不是全相同。 ""…

pgm2

MRF 笔记 我们先讨论引入 MRF 的必要性。经典的例子就是四个 r.v.s 连成一个正方形的结构的时候,我们没法通过 BN 获得给定对角线两个 r.v.s 而剩下的条件独立(不都是 d-sep),反过来如果希望通过 MRF 刻画某些 BN 也是不可行的&am…

(六)ElasticSearch 6.1.1聚合查询

1 普通类型 1.1 基本操作 1.1.1 导入实战数据 数据字段如下: 字段类型作用pricelong汽车售价colortext汽车颜色maketext汽车品牌solddate销售日期 # 创建索引 PUT /cars {"mappings" : {"transactions" : {"properties" : {"…