《Python 黑科技》一键分析评论关键词,制作精美词云

本文重点

  1. 学会抓取文章评论

  2. 学会文本分词、制作词云

目录

🍑 一、抓取全部评论

🍞 1、找到评论接口

🍏 2、Python 获取评论

🏈 二、文本分词、词云制作

🍋 1、文本分析

🍐 2、生成词云

🏆 3、初步效果-模糊不清

⚽️ 4、最终效果-高清无马


🍑 一、抓取全部评论

吾的这篇文章,有 1022 次评论,一条条看,吾看不过来,于是想到 Python 词云,提取关键词,倒也是一桩趣事。

评论情况: {'android': 545 次, 'ios': 110 次, 'pc': 44 次, 'uniapp': 1 次}

一个小细节:给我评论的设备中,安卓苹果比是 5:1。

Building prefix dict from the default dictionary ... Loading model cost 0.361 seconds. Prefix dict has been built successfully.

🍞 1、找到评论接口

  1. 打开 chrome 浏览器,开发者模式

  2. 点击评论列表(图标 1)

  3. 点击接口链接(图标 2)

  4. 查看 response 返回值(评论结果的 json 格式)

🍏 2、Python 获取评论

def get_comments(articleId):# 确定评论的页数main_res = get_commentId(articleId,1)pageCount = json.loads(main_res)['data']['pageCount']comment_list,comment_list2 = [],[]source_analy = {}for p in range(1,pageCount+1):res = get_commentId(articleId, p)try:commentIds = json.loads(res)['data']['list']for i in commentIds:commentId = i['info']['commentId']userName = i['info']['userName']nickName = i['info']['nickName']  ## 获取用户名source_dvs = i['info']['commentFromTypeResult']['key']   # 操作设备content = i['info']['content']comment_list.append([commentId, userName, nickName, source_dvs, content])comment_list2.append("%s 丨 %s"%(userName, nickName))if source_dvs not in source_analy.keys():source_analy[source_dvs] = 1else:source_analy[source_dvs] = source_analy[source_dvs] + 1# print(source_analy)except:print('本页失败!')print('评论数:' + str(len(comment_list)))return source_analy, comment_list, comment_list2

🏈 二、文本分词、词云制作

🍋 1、文本分析

西红柿采用的是 结巴 分词, 和 wordcloud。

# -*- coding:utf8 -*-
import jieba
import wordcloud

代码实现

seg_list = jieba.cut(comments, cut_all=False)  # 精确模式word = ' '.join(seg_list)

🍐 2、生成词云

背景图 西红柿采用的是 心形图片

pic = mpimg.imread('/Users/pray/Downloads/aixin.jpeg')

完整代码:

def word_cloud(articleId):source_analy, comment_list, comment_list2 = get_comments(articleId)print("评论情况:", source_analy)comments = ''for one in comment_list:comment = one[4]if 'face' not in comment:comments = comments + commentseg_list = jieba.cut(comments, cut_all=False)  # 精确模式word = ' '.join(seg_list)pic = mpimg.imread('/Users/pray/Downloads/aixin.jpeg')wc = wordcloud.WordCloud(mask=pic, font_path='/Library/Fonts/Songti.ttc', width=1000, height=500,background_color='white').generate(word)

🏆 3、初步效果-模糊不清

西红柿发现文字模糊、图像曲线边缘不清晰的问题。

于是,指定分辨率,高清整起来。

# 保存
plt.savefig('xin300.png', dpi=300) #指定分辨率保存

⚽️ 4、最终效果-高清无马

原来粉丝评论最多的词是:不错、厉害、收藏了、支持、好

谢谢你们,我爱粉丝,粉丝爱我

🍟 Python 理论基础:全网最全丨 Python 快速入门专栏

🍇 Python 练习应用:全网最黑丨 Python 黑科技专栏

类别信息技术智库
🍅 学习资料8大类丨20G,含编程语言、算法、大数据生态圈、数据仓库、前端等
🍅 行业资料领取 PPT 模板、简历模板、行业经典书籍 PDF
👇👇👇 领取资料、技术互助 👇👇👇

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/494275.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

PANS最新脑神经科学研究:激活一种新语言并不费力气

来源:中国生物技术网美国纽约大学的一项新研究发现,我们在不同语言之间切换时的大脑工作模式,这使我们对双语现象有了新的理解。纽约大学博士生Esti Blanco-Elorrieta是这项研究的第一作者,他解释说:“多语言能力者的一…

百度地图之添加覆盖物

本文主要讲解如何实现在百度地图上添加覆盖物 1.承载数据的实体 我们从服务器返回的数据部分,最终可能是个Json数组,我们需要转换为实体集合,即下面的Info.java 我直接在实体类中声明了一个静态列表集合,模拟从服务器返回的数据…

能力认证计划 -- 名企内推保 offer 直通车

CSDN 能力认证的目的:清晰定义工程师能力模型,面向开发者、技术爱好者、在校大学生等群体,通过机试(真人露脸、全程录屏、限时提交)测出应试者的真能力,筛选合格软件人才,建立应聘者与企业之间的…

fprintf 和 perror 的理解1

程序中的两种出错处理&#xff1a; 第一种: 用fprintf 2: #include <string.h> 3: #include <errno.h> 4: #include <stdlib.h> 5: 1: #include <stdio.h> 6: int main(void) 7: { 8: FILE *fp; 9: 10: if((fp fopen("1.c…

全文!《2018中国IoT报告》!

来源&#xff1a;5G9月15-18日&#xff0c;我国物联网领域规格最高、规模最大的国家级博览会——2018世界物联网博览会将在无锡举行。作为2018世界物联网博览会的重要活动之一&#xff0c;9月14日受大会组委会委托&#xff0c;中国经济信息社在无锡发布《2017-2018年中国物联网…

CSDN客户端实现

本文主要讲解实现了一个CSDN的安卓客户端&#xff0c;主要知识点如下 java爬虫获取网页数据 将java程序打包成jar包 FragmentviewpagerTabPageIndicator实现Tab效果 gestureImageView实现放大缩小图片imageLodar实现异步加载图上 XListView实现下拉刷新 java爬虫获取网页资源…

抓住金三银四的尾巴,解锁程序员面试《刷题神器》

点赞 ➕ 评论 ➕ 收藏 三连再看你最帅 刷题 不仅能掌握知识&#xff0c;快速学习进步。 更能轻松搞定面试&#xff0c;尤其是有的大厂 钟爱问算法题&#xff0c;你不刷就不会&#xff0c;就会被pass。同时&#xff0c;刷题能陶冶情操&#xff0c;避免老年痴呆 &#x1f60b; …

腾讯AI Lab开源世界首款自动化模型压缩框架PocketFlow:将深度学习装进口袋

来源&#xff1a;腾讯AI 实验室腾讯AI Lab机器学习中心今日宣布成功研发出世界上首款自动化深度学习模型压缩框架——PocketFlow&#xff0c;并即将在近期发布开源代码。这是一款面向移动端AI开发者的自动模型压缩框架&#xff0c;集成了当前主流&#xff08;包括腾讯AI Lab自研…

【拿走不谢】大数据高效查询神器--bitmap

背景 在hive中使用Roaring64Bitmap实现精确去重功能 主要目的&#xff1a; 提升 hive 中精确去重性能&#xff0c;代替hive 中的 count(distinct uuid)&#xff1b;节省 hive 存储 &#xff0c;使用 bitmap 对数据压缩 &#xff0c;减少了存储成本&#xff1b;提供在 hive 中…

Android之智能问答机器人

本文主要利用图灵机器人的接口&#xff0c;所做的一个简单的智能问答机器人 实现 由于发送与接收消息都是不同的listView&#xff0c;所以要用有两个listVeiw的布局文件 接收消息布局文件 <?xml version"1.0" encoding"utf-8"?> <LinearLa…

5张图告诉你:同样是职场人,差距怎么这么大?

点赞 ➕ 评论 ➕ 收藏 养成三连好习惯 在职场中&#xff0c;我们常常会听到各种各样的抱怨&#xff1a; &#x1f469;‍⚖️‍ 小A: 凭什么别人每次述职绩效都是优秀呀&#xff1f; 感觉TA也没干啥呀! &#x1f575; 小B: 凭啥这个事情&#xff0c;领导指派TA去对接呀&#…

史上最强阵容,BAT大佬携手AI顶级大咖齐聚上海话AI

来源&#xff1a;网易智能9月17日上午&#xff0c;齐聚各路大佬的2018世界人工智能大会在上海西岸艺术中心开幕。不得不说&#xff0c;这次大会的嘉宾阵容&#xff0c;为中国科技界史上最强&#xff0c;没有之一。今天主论坛亮相会议并发表演讲的大咖&#xff0c;除了聚集了BAT…

没错,列式存储非常牛。但是,Ta还可以更高效

很多数据仓库产品都采用了列式存储。如果数据表的总列数很多而计算涉及的列很少&#xff0c;采用列存就只读取需要的列即可&#xff0c;能够减少硬盘访问量&#xff0c;提高性能。 特别是数据量非常大时&#xff0c;硬盘扫描和读取的时间占比很大&#xff0c;这时候列存的优势…

Android实现电子邮箱客户端

本文主要讲述了安卓平台上利用QQ邮箱SMTP协议&#xff0c;POP3协议发送与接收消息的实现 发送邮件核心代码 import java.security.Security; import java.util.Date; import java.util.Properties; import javax.mail.Authenticator; import javax.mail.Message; …

谷歌AI涉足艺术、太空、外科手术,再强调AI七原则

来源&#xff1a;网易智能9月18日上午&#xff0c;Google在上海的2018世界AI 大会上举办了一场名为“AI触手可及”的主题论坛。在论坛上&#xff0c;Google全球副总裁、工程研究员Jay Yagnik 携Google 不同领域的研究者发表了演讲&#xff0c;重点阐述了Google AI在自家产品上的…

单个手指的手势识别

本文来自http://blog.csdn.net/hellogv/ &#xff0c;引用必须注明出处&#xff01; 本文把Aforge的运动识别与前面介绍的手写识别融合在一起&#xff0c;实现单个手指的手势识别。下图演示了本文代码运行的结果&#xff0c;图片有点大&#xff0c;请稍候。。。 我预先让程序学…

Apifox:满足你对 Api 的所有幻想

文章目录⌚️ 一、Api 管理的难点在哪&#xff1f;&#x1f4f1; 二、Apifox 是什么&#xff1f;&#x1f4bf; 三、接口设计 (接口文档)⌨️ 3.1 接口文档&#x1f4bb; 3.2 快速上手&#x1f5a8; 3.3 接口路径&#x1f4bd; 四、团队管理&#x1f4fd; 4.1 权限管理⏱ 4.2 项…

百度地图综合

本文主要包括百度地图API的综合应用&#xff0c;主要内容如下 地图图层展示&#xff0c;包括热力图与实时路况图 添加覆盖物&#xff0c;包括图片&#xff0c;文字&#xff0c;折线等地图控制&#xff0c;包括俯视&#xff0c;旋转&#xff0c;放大&#xff0c;缩小等定位&…

国内Api行业,可以内卷到什么程度?

随着移动应用以及智能设备爆发增长&#xff0c;同时越来越多的零售商、媒体、政府和金融服务公司开始公开Web API&#xff0c;API的使用越来越多。 现在&#xff0c;每日API调用量在不断飙升&#xff0c;早在2009年&#xff0c;Facebook每天API调用量就已经达到了50亿。如何能…

自动驾驶关键技术报告:惯性导航和背后的芯片大战

来源&#xff1a;智东西摘要&#xff1a;惯性导航将成为自动驾驶定位信息融合的中心。惯性导航系统由于具有的输出信息不间断、不受外界干扰的独特优势&#xff1b;同时可以将多种传感器的信息以及车身信息进行更深层次的融合&#xff0c;为决策层提供精确可靠的连续的车辆位置…