python汉字同义词替换_python同义词替换的实现(jieba分词)

TihuanWords.txt文档格式

注意:同一行的词用单个空格隔开,每行第一个词为同行词的替换词。

年休假 年假 年休

究竟 到底

回家场景 我回来了

代码

import jieba

def replaceSynonymWords(string1):

# 1读取同义词表,并生成一个字典。

combine_dict = {}

# synonymWords.txt是同义词表,每行是一系列同义词,用空格分割

for line in open("TihuanWords.txt", "r", encoding='utf-8'):

seperate_word = line.strip().split(" ")

num = len(seperate_word)

for i in range(1, num):

combine_dict[seperate_word[i]] = seperate_word[0]

print(seperate_word)

print(combine_dict)

# 2提升某些词的词频,使其能够被jieba识别出来

jieba.suggest_freq("年休假", tune=True)

# 3将语句切分成单词

seg_list = jieba.cut(string1, cut_all=False)

f = "/".join(seg_list).encode("utf-8")

f = f.decode("utf-8")

print(f)

# 4返回同义词替换后的句子

final_sentence = " "

for word in f.split('/'):

if word in combine_dict:

word = combine_dict[word]

final_sentence += word

else:

final_sentence += word

# print final_sentence

return final_sentence

string1 = '年休到底放几天?'

print(replaceSynonymWords(string1))

结果

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我们。

本文标题: python同义词替换的实现(jieba分词)

本文地址: http://www.cppcns.com/jiaoben/python/298971.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/504193.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python去重语句_Python对列表去重的多种方法(四种方法)

无聊统计了下列表去重到底有多少种方法。下面小编给大家总结一下,具体内容详情如下; 开发中对数组、列表去重是非常常见的需求,对一个list中的id进行去重,有下面几种方法,前面两种方法不能保证顺序, 后面两…

【LeetCode笔记 - 每日一题】318. 最大单词长度乘积(Java、位运算)

文章目录题目描述思路 && 代码题目描述 挺不错!有bitmap的感觉了。 思路 && 代码 思路好想:两两对比,无公共判断,维护 res那么,如何进行公共判断?这个是主要的问题给每个字符串&#x…

技术交底软件_【干货分享】软件类产品如何进行专利挖掘与技术交底书撰写?...

“导读:在很多人的认知里,软件著作权是软件著作权,专利是专利,两者并没有太多关联。甚至有的人认为,软件产品只能申请软件著作权保护,不能申请专利保护。但是,当有人抄袭你的软件设计理念&#…

python如何爬虫eps数据_入门Python爬虫 -- 解析数据篇

元素)。一般情况下,网页头部分会定义HTML文档的编码以及网页的标题。而网页体部分则决定着一个网页中的正文内容。 # 一个最基本的HTML文档:# 网页头部分内容# 定义文档编码 文档的标题# 网页头部分内容结束# 网页体部分内容 文档的正文内容#…

【LeetCode笔记 - 每日一题】384. 打乱数组(Java、洗牌算法)

文章目录题目描述思路 && 代码题目描述 中等题,很赞!第一次碰到涉及洗牌算法的题有点涉及概率,主要是要实现公平的随机 思路 && 代码 采用了 Knuth 洗牌算法,可以看看这篇博客时间复杂度O(N),空间…

python redis模块connectionerror_ConnectionError:Error 2连接到Python/Django Redis中的unix套接字...

我正在尝试在一个全新的Mac上运行一个django项目。它一直工作到昨天,我不知道发生了什么,但突然间我开始收到Redis错误。在我可以加载不查询数据库的页面,但是一旦我尝试进行搜索(部分依赖于Redis),它就不起作用了。在有什么想法吗…

split函数python 未定义_python split函数基本用法

Python split()方法描述: Python split() 通过指定分隔符对字符串进行切片,如果参数 num 有指定值,则分割成 (num1) 个子字符串。语法: str.split(str"", numstring.count(str))参数: str——分隔符&#xf…

【LeetCode笔记 - 每日一题】423. 从英文中重建数字(Java、字符串、偏思路)

文章目录题目描述思路 && 代码题目描述 看了题目以后想到啥? 字符数量统计银行家算法逐个拆解建立数字 - 字符串的全局映射 思路 && 代码 抄答案了,采取了评论区三叶dalao的写法(不得不说,人家的处理写法是真…

字符串的地址_面试题:我有一批IPv6地址,你帮我想个办法来存储?

作者:dadiyang-绪扬来源:公众号Java面试那些事儿之前写了一篇《面试题:请用代码实现ip地址与int之间互换?》,有读者评论问到 IPv6 的转换方法,于是抽时间也自己实现了一下。面试官:我有一批IPv6…

【LeetCode笔记 - 每日一题】519. 随机翻转矩阵(Java、随机、双指针)

文章目录题目描述思路 && 代码题目描述 又是涉及到均等概率的随机~ 思路 && 代码 用的题解区三叶的代码~写得是真的好!不论题目,但抄一遍代码都能觉得有收获!维度转化:并没有创造二维数…

当前操作系统缺少黑体等字体_从零开始开发一个操作系统

在2019年的最后一天终于完成了整个系统的开发,并给它起名曰——Inios 。就如同文章名字一样,完全是从内核编写,非二次开发,从最初的“hello os”到初次有了系统的样子。主要用C语言编写,部分汇编语言。。整个操作系统完…

db设计专用excel_独家|自卸车如何实现侧板结构快速设计,减少重复工作?

作者| 张凯 汉阳专用汽车研究所科研技术部工程师 主要从事专用汽车产品结构仿真与轻量化随着城市发展的步伐不断加快,适用于各种工况的自卸车、城市渣土车市场需求量不断增大。目前市场自卸车车厢主要有两种:U型车厢和普通矩形车厢。其中U型车厢自卸车&a…

python 线程退出_python线程退出

广告关闭 腾讯云11.11云上盛惠 ,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高返5000元!如果某线程并未使用很多 io 操作, 它会在自己的时间片内一直占用处理器(和 gil)。 也就是说&…

【LeetCode笔记 - 每日一题】334. 递增的三元子序列(Java、偏思路)

文章目录题目描述思路 && 代码题目描述 可以转换成300. 最长递增子序列,再看结果是否大于3但上述写法O(N)复杂度实现不了,还是得用针对这道题的写法(见下) 思路 && 代码 学习了评论区大佬的写法,…

python判断密码强度_python实现密码强度校验

本文实例为大家分享了python实现密码强度校验的具体代码,供大家参考,具体内容如下一 校验规则规则1 密码长度8位以上规则2 密码需包含数字规则3 密码需包含大小写字母规则4 密码需包含特殊字符["", "-", "*", "/&quo…

python字典替换值_python字典改变value值方法总结

今天这篇文章中我们来了解一下python之中的字典,在这文章之中我会对python字典修改进行说明,以及举例说明如何修改python字典内的值。我们开始进入文章吧。 首先我们得知道什么是修改字典 修改字典 向字典添加新内容的方法是增加新的键/值对,修改或删除已…

【LeetCode笔记 - 每日一题】373. 查找和最小的 K 对数字(Java、堆、优先队列)

文章目录题目描述思路 && 代码题目描述 几天没打题,感觉脑子都是一团浆糊。。。。 升序:肯定得用这条件来优化复杂度数对:用 int[2] 来表示 思路 && 代码 看了题解区彤哥的思路,代码其实就 8 行 堆初始化&…

sql 循环处理数据_图文介绍 SQL 的三种查询计划处理模型,Spark 用了其中两个

我已经在之前的 《一条 SQL 在 Apache Spark 之旅(上)》、《一条 SQL 在 Apache Spark 之旅(中)》 以及 《一条 SQL 在 Apache Spark 之旅(下)》 这三篇文章中介绍了 SQL 从用户提交到最后执行都经历了哪些过程,感兴趣的同学可以去这三篇文章看看。这篇文章中我们主…

html调用python_flask之模板html中调用python函数方法

一:html里面可以调用python写的函数 add_template_global(调用函数的引用,"调用函数的名字") from common.libs.UrlManager importUrlManager app.add_template_global(UrlManager.buildStaticUrl,"buildStaticUrl…

python的threading是什么意思_Python中的threading模块是什么

threading提供了一个比thread模块更高层的API来提供线程的并发性。这些线程并发运行并共享内存。下面来看threading模块的具体用法:一、Thread的使用,目标函数可以实例化一个Thread对象,每个Thread对象代表着一个线程,可以通过sta…