python词频统计结果写入csv_Python词频对比并导入CSV文件

需要用到的停用词库我上传到我的资源了,大家也可以自己去网上找!

本来是想把两个词频统计放入一个CSV文件中,但是无奈向已经存在的CSV文件中追加写入数据只能在已经存在的数据下面追加,也就是在同一列追加,不能另起一列添加数据,哪位兄弟怼出来了,欢迎回复或私信!

import jieba

import pandas as pd

import csv

import codecs

# num=jieba.lcut("中国是一个伟大的国家") # jieba库的测试

# print(num)

# 计算机专业的-1.txt

txt1=open("计算机专业.txt").read()

# 导入停用词库,过滤掉那些没用的词语,甚至都不是词语,比如标点符号,停用词在我的资源中有保存

stopwords=[line.strip() for line in open("停用词.txt").readlines()]

words1=jieba.lcut(txt1)

# print(words1)

counts1={}

for word1 in words1:

if len(word1)==1:

continue

else:

counts1[word1]=counts1.get(word1,0)+1

items1=list(counts1.items())

items1.sort(key=lambda x:x[1],reverse=True) # 根据词频进行降序排序

# print(items1)

file_csv=open("计算机专业词频.csv",'w+',newline='') #添加newline='',可以删除每行之间的空行

writer=csv.writer(file_csv)

writer.writerow(["词汇","词频"])

for data in items1:

writer.writerow(data)

file_csv.close()

# 法学专业的-2.txt

txt2=open("法学专业.txt").read()

words2=jieba.lcut(txt2)

counts2={}

for word2 in words2:

if len(word2)==1:

continue

else:

counts2[word2]=counts2.get(word2,0)+1

items2=list(counts2.items())

items2.sort(key=lambda x:x[1],reverse=True)

#print(items2)

# dataframe=pd.DataFrame({'items1_name':items1,'items2_name':items2})

# dataframe.to_csv("test.csv")

# file_csv=open('test.csv','a')

file_csv=open("法学专业词频.csv",'w+',newline='')

writer=csv.writer(file_csv)

writer.writerow(["词汇","词频"])

for data in items2:

writer.writerow(data)

file_csv.close()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/427026.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算公式

公式: 1 网段数2^可变的网络ID位数 2 一个网段中主机数2^主机ID位数(32-网络ID位数)-2 3 CIDR无类域名路由:网络ID位数不确定,CIDR表示法:IP/网络ID位数 10.0.0.100/8 255.0.0.0 4 网络IDIP与netmask 5 判断目标主机是…

实例3:python

#一个整数,它加上100后是一个完全平方数,再加上168又是一个完全平方数,请问该数是多少? #假设该数为 x。 #1、则:x 100 n2, x 100 168 m2 #2、计算等式:m2 - n2 (m n)(m - n) 168 #3、设置&…

php word excel,PHP 生成word 和 excel 文档

xmlns"http://www.w3.org/TR/REC-html40">word 中要显示的内容, 由于word支持html格式, 所以中间这一部分使用html文档就可以.?如果做文件下载:?header("Content-type:application/vnd.ms-word");header("Content-Disposition:filena…

实例4:python

#输入某年某月某日,判断这一天是这一年的第几天? #!/usr/bin/python -- coding: UTF-8 -- #!/usr/bin/python -- coding: UTF-8 -- yearint(2019) monthint(8) dayint(13) months1[0,31,60,91,121,152,182,213,244,274,305,335,366] #闰年 months2[…

堆排序python代码实现_python实现堆排序

首先理解堆排序:堆:堆栈是计算机的两种最基本的数据结构。堆的特点就是FIFO(first in first out)先进先出,这里的话我觉得可以理解成树的结构。堆在接收数据的时候先接收的数据会被先弹出。栈的特性正好与堆相反,是属于FILO(first…

jq多选框全选,多选

html代码 <input type"hidden" name"f_information_id" id"f_information_id" value"<?php echo $f_information_id?>"> <table class"table table-hover"><thead><tr><th> <inpu…

无人驾驶技术(1)

无人驾驶汽车有望将在未来20年内得到广泛运用&#xff0c;各大科技公司和汽车厂商均在加大对无人驾驶的投入&#xff0c;资本也纷纷抢滩该万亿市场。 无人驾驶汽车依靠人工智能、视觉计算、雷达、监控装置和全球定位系统协同合作&#xff0c;通过电脑实现无人驾驶&#xff0c;可…

php html登陆逻辑,保持演示文稿(HTML)和逻辑(PHP)分开

我试图保持演示和逻辑分离,而不使用像Smarty这样的模板引擎.到目前为止我所做的工作是有效的,但我不知道如果不在我的演示文稿中添加更多PHP而不是我想做的事情.例如,现在我有这样的事情&#xff1a;product_list.phptry {$query $conn->prepare("SELECT p.id,p.name,…

层次分析法matlab_建模开讲课程回放2:层次分析法及其MATLAB

建模开讲&#xff1a;层次分析法及其MATLAB实践主讲人&#xff1a;于晶贤老师课程回放地址如下&#xff0c;大家可以复制链接到地址栏即可观看&#xff0c;也可以直接点击左下角的观看&#xff1a;https://ke.qq.com/webcourse/index.html?fromqqchat&cid493154&term_…

raw input()和input区别

版本差异 raw_input——》python2版本 input——》python3版本 2. 输入格式差异 就是raw_input()随便输都是字符串&#xff0c;而input()必须按照Python的规则来~ raw_input() nameraw_input(‘输入姓名&#xff1a;’) ageraw_input(‘输入年龄’) 我们输入汉字的姓名和数…

防抖debounce和节流throttle

大纲 一、出现缘由 二、什么是防抖debounce和节流throttle 三、应用场景 3.1防抖 3.2节流 一、出现缘由 前端开发中&#xff0c;有一部分用户行为会频繁触发事件&#xff0c;而对于DOM操作&#xff0c;资源加载等耗费性能的处理&#xff0c;很可能导致卡顿&#xff0c;甚至浏览…

不同vlan之间如何ping通_【丰润达.安防百科】如何实现交换机不同VLAN、不同网段之间互访?...

交换机如何实现不同网段的互访&#xff1f;这个交换机完全可以实现&#xff0c;在实际项目中&#xff0c;交换机实现不同网段的互访用的也比较多&#xff0c;那么今天我们一起来看下。▎同一个vlan中&#xff0c;不同网段的主机如何互通同一个vlan&#xff0c;不同网段的主机如…

oracle字段加约束,Oracle数据库的字段约束创建和维护示例

创建Oracle数据库的字段约束&#xff1a;非空约束唯一约束对字段的取值的约束默认值外键约束create table tab_class(class_id number primary key,class_name varchar2(10) not null unique);create table tab_stu(stu_id number,--学生姓名&#xff0c;不能为空&#xff0c;不…

实例5:python

#输入三个整数x,y,z&#xff0c;请把这三个数由小到大输出。 l [] for i in range(3): x int(input(‘integer:\n’)) l.append(x) l.sort() print (l)

python识别节假日_Python3自动签到 定时任务 判断节假日的实例

不废话&#xff0c;直接上代码Python3.6签到代码&#xff0c;只需修改url&#xff0c;账号&#xff0c;密码即可&#xff0c;此处是登录时无验证登录&#xff0c;有验证码的自行补充# -*- coding:utf-8 -*-import jsonimport urllib.requestimport datetime# 模拟浏览器打开网站…

[BZOJ 5074] 小B的数字

题目传送-BZOJ5074 题意&#xff1a; T组数据 你有一个数组\(A\)&#xff0c;要求一个数组\(B\)\(B\)中的数都是2的正整数次幂。 令\(x\prod_{i1}^nB_i\),有\(x|B_i^{A_i},i\in1,2,3,...,n\)成立\(T \le 10,n \le 100000\) 题解&#xff1a; 首先\(B\)可以直接转化为每个元素的…

matlab数学实验第七章课后答案,matlab数学实验第七章答案

参考答案如下[单选,共用题干题] 患者男性&#xff0c;数学实验35岁&#xff0c;数学实验4天前因不慎划破皮肤后出现高热、皮肤瘀斑来院。查体&#xff1a;体温39.1℃&#xff0c;血压110&#xff0f;70mmHg&#xff0c;呼吸30次&#xff0f;分&#xff0c;心率107次&#xff0f…

Python List sort()方法

描述 sort() 函数用于对原列表进行排序&#xff0c;如果指定参数&#xff0c;则使用比较函数指定的比较函数。 语法 sort()方法语法&#xff1a; list.sort(cmpNone, keyNone, reverseFalse) 参数 • cmp – 可选参数, 如果指定了该参数会使用该参数的方法进行排序。 • key –…

oracle sql-1,Oracle – Oracle SQL(1)

Oracle – Oracle SQL(1)1. 简介(1) SQL : Structured Query Language&#xff0c;结构化查询语言&#xff0c;专门用于数据存取、数据更新及数据库管理等操作。(2) Oracle SQLDDL: Data Define Language数据定义语言包括CREATE、ALTER、DROP、TRUNCATE、COMMENT、RENAME等命令…

背景图层和普通图层的区别_008Photoshop四赞图层(图层样式)

图层过滤器图层滤镜&#xff0c;比如你只想看到像素图层&#xff0c;选择像素图层过滤器&#xff0c;这时就只能看到背景图层了(在图层面板)&#xff0c;如果再点击像素图层过滤器&#xff0c;其他图层又出现了。选中调整图层过滤器&#xff0c;就只能看到图层结构里的调整图层…