原标题:Python编程小技巧:如何统计序列中元素的出现频度
实际案例
某随机序列中,找到出现次数最高的三个元素,他们的出现次数是多少?
对某英文文章的单词进行词频统计,找到出现次数最高的10个单词,出现次数是多少?
普通做法:
from random import randint# #使用列表解析生成30个元素(在0~20范围内)data = [randint(0,20) for _ in xrange(30)]print type(data)# 使用列表创建字典.data为key值,value为0c = dict.fromkeys(data,0)print c# 使用for循环遍历data,遇到一个x,计数器c[x]就会增加1for x in data:
c[x] +=1print c
c1= {k:v for k,v in c.iteritems()}print c1#根据字典的值对于字典的项进行排序,d[1]为值。d[0]为键stat = sorted(c.iteritems(),key= lambda d:d[1],reverse=True)print stat
某随机序列中,找到出现次数最高的三个元素
from random import randintfrom collections import Counter
data = [randint(0,20) for _ in xrange(30)]
c2 = Counter(data)#传入需要几个数值smax = c2.most_common(5)
smin = c2.most_common()[:-6:-1]print smaxprint smin
对某英文文章的单词进行词频统计
import re
txt = open('code.txt').read()# print txt# 分割词:通过非字母字符word = re.split('\W*',txt)# print wordfrom collections import Counter
c3 = Counter(word)# print c3print c3.most_common(10)返回搜狐,查看更多
责任编辑: