python统计《论语》里的词频

利用jieba库统计《论语》里的词频

#CalLunyuV1.py

import jieba
txt = open("lunyu.txt", "r", encoding = "utf-8").read()
words = jieba.lcut(txt)
counts = {
   }
for word in words:
    if len(word) ==1:
        continue
    else:
        counts[word] = counts.get(word,0) +1
items = list(counts.items())
items.sort(key=lambda x:x[1],reverse=True)
for i in range(15):
    word, count = items[i]
    print("{0:<10}{1:>5}".format(word,count))

结果显示
君子 63
孔子 34
子路 34
可以 25
夫子 23
仁者 22
何如 20
可谓 19
子贡曰 18
不知 16
小人 15
不可 15
颜渊 15
子贡 12
不能 12

结果说明:君子是孔子及门徒经常强调的概念,子路是和孔子交往频次最多的,其次是子贡和颜渊。

全部评论

相关推荐

苗条的伊泽瑞尔最喜欢...:同28届被压力了,电科✌就不能去卷算法吗?把Java留给我们双非卷
投递快手等公司10个岗位
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务