Python分析《红楼梦》词频
#CalRedBuildingDreamV1.py
import jieba
txt = open("RedBuildingDream.txt", "r", encoding = "utf-8").read()
words = jieba.lcut(txt)
counts = {
   }
for word in words:
    if len(word) ==1:
        continue
    else:
        counts[word] = counts.get(word,0) +1
items = list(counts.items())
items.sort(key=lambda x:x[1],reverse=True)
for i in range(15):
    word, count = items[i]
    print("{0:<10}{1:>5}".format(word,count))
结果显示
宝玉 3748
 什么 1613
 一个 1451
 贾母 1228
 我们 1220
 那里 1174
 凤姐 1100
 王夫人 1011
 你们 1009
 如今 999
 说道 973
 知道 967
 老太太 966
 起来 949
 姑娘 941
说明贾宝玉,贾母和凤姐是《红楼梦》里最多被提到的人。
 正浩创新EcoFlow公司福利 510人发布
正浩创新EcoFlow公司福利 510人发布