python3分析《西游记》词频
#CalXiyoujiV1.py
import jieba
txt = open("xiyouji.txt", "r", encoding = "utf-8").read()
words = jieba.lcut(txt)
counts = {
   }
for word in words:
    if len(word) ==1:
        continue
    else:
        counts[word] = counts.get(word,0) +1
items = list(counts.items())
items.sort(key=lambda x:x[1],reverse=True)
for i in range(30):
    word, count = items[i]
    print("{0:<10}{1:>5}".format(word,count))
结果显示
 行者 4078
 八戒 1677
 师父 1604
 三藏 1324
 一个 1089
 大圣 889
 唐僧 802
 那里 767
 怎么 754
 菩萨 730
 我们 725
 沙僧 721
 不知 657
 和尚 644
 妖精 631
 两个 594
 甚么 551
 长老 512
 不是 507
 只见 485
 国王 456
 徒弟 439
 呆子 431
 老孙 408
 原来 390
 不敢 383
 大王 379
 如何 379
 悟空 379
 这个 372
 联想公司福利 1500人发布
联想公司福利 1500人发布