关注
#!/usr/bin/env python
# -*- encoding: utf-8 -*-
# @Date : 2015-03-07 12:41:14
# @Author : NSSimacer
# @Email : wuxiaoqiang1020@gmail.com
# @Version : 1.0
import re
def count_words(file_name):
'''
统计纯英文文本中单词出现的个数
'''
words = []
words_dict = {}
lines_count = 0
with open(file_name, 'r') as f:
for line in f:
lines_count += 1
# 过滤非英文单词
words.extend(re.findall(r'[a-zA-Z0-9]+', line.strip()))
for word in words:
if word not in words_dict:
words_dict[word] = 1
else:
words_dict[word] += 1
return lines_count, len(words), words, words_dict
if __name__ == '__main__':
file_name = 'plain_text.txt'
result = count_words(file_name)
print 'In file:', file_name
print 'Total Lines:', result[0]
print 'Total Words:', result[1]
print 'Words:', ', '.join(result[2])
print 'Frequency of each word:'
for key, value in result[3].items():
print '%s: %s' % (key, value)
查看原帖
点赞 1
相关推荐
点赞 评论 收藏
分享
牛客热帖
更多
正在热议
更多
# 为了去实习,我赌上了___ #
15837次浏览 172人参与
# 摸鱼被leader发现了怎么办 #
70356次浏览 402人参与
# uu们,春招你还来吗? #
8011次浏览 63人参与
# 2025年终总结 #
8464次浏览 157人参与
# 十二月请对我好一点 #
21167次浏览 291人参与
# 父母对你找工作是助力还是阻力? #
10909次浏览 176人参与
# 一人推荐一个值得做的项目 #
7422次浏览 103人参与
# 运营每日一题 #
112438次浏览 885人参与
# 哪一瞬间让你觉得“这班不如不上” #
8369次浏览 124人参与
# 降低公积金和取消房补怎么选 #
23059次浏览 78人参与
# 高薪高压 vs 低薪wlb,你怎么选? #
8171次浏览 92人参与
# 工作前VS工作后,你的心态变化 #
10747次浏览 139人参与
# 工作中出现了XX情况正常吗 #
26752次浏览 197人参与
# 公司福利里最没用的一项是啥 #
5468次浏览 87人参与
# 晒一晒你收到的礼盒 #
87623次浏览 428人参与
# 回顾今年你干过的最“勇”的一件事 #
11087次浏览 148人参与
# 如果可以,你希望哪个公司来捞你 #
154265次浏览 649人参与
# 第一份工作能做外包吗? #
85074次浏览 569人参与
# 工作中哪个瞬间让你想离职 #
109023次浏览 770人参与
# 一人一道大厂面试题 #
108024次浏览 1239人参与

