关注
#!/usr/bin/env python
# -*- encoding: utf-8 -*-
# @Date : 2015-03-07 12:41:14
# @Author : NSSimacer
# @Email : wuxiaoqiang1020@gmail.com
# @Version : 1.0
import re
def count_words(file_name):
'''
统计纯英文文本中单词出现的个数
'''
words = []
words_dict = {}
lines_count = 0
with open(file_name, 'r') as f:
for line in f:
lines_count += 1
# 过滤非英文单词
words.extend(re.findall(r'[a-zA-Z0-9]+', line.strip()))
for word in words:
if word not in words_dict:
words_dict[word] = 1
else:
words_dict[word] += 1
return lines_count, len(words), words, words_dict
if __name__ == '__main__':
file_name = 'plain_text.txt'
result = count_words(file_name)
print 'In file:', file_name
print 'Total Lines:', result[0]
print 'Total Words:', result[1]
print 'Words:', ', '.join(result[2])
print 'Frequency of each word:'
for key, value in result[3].items():
print '%s: %s' % (key, value)
查看原帖
点赞 1
相关推荐
点赞 评论 收藏
转发
点赞 评论 收藏
转发
牛客热帖
正在热议
# 牛客帮帮团来啦!有问必答 #
873763次浏览 13845人参与
# 机械制造薪资爆料 #
325920次浏览 3784人参与
# 24届软开秋招面试经验大赏 #
1067216次浏览 16982人参与
# 晒一晒我的offer #
3522375次浏览 55759人参与
# 如果重来一次你还会读研吗 #
75175次浏览 727人参与
# offer决赛圈,我是怎么选的 #
204939次浏览 2300人参与
# 金三银四,你有感觉到吗 #
335468次浏览 4271人参与
# 国企vs私企,你更想去? #
25673次浏览 292人参与
# 求职遇到的搞笑事件 #
20018次浏览 291人参与
# 我发现了面试通关密码 #
357377次浏览 6725人参与
# 2023届毁约公司名单 #
94339次浏览 370人参与
# 0offer是寒冬太冷还是我太菜 #
434235次浏览 4981人参与
# 找工作,你会甘心进小厂还是猛冲大厂 #
38322次浏览 375人参与
# 你觉得找工作该拿大厂还是小厂练手 #
63685次浏览 903人参与
# 好工作要具备的条件有哪些? #
4521次浏览 61人参与
# 我在牛爱网找对象 #
51673次浏览 342人参与
# 海康威视求职进展汇总 #
104887次浏览 1246人参与
# 你会选择考研还是直接就业 #
79865次浏览 925人参与
# 实习与准备秋招该如何平衡 #
183039次浏览 3258人参与
# 职业发展规划如何回答 #
12761次浏览 89人参与