关注
大文件按某种哈希算法,切割成可读进内存的小文件,保证同一单词都放到一个小文件即可,然后分别统计每个小文件中单词的出现次数。最后用一个最小堆做统计。依次分别读取这些小文件,统计出top1000
。 这样应该可行吧
查看原帖
6 7
牛客热帖
更多
正在热议
更多
# 你想跟着什么样领导? #
5291次浏览 82人参与
# 什么样的背景能拿SSP? #
117202次浏览 410人参与
# 百度秋招 #
55871次浏览 394人参与
# 你的秋招白月光和意难平公司 #
6818次浏览 80人参与
# 分享一个让你热爱工作的瞬间 #
47351次浏览 412人参与
# 找实习是选平台还是选业务? #
10068次浏览 146人参与
# 从夯到拉,评价编程语言 #
4921次浏览 48人参与
# 秋招签约后的心态变化 #
105966次浏览 923人参与
# 职场吐槽大会 #
289620次浏览 2111人参与
# 每个月花钱最多的地方是? #
5155次浏览 76人参与
# xxx岗位的一天 #
9873次浏览 92人参与
# 作业帮求职进展汇总 #
77528次浏览 520人参与
# 十一月总结 #
13169次浏览 146人参与
# 你面试时吹过最大的牛 #
20021次浏览 116人参与
# 为什么国企只招应届生 #
218347次浏览 1262人参与
# 饿了么求职进展汇总 #
80197次浏览 684人参与
# 非技术求职现状 #
549366次浏览 3509人参与
# 实习学到最有价值的工作习惯 #
43514次浏览 378人参与
# 韶音科技求职进展汇总 #
64907次浏览 510人参与
# AI“智障”时刻 #
5955次浏览 54人参与
# 实习生如何通过转正 #
111659次浏览 1421人参与

