大文件统计字符串问题

在面试的时候被问到一道题目:
一个2g的文件,每行都有一个大数字(max_value这种)如:
3123183193891
21313123131313
32
1231343123131 1231231223131231
统计所有相同数字出现的次数并返回?
楼主第一思路是:Hashmap-》但是爆了怎么办?
第二思路:分治,但是读文件是bufferReader,怎么分治?
第三思路:多线程,同样是遇到流的问题,怎么划分?
各位大佬有什么思路吗?
如果想要排序输出?思路:大数组快排

#笔试题目##阿里巴巴#
全部评论
没有大老了?都秀offer去了嘛
点赞 回复
分享
发布于 2018-05-22 18:09
hash到不同文件,不同文件分别统计,最后归并就行了
点赞 回复
分享
发布于 2018-05-22 18:20
联想
校招火热招聘中
官网直投
哈希
点赞 回复
分享
发布于 2018-05-22 19:25

相关推荐

点赞 收藏 评论
分享
牛客网
牛客企业服务