大文件统计字符串问题

在面试的时候被问到一道题目:
一个2g的文件,每行都有一个大数字(max_value这种)如:
3123183193891
21313123131313
32
1231343123131 1231231223131231
统计所有相同数字出现的次数并返回?
楼主第一思路是:Hashmap-》但是爆了怎么办?
第二思路:分治,但是读文件是bufferReader,怎么分治?
第三思路:多线程,同样是遇到流的问题,怎么划分?
各位大佬有什么思路吗?
如果想要排序输出?思路:大数组快排

#笔试题目##阿里巴巴#
全部评论
哈希
点赞 回复 分享
发布于 2018-05-22 19:25
hash到不同文件,不同文件分别统计,最后归并就行了
点赞 回复 分享
发布于 2018-05-22 18:20
没有大老了?都秀offer去了嘛
点赞 回复 分享
发布于 2018-05-22 18:09

相关推荐

05-24 14:12
门头沟学院 Java
点赞 评论 收藏
分享
程序员牛肉:主要是因为小厂的资金本来就很吃紧,所以更喜欢有实习经历的同学。来了就能上手。 而大厂因为钱多,实习生一天三四百的就不算事。所以愿意培养你,在面试的时候也就不在乎你有没有实习(除非是同级别大厂的实习。) 按照你的简历来看,同质化太严重了。项目也很烂大街。 要么换项目,要么考研。 你现在选择工作的话,前景不是很好了。
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务