大文件统计字符串问题

在面试的时候被问到一道题目：
一个2g的文件，每行都有一个大数字（max_value这种）如：
3123183193891
21313123131313
32
1231343123131 1231231223131231

统计所有相同数字出现的次数并返回？
楼主第一思路是：Hashmap-》但是爆了怎么办？
第二思路：分治，但是读文件是bufferReader，怎么分治？
第三思路：多线程，同样是遇到流的问题，怎么划分？
各位大佬有什么思路吗？

如果想要排序输出？思路：大数组快排

#笔试题目##阿里巴巴#

全部评论

推荐最新楼层

给个offer养家糊口

红棉小冰_平台工程部门_Java开发

哈希

点赞回复分享

发布于 2018-05-22 19:25

明月照相机

阿里巴巴_阿里云_开发

hash到不同文件，不同文件分别统计，最后归并就行了

点赞回复分享

发布于 2018-05-22 18:20

浮夸balabala

楼主

湖北大学 Java

没有大老了？都秀offer去了嘛

点赞回复分享

发布于 2018-05-22 18:09

06-12 11:19

门头沟学院运营

实习提前跑路

那种要求实习六个月的，先答应着，到后面实习完三个月就跑路的话，企业会给开实习证明吗😂

Sinxtier_：实习证明除非是学校要不然都没什么用

点赞评论收藏

06-13 12:10

吉首大学财务

这个岗位关闭了是稳了吗？

昨天投的简历，今天下午给打了电话，然后现在去看岗位就关闭了！是稳了还是陪跑，害怕😱加上最近期末，别搞😭求一个下周面试顺利通过 

一表renzha：之前我投了之后就关闭了，然后我没面上，岗位又放开了

点赞评论收藏

05-24 14:12

门头沟学院 Java

学傻了，帮我看看眼睛是不是坏了

六百六十六演都不演了

牛客497609833号：20块一个月😆😆

点赞评论收藏

05-11 11:58

中国矿业大学 Java

大佬们，为啥这个简历练小厂都不回复啊😦

man,我是真的一点不想考研啊😭😭

程序员牛肉：主要是因为小厂的资金本来就很吃紧，所以更喜欢有实习经历的同学。来了就能上手。而大厂因为钱多，实习生一天三四百的就不算事。所以愿意培养你，在面试的时候也就不在乎你有没有实习（除非是同级别大厂的实习。）按照你的简历来看，同质化太严重了。项目也很烂大街。要么换项目，要么考研。你现在选择工作的话，前景不是很好了。

点赞评论收藏