面试中的场景题,到底该怎样回答比较好?

之前有一次电话面试阿里后端实习,面试官出了一道如下的题目:
有一个10G大小的文件,里面无序存放着一个个的人的名字记录。如张三、李四、王五。其中可能会有重复,如张三可能出现100次。
问:怎样用只有1G内存的计算机来找出文件中出现次数最多的10个名字?具体怎么做?

我当时的回答:
就是把这大文件拆分成每个大概800M大小的小文件,然后,统计每个文件中每个名字出现的次数,用一个HashMap存起来,key放名字,value放出现的次数
最终拿到每个小文件中姓名的出现次数,会产生10个map,然后,再合并这10个map到一个map里,根据value值,找出最大的10个值即可。

说完后,面试官又问了有没有其它的方法,我反问了面试官能不能用缓存,他说不能。后来就想不到其它的想法了
又过了一会,面试官提示了用堆排序,我顿时恍然大悟,赶紧补了几句,说堆排序分为大顶堆和小顶堆,这里用大顶堆刚好。
随后,就结束了面试!

对此,我想请教牛友们以下几个问题:

1、这种类似的文件场景题,主要考察什么?
2、面试官心中是否有标准答案,或者他所期望的回答是什么?
3、回答这类问题,需要把握的核心是什么?

#面试题目#
全部评论
可以看看左神的一本书,程序员代码面试指南
1 回复
分享
发布于 2021-06-08 22:01
为什么不用小顶堆呢,小顶堆不是只用和堆顶比较吗?效果不是更好吗
点赞 回复
分享
发布于 2021-06-08 22:20
乐元素
校招火热招聘中
官网直投
你有没有考虑到,你的内存可能根本存放不下这10个map
点赞 回复
分享
发布于 2021-06-09 03:07
校友哈哈,我上次是被问到10g文件用1g内存怎么排序 😂😂😂😂
点赞 回复
分享
发布于 2021-06-13 10:38
这个问题的核心是  数组中最大的k个数,只不过面试官换成具体的了,换成我也这样考.
点赞 回复
分享
发布于 2021-06-15 14:39

相关推荐

5 24 评论
分享
牛客网
牛客企业服务