面试中的场景题,到底该怎样回答比较好?

之前有一次电话面试阿里后端实习,面试官出了一道如下的题目:
有一个10G大小的文件,里面无序存放着一个个的人的名字记录。如张三、李四、王五。其中可能会有重复,如张三可能出现100次。
问:怎样用只有1G内存的计算机来找出文件中出现次数最多的10个名字?具体怎么做?

我当时的回答:
就是把这大文件拆分成每个大概800M大小的小文件,然后,统计每个文件中每个名字出现的次数,用一个HashMap存起来,key放名字,value放出现的次数
最终拿到每个小文件中姓名的出现次数,会产生10个map,然后,再合并这10个map到一个map里,根据value值,找出最大的10个值即可。

说完后,面试官又问了有没有其它的方法,我反问了面试官能不能用缓存,他说不能。后来就想不到其它的想法了
又过了一会,面试官提示了用堆排序,我顿时恍然大悟,赶紧补了几句,说堆排序分为大顶堆和小顶堆,这里用大顶堆刚好。
随后,就结束了面试!

对此,我想请教牛友们以下几个问题:

1、这种类似的文件场景题,主要考察什么?
2、面试官心中是否有标准答案,或者他所期望的回答是什么?
3、回答这类问题,需要把握的核心是什么?

#面试题目#
全部评论
可以看看左神的一本书,程序员代码面试指南
1 回复 分享
发布于 2021-06-08 22:01
这个问题的核心是  数组中最大的k个数,只不过面试官换成具体的了,换成我也这样考.
点赞 回复 分享
发布于 2021-06-15 14:39
校友哈哈,我上次是被问到10g文件用1g内存怎么排序 😂😂😂😂
点赞 回复 分享
发布于 2021-06-13 10:38
你有没有考虑到,你的内存可能根本存放不下这10个map
点赞 回复 分享
发布于 2021-06-09 03:07
为什么不用小顶堆呢,小顶堆不是只用和堆顶比较吗?效果不是更好吗
点赞 回复 分享
发布于 2021-06-08 22:20

相关推荐

鼠鼠没有找到暑期实习,简历太空了,感觉直接去秋招会完蛋,这个时间点找个日常实习混个简历,边实习边准备秋招有没有搞头啊
梦想是成为七海千秋:可以的完全可以的,找不到暑期就找日常,秋招之前还是有很多时间可以实习的,哪怕只实习了一个月都可以写在简历上
点赞 评论 收藏
分享
董春花_:真诚无罪,别听评论区那个清华的。按他的逻辑,你有分寸人觉得你是不想来,你积极热情人觉得你太想来,你好骗人就可你养鱼,你不好骗人觉得你服从性不高,合着**做啥都白扯。保持谦逊礼貌与对offer的积极性不才是最正常,也正确的做法么?招聘方的错强加到应聘者身上,***何不食肉糜。
点赞 评论 收藏
分享
评论
5
25
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务