面试中的场景题,到底该怎样回答比较好?

之前有一次电话面试阿里后端实习,面试官出了一道如下的题目:
有一个10G大小的文件,里面无序存放着一个个的人的名字记录。如张三、李四、王五。其中可能会有重复,如张三可能出现100次。
问:怎样用只有1G内存的计算机来找出文件中出现次数最多的10个名字?具体怎么做?

我当时的回答:
就是把这大文件拆分成每个大概800M大小的小文件,然后,统计每个文件中每个名字出现的次数,用一个HashMap存起来,key放名字,value放出现的次数
最终拿到每个小文件中姓名的出现次数,会产生10个map,然后,再合并这10个map到一个map里,根据value值,找出最大的10个值即可。

说完后,面试官又问了有没有其它的方法,我反问了面试官能不能用缓存,他说不能。后来就想不到其它的想法了
又过了一会,面试官提示了用堆排序,我顿时恍然大悟,赶紧补了几句,说堆排序分为大顶堆和小顶堆,这里用大顶堆刚好。
随后,就结束了面试!

对此,我想请教牛友们以下几个问题:

1、这种类似的文件场景题,主要考察什么?
2、面试官心中是否有标准答案,或者他所期望的回答是什么?
3、回答这类问题,需要把握的核心是什么?

#面试题目#
全部评论
可以看看左神的一本书,程序员代码面试指南
1 回复 分享
发布于 2021-06-08 22:01
这个问题的核心是  数组中最大的k个数,只不过面试官换成具体的了,换成我也这样考.
点赞 回复 分享
发布于 2021-06-15 14:39
校友哈哈,我上次是被问到10g文件用1g内存怎么排序 😂😂😂😂
点赞 回复 分享
发布于 2021-06-13 10:38
你有没有考虑到,你的内存可能根本存放不下这10个map
点赞 回复 分享
发布于 2021-06-09 03:07
为什么不用小顶堆呢,小顶堆不是只用和堆顶比较吗?效果不是更好吗
点赞 回复 分享
发布于 2021-06-08 22:20

相关推荐

牛客41406533...:回答他在课上学,一辈子待在学校的老教授用三十年前的祖传PPT一字一句的讲解,使用谭浩强红皮书作为教材在devc++里面敲出a+++++a的瞬间爆出114514个编译错误来学这样才显得专业
点赞 评论 收藏
分享
来,说点可能被同行“骂”的大实话。🙊当初接数字马力Offer时,朋友都说:“蚂蚁的“内包”公司?你想清楚啊!”但入职快一年后的今天,我反而对他有了不一样的看法!🔹 是偏见?还是信息差!之前没入职之前外面都在说什么岗位低人一等这类。实际上:这种情况不可至否,不能保证每个团队都是其乐融融。但我在的部门以及我了解的周边同事都还是十分好相处的~和蚂蚁师兄师姐之间也经常开一些小玩笑。总之:身份是蚂蚁公司给的,地位是自己挣的(一个傲娇女孩的自述)。🔹 待遇?玩的就是真实!试用期工资全额发!六点下班跑得快(早9晚6或者早10晚7,动态打卡),公积金顶格交。别听那些画饼的,到手的钱和下班的时间才是真的(都是牛马何必难为牛马)。🔹 能不能学到技术?来了就“后悔”!我们拥有权限直通蚂蚁知识库,技术栈多到学不完。说“学不到东西”的人,来了可能后悔——后悔来晚了(哈哈哈哈,可以不学但是不能没有)!💥 内推地址:https://app.mokahr.com/su/ueoyhg❗我的内推码:NTA6Nvs走我的内推,可以直达业务部门,面试流程更快速,进度可查!今天新放HC,之前挂过也能再战!秋招已经正式开始啦~机会就摆在这,敢不敢来试一试呢?(和我一样,做个勇敢的女孩)
下午吃泡馍:数字马力的薪资一般哇,5年经验的java/测试就给人一万出头,而且刚入职第三天就让人出差,而且是出半年
帮你内推|数字马力 校招
点赞 评论 收藏
分享
评论
5
25
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务