美团数据仓库工程师一面 40min

👥 面试题目
1.自我介绍,能不能从几个方面说一下项目
2.有什么收获
3.简历里面哪个技术学的最好
4.spark的client模式和集群模式
5.yarn
6.能够重分区的算子
7.为什么用rdd,不用df和ds,他们的区别
8.为什么spark比mapreduce更快(磁盘io和进程线程模型)
9.spark也会OOM和溢写磁盘啊,mapreduce也有缓冲区啊,都是内存计算,为什么更快(统一内存模型和流水线加载内存,面试官说没到点上)
10.真实的优化经历,不要那些从网上背的八股
11.什么是aqe
12.为什么是动态调整,具体体现在哪方面(好像没说到他要的东西😭)
11.hdfs查看文件大小命令,这个没答出来
12.写一个SQL
13.反问:技术栈和建议
14.数据治理问题

第一次面试太紧张了,话术出大问题了😭,说话不流畅,面试官说自我介绍不太过关,回答思路有些混乱了,要分点回答,多练练表达。
全部评论
是实习嘛?
点赞 回复 分享
发布于 2024-12-22 11:08 四川
佬有offer了吗
点赞 回复 分享
发布于 2024-07-06 16:34 湖北
蚂蚁HC还考虑吗?
点赞 回复 分享
发布于 2024-06-06 19:47 浙江
佬是本吗
点赞 回复 分享
发布于 2024-05-10 09:11 北京
老哥,哪个部门,风控吗
点赞 回复 分享
发布于 2024-04-27 13:02 北京
点赞 回复 分享
发布于 2024-04-27 12:51 山西

相关推荐

一面(面试官很好!很有耐心!)1.spark中rdd叫弹性分布式数据集,这个弹性的含义2.小文件的危害以及怎么处理3.spark中宽依赖、窄依赖4.stage的划分5.kafka怎么保证数据不重复消费(没回答上,但说了怎么重复消费数据)6.checkpoint机制7.spark的三种join(boardcast join,sort merge join,shuffle hash join)7.四道sql(前两道很简单,第三道次日留存和七日留存,第四道连续登录问题)8.算法题:移动最少区间个数 使得剩余区间无重叠1. 输入:[1,2][2,3][4,6][1,3]2. 输出:13. 解释:移除[1,3]后,剩余区间无重叠(面试后在牛客网看见有人分享这道算法题)一面最后面试官还问我以后的计划,我说打算先实习明年春招边实习边找工作,她居然问我没想留着字节吗(我当然想!)中间有些问题没想起来,耗时1小时40分钟二面(面试官很好!问的都是和数仓相关的,结合我的实习问)1.之前工作都干了什么2.之前实习搭建数仓的结构3.了解事实表吗,了解维度表吗4.怎么和其他人对接的5.你属于风控部门,但主要是构建数仓开发,那有没有和其他数据开发人员交流过6.你只有一段实习吧,那实习前后有什么感悟吗7.为什么要选择数据开发(我说因为之前实习是干数仓的,他说不要因为之前干什么就觉得以后三十年干什么,实习还是丰富点,看看干什么)8.最后反问二面耗时50分钟,感觉面试官对我回答的第七个问题不满意,只是我明年要毕业了,得多来一份垂直的实习建议多复习spark、hive方面的八股文、概念问题,实习生主要负责离线数仓开发
点赞 评论 收藏
分享
综合体验: 差,面试官没看简历,没准备好面试问题,指望候选人无靶射击猜他的心思感觉这个面试官不仅对自己的业务不熟,连要提什么问题都没想好,指望候选人自己猜他要问的啥面试官也有实习的么?自己的业务名词都说不清楚,还得楼主给他补充唯一说出来的完整专业名词是云真机和API接口面试问题:1. 自我介绍介绍过程中,听到他不断翻简历的声音,为了配合他看完,楼主无限延长介绍时间到他翻结束2. 最近的项目经历楼主说了一半感觉他一点都没听懂,又做了详细解释,后来听他的语气不想继续听了,就后面加速结束3. 面试官思考了1分钟,(嗯,空气很尴尬)你测过app端么?4. 如果我给你一个测试项目,你要怎么保证产品质量?楼主反问,不假设测试场景,直接说么?回答:是的楼主从测试方案设计、测试用例、评审、测试轮次、测试过程、异常情况、测试报告,以及bug验证收敛,里面的各个注意点都说了一遍,包括用什么测试技术(因为没有测试场景,只说了一些通用技术)然后说楼主说的太low, emm,楼主表示很不理解, 难道你平常测试全是敏捷测试么? 想到什么测什么?这些流程都不用走?据楼主后期探口风,他想听的是怎么测白盒测试,那你为什么不直接问“怎么测白盒”呢?
点赞 评论 收藏
分享
评论
12
45
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务