美团 大数据开发 暑期实习 一面

时长:1h
由于问题太多,分四类进行整理

0. 实习相关:之前有数据开发的实习经验,就问了之前工作有没有spark或者hivesql优化的经验;如何确保数据的有效性;实习公司数据存储格式(Parquet),还知道哪些数据存储格式
1. 大数据相关问题:为什么Spark比MR快;对Spark的了解;两个表join的优化方法(大小表join可以map-side join, join前过滤null值);HDFS的读写流程;Spark shuffle的过程(不太了解,只讲了个大概)

2. java基础的问题:HashMap底层原理(链表+数组 & 红黑树);又问了对红黑树的了解,能讲个大概原理就行,对细节要求不高

3. 数据库问题:数据库的索引的数据结构(这个不太了解);ACID;数据三范式(1NF, 2NF, 3NF)
做题:
1. sql题:从成绩表中得到总成绩排名第三的学生id和成绩;将表中一列转换成一行(e.g. 表属性为[dt, col1, col2], 转换为[dt, key, value], 其中key为col1,value为col1列中所有数据)
2. 快速排序(快排出场率真的好高)
3. 海量数据题:从两个数据量50亿的文件中得到相同url(hash写到多个小文件+hashmap)

#面经# #大数据# #暑期实习#
全部评论
兄弟是哪个部门的呀?
3 回复 分享
发布于 2023-03-18 13:23 广东
笔试五道题做出来几道?
2 回复 分享
发布于 2023-03-18 13:45 重庆
美团大数据和鸡架都不捞我 哭死 投后端搞鸡架被说能力不匹配
1 回复 分享
发布于 2023-04-14 14:54 上海
兄弟,有二面消息了没
点赞 回复 分享
发布于 2023-03-20 15:46 陕西
请问海量数据题是要写代码吗?还是说个思路就可以呀?
点赞 回复 分享
发布于 2023-03-19 11:50 摩尔多瓦
hxd,笔试是什么题型分布啊?明天笔试
点赞 回复 分享
发布于 2023-03-17 23:54 上海

相关推荐

最近群里有很多同学找我看简历,问问题,主要就是集中在明年三月份的暑期,我暑期还能进大厂嘛?我接下来该怎么做?对于我来说,我对于双非找实习的一个暴论就是title永远大于业务,你在大厂随随便便做点慢SQL治理加个索引,可能就能影响几千人,在小厂你从零到一搭建的系统可能只有几十个人在使用,量级是不一样的。对双非来说,最难的就是约面,怎么才能被大厂约面试?首先这需要一点运气,另外你也需要好的实习带给你的背书。有很多双非的同学在一些外包小厂待了四五个月,这样的产出有什么用呢?工厂的可视化大屏业务很广泛?产出无疑是重要的,但是得当你的实习公司到了一定的档次之后,比如你想走后端,那么中厂后端和大厂测开的选择,你可以选择中厂后端(注意,这里的中厂也得是一些人都知道的,比如哈啰,得物,b站之类,不是说人数超过500就叫中厂),只有这个时候你再去好好关注你的产出,要不就无脑大厂就完了。很多双非同学的误区就在这里,找到一份实习之后,就认为自己达到了阶段性的任务,根本不再投递简历,也不再提升自己,玩了几个月之后,美其名曰沉淀产出,真正的好产出能有多少呢?而实际上双非同学的第一份实习大部分都是工厂外包和政府外包!根本无产出可写😡😡😡!到了最后才发现晚了,所以对双非同学来说,不要放过任何一个从小到中,从中到大的机会,你得先有好的平台与title之后再考虑你的产出!因为那样你才将将能过了HR初筛!我认识一个双非同学,从浪潮到海康,每一段都呆不久,因为他在不断的投递和提升自己,最后去了美团,这才是双非应该做的,而我相信大部分的双非同学,在找到浪潮的那一刻就再也不会看八股,写算法,也不会打开ssob了,这才是你跟别人的差距。
迷茫的大四🐶:我也这样认为,title永远第一,只有名气大,才有人愿意了解你的简历
双非本科求职如何逆袭
点赞 评论 收藏
分享
评论
24
107
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务