美团 大数据开发 暑期实习 一面

时长:1h
由于问题太多,分四类进行整理

0. 实习相关:之前有数据开发的实习经验,就问了之前工作有没有spark或者hivesql优化的经验;如何确保数据的有效性;实习公司数据存储格式(Parquet),还知道哪些数据存储格式
1. 大数据相关问题:为什么Spark比MR快;对Spark的了解;两个表join的优化方法(大小表join可以map-side join, join前过滤null值);HDFS的读写流程;Spark shuffle的过程(不太了解,只讲了个大概)

2. java基础的问题:HashMap底层原理(链表+数组 & 红黑树);又问了对红黑树的了解,能讲个大概原理就行,对细节要求不高

3. 数据库问题:数据库的索引的数据结构(这个不太了解);ACID;数据三范式(1NF, 2NF, 3NF)
做题:
1. sql题:从成绩表中得到总成绩排名第三的学生id和成绩;将表中一列转换成一行(e.g. 表属性为[dt, col1, col2], 转换为[dt, key, value], 其中key为col1,value为col1列中所有数据)
2. 快速排序(快排出场率真的好高)
3. 海量数据题:从两个数据量50亿的文件中得到相同url(hash写到多个小文件+hashmap)

#面经# #大数据# #暑期实习#
全部评论
兄弟是哪个部门的呀?
3 回复 分享
发布于 2023-03-18 13:23 广东
笔试五道题做出来几道?
2 回复 分享
发布于 2023-03-18 13:45 重庆
美团大数据和鸡架都不捞我 哭死 投后端搞鸡架被说能力不匹配
1 回复 分享
发布于 2023-04-14 14:54 上海
兄弟,有二面消息了没
点赞 回复 分享
发布于 2023-03-20 15:46 陕西
请问海量数据题是要写代码吗?还是说个思路就可以呀?
点赞 回复 分享
发布于 2023-03-19 11:50 摩尔多瓦
hxd,笔试是什么题型分布啊?明天笔试
点赞 回复 分享
发布于 2023-03-17 23:54 上海

相关推荐

点赞 评论 收藏
分享
3.21 一面自我介绍有一个新的业务,你会怎么做?(数仓建模方式)数仓分层有什么好处介绍一下Spark的join方式(broadcast join, shuffle hash join,sort-merge join)shuffle hash join 和 sort-merge join Spark常用的join是哪个?介绍一下MapReduce的执行过程Hive SQL优化星型模型、雪花模型的区别及应用场景介绍项目,项目分层是如何实现的项目的ods层数据是如何得到的,dws层是如何设计的sql : 1、求在线店铺的月累积销售金额 2、求相邻在线店铺的月累积销售金额的差额sum() over ...
OceanRivers:感觉现在的企业是真抽象,找实习生要求要有实习经历(我要是有实习经历还要来找实习吗),这和校招招应届生的要求有啥区别,按这逻辑以后是不是毕业找工作直接要求一年以上工作经验,也不知道是现在行业卷到这地步了还是企业单纯不想花更多资源培养新人,就想着招有工作经验的牛马,入职直接酷酷工作,然后给他发实习生水平的薪资当廉价劳动力
查看18道真题和解析
点赞 评论 收藏
分享
转码后的第一次面试,很紧张,心跳一百一。软件开发中的数据开发方向。0.应该是KPI面,基本没拷问八股和项目。回答的很烂手撕SQL也没撕出来也没考察Python 亏我力扣刷了那么久1.聊了聊数学专业相较于其他科班专业有啥优势,聊了聊对目前大模型的看法,有没有用到过。1.5.为什么选择数据开发这个领域。怎么看数据分析和数据开发的。2.简单询问了第一个项目(我项目很烂 下一步要开点新项目做),做项目的背景,我含糊其次的回答了一下(做项目的背景就是为了面试啊喂)3.问了问对数仓有什么了解,知不知道分层啥的。我回答了四个分层,说了说星型模型和雪花模型啥的。4.再往后就是问我SQL怎么样,做个题吧。你都说了,那就做吧。没有示例,只有描述,感觉很抽象,也没有运行,就生写。感觉第一问写对了,第二问没搞出来。然后他就让我讲讲做题思路。5.啥也没说了。反问:1.需要补足的技术栈2.Python在数据开发中的占比(这场面试基本上没问我Python)面试官回答Python在数开中不如SQL常用,应该把重点放SQL上。准备的Hadoop这样的大数据八股都没用上,或许是准备方向不太对吧。项目也不好,确实是准备的不充分。还是差的太多了。真的该重新思考一下该做些什么了😮‍💨。恳请希望路过的牛油们给点建议,什么建议都可以。  
点赞 评论 收藏
分享
评论
24
107
分享

创作者周榜

更多
牛客网
牛客企业服务