美团大数据开发转正实习面经(已OC)

一面面试体验整体很不错,面试官很温柔,也不会故意为难你。

一面(2023.3.21)

  1. 自我介绍
  2. 简单介绍项目(研一在国电做的)
  3. 你认为学习到的技术和实际使用的差距在哪
  4. 项目中的数据都是哪里来的(集团中各种设备运行的数据)
  5. 你说你用到了Spark那你介绍一下Spark的组件和整体架构(结合Dirver 和 Executor各自的作用)
  6. 介绍一下Spark的RDD(分布式弹性数据集、基本的数据抽象、封装了计算逻辑、RDD代码层面包含的东西即RDD的属性、有了RDD的依赖就可以生成DAG图)
  7. 介绍一下Flink(我讲了事件时间、迟到数据的处理啥的)
  8. 介绍一下Flink状态(就把分类说一下,顺便讲了检查点机制)
  9. Flink为什么要做checkpoint(为了保证数据不丢)
  10. operator sate和keyed sate的区别(这个我答得比较简略,只答出来了:1.一个是一个子任务一个状态,一个是一个key一个状态 2.keyed state只能在keyby之后用)
  11. Flink的反压有了解吗(分布式阻塞队列)
  12. SQL题目:每个城市某一天骑手送单量的前十名(开窗就行)
  13. Flink SQL有学习过么(简单用过,不太熟练,我说看网上说的,这个技术不太成熟,他说其实现在已经很成熟了,哈哈哈)
  14. 接下来聊一些Java的东西吧
  15. Java的线程池了解吗(线程池的优点,以及构建线程池的时候那几个参数的意义)
  16. 在实习里面有用到过线程池吗(没有,只是自己写过几个Demo)
  17. Java里面的读写锁有了解过么(太久没复习,给忘了,这个答得不是很好,我就答了一下ReentrantLock的底层,也就是AQS啥的)
  18. JVM内存区域划分(讲了1.8的)
  19. 这几个区域主要是哪里发生垃圾回收(堆,也有元空间但是很少)
  20. 本地方法栈会发生垃圾回收吗(我答得不会)
  21. 垃圾回收的算法你有了解过吗(三种算法,顺便讲了CMS和G1垃圾回收器)
  22. 平时用过Kafka吗(用过,顺便讲了一下它的作用和架构)
  23. Kafka的消息是存储在哪里的(存储在磁盘上,顺便讲了一下顺序读写)
  24. 为什么顺序读写会更快(跟随机写对比一下)
  25. 讲一下ISR队列(保证可靠性,以及它的流程还有特点啥的)
  26. 算法题:链表,删除所有重复元素(我快写完的时候,面试官说不用写了,你这种方法是可以做出来的,就先这样吧(我感觉可能是时间有点来不及了))
  27. 经典反问

大概过了三天约的二面,二面体验很差很差,上来就甩题,感觉就是kpi面一样(可能因为我笔试一道没A出来),前半段一直在用训斥的口吻跟我说话(讲真真的快哭出来了,我一个大老爷们都受不了)

二面(2023.3.27)

  1. 自我介绍
  2. 写一个单例模式(整个过程挺让人不舒服的,一直在用训斥的语气说话)
  3. 面试官口述一道题:两个自然数相加,这两个自然数可能会非常大(就是大数 a + b),体验也很差,我写完之后,因为没有测试用例(他口述的题目,没法提交验证),我就随便写了两个例子试了一下,他就说:你写这么多行代码,就用这么几个用例测试吗(训斥的口吻),最好还是提示了一下,后面的while循环没有测,反正最后是写出来了
  4. MySQL用过么,它的索引用什么结构实现的(B+树)
  5. B+树除了查询稳定,还有其他的优势吗(更适合范围查询)
  6. B和B+树的核心区别(答了非叶子节点的区别)
  7. 怎么看一个SQL需要优化的地方
  8. 场景图:给一道SQL,问怎么建索引,大概是:select orz,dt,ort from tb where dt >= '2021-10-03' and dt <= '2021-10-25' and/or ort in (4,5,6) ort的连接条件我记不清是and还是or了。我说建联合索引(dt和rt),他问谁在前谁在后,我说应该是dt吧(因为我真不会,我是感觉这俩前后是无所谓的),希望有大佬可以解答一下
  9. Java的动态代理(我只记得反射了)(总感觉自己在面后端,不是大数据)
  10. 聊了一下最新的我在做的项目(给国能做的知识图谱的),聊了挺多的,这个时候气氛才拉回来
  11. 经典反问

3.29 offer

#我的实习求职记录##实习##大数据面经##美团23春招24实#
全部评论
沾沾喜气,请问是美团金融的数据智能嘛😂
3
送花
回复
分享
发布于 2023-04-02 11:58 安徽
怎么看一个SQL可以优化的地方呢
2
送花
回复
分享
发布于 2023-04-02 14:57 江苏
秋招专场
校招火热招聘中
官网直投
dt会在前,因为dt的区分度更大,联合索引的建立最好按区分度从大到小排列
2
送花
回复
分享
发布于 2023-04-03 10:09 广东
大佬面的哪个部门呢
1
送花
回复
分享
发布于 2023-04-02 15:33 湖南
吸吸
1
送花
回复
分享
发布于 2023-04-06 16:33 重庆
沾沾喜气
点赞
送花
回复
分享
发布于 2023-04-02 13:08 广东
沾沾喜气
点赞
送花
回复
分享
发布于 2023-04-06 00:11 重庆
沾沾喜气
点赞
送花
回复
分享
发布于 2023-04-11 11:08 河北
问一下,研一国电的项目是自己找的还是实验室的呀
点赞
送花
回复
分享
发布于 2023-08-07 21:40 北京

相关推荐

感觉前两题比较简单,后两题难度比较大,做完之后是100,100,20,0,也不知道能不能进面试第一题很简单,给一个长宽,给两个符号,让输出一个矩阵,要求符号交替出现,每个符号周围(上下左右)不能是和当前符号相同的,比较简单,相信各位大佬也都能A,就不细说了。第二题也不难,给一个正整数(非常长,可能有5000位),给一个k,给一个p,要求找到这个正整数中长度为k的一段数字的最大值,输出这个最大值%p的结果,也不很难。第三题看起来很简单,但是实际有难度。给一个数组,长度为n,再给q组数据,每组数据两个数l,r,代表左右边界,要求输出数组第l位一直乘到第r位的乘积%6。1相信各位牛友都能写出来,主要问题在于时间复杂度。如果使用最直接的方法算,n,q都到10^5时显然会超时,这也是一直卡在20%的原因。显然他是想让我们利用一些计算过的值,不要有太多重复计算,这可以大大减少时间复杂度,例如我们算过了10-20,在算10-21时直接用10-20的结果乘21就好了。最开始试图直接打表,写完发现内存爆了,此路不通。苦思冥想怎么能够实现重复利用,想到一种思路,我们可以分块,比如1-100000分成100块:1-1000、1000-2000、……、99000-100000,预先计算出每一段的结果,存起来,然后算q组数据的时候就可以利用了,比如0-2001,就可以利用1-1000、1000-2000这两段从而降低时间复杂度。但是想了太久了,最后也没写完,也不知道可不可行,哎,还是题写的太少了,菜还是得练,刷题去了这是鼠鼠做的第一个比较大的厂的笔试,本来还想着要不要推到下一批,想想算了,直接冲吧。也不知道能不能过欢迎牛友们一起交流,本人四月底才开始申请暑期实习,希望能和各位大佬们多交流,早日收到满意offer!
查看3道真题和解析 投递携程等公司6个岗位
点赞 评论 收藏
转发
37 134 评论
分享
牛客网
牛客企业服务