美团点评数据开发工程师

数据开发工程师(base北京)许愿HR面
20200921HR电话约一面时间
一面面试官结束时说等待全面考量然后HR通知
20200923下午2点半HR电话约二面时间
20200925下午2点半HR电话约三面时间
20200923一面11:00
一面(65min)
1. 一枚硬币,连续抛了三次,都是正面朝上,第四次抛出后,正面朝上的可能性是多少?(1/2)
2. 编程题:一棵树,输出每一层级的最左边的节点,例子输入:A B C D E F G 输出:A、B、D(一开始是多叉树,后来需要序列化的时候改成了二叉树)
做完上面的功能函数后,要求写一个二叉树的序列化函数(最后没时间写了,就直接跳过了)
3. 留存的概念(当时没答出来,后来发现是客户留存的意思)
4. 同比和环比的区别
5. 数据库3NF都是什么,各举一个常见破坏每个范式的例子
6. SQL题一
sql实现考试科目排名第一的学生名字和分数。tableA
userid,kemu,fenshu
a 数学 100
b 数学 20
a 语文 90
7. SQL题二(这道题说是探探底,没有说一定要做出来,说思路就行,因为SQL来写没用过类似的,只回答了用编程题里常用的数组存储然后计数的方法)
求一天的同时最大在线人数
表名称:tableA
字段: user_id , start_time ,end_time
张三 , 2020-09-10 11:12:30 ,2020-09-10 12:12:30
张四 , 2020-09-10 12:12:20 ,2020-09-10 12:13:30
张五 , 2020-09-10 11:12:20 ,2020-09-10 13:13:30
张六 , 2020-09-09 11:12:20 ,2020-09-10 13:13:30
张七 , 2020-09-09 11:12:20 ,2020-09-09 13:13:30
结果:3
8. 假设一个用户画像的项目,如果你是主管,面对任务,怎么分配怎么执行,怎么和甲方沟通
9. 反问
a. 美团金融部门:支付数据-收银台,数据体量大, 主要比较偏业务的
b. 技术栈:SQL,Hadoop,Spark,Flink

20200924二面11:00
二面(70min)
1. SQL题一
用一条SQL 语句 查询出每门课都大于80 分的学生姓名
name   kecheng   fenshu
张三    语文       81
张三     数学       75
李四     语文       76
李四     数学       90
王五     语文       81
王五     数学       100
王五     英语       90
SQL题二
year   month amount
1991   1     1.1
1991   2     1.2
1991   3     1.3
1991   4     1.4
1992   1     2.1
1992   2     2.2
1992   3     2.3
1992   4     2.4
查成这样一个结果
year m1   m2   m3   m4
1991 1.1 1.2 1.3 1.4
1992 2.1 2.2 2.3 2.4
2. 编程题
一个文件共两列,第一列存储子节点数据,第二列存储父节点数据,数据样例如下,如何获取父节点是4的所有子节点的数据?
child_node    parent_node
1    2
2    3
3    4
5    4
4    6
输入:4
输出:1,2,3,5
(写的时候用树来存储,然后层序遍历,写了好多,最后面试官说其实用数组直接存就行,害)
3. spark的原理
4. 简单介绍一下你的专利
5. 网络模型OSI七层结构是?TCP在哪一层?
6. 归并排序和选择排序的异同点
7. 反问(其实一开始他就先介绍了,后面就稍微问一下部门人数和分工以及培训问题和边学边上手工作问题)

20200927三面16:00(面试官关了摄像头,网好像还有点卡,让我也把摄像头关了)
三面(65min)
1. 闲聊(实验室,专业,为什么选数据开发等等)
2. 介绍部门(金融服务平台-技术平台-数据智能:算法,数据)
负责支付/交易等场景/用户场景
北京(保险)上海(借呗,花呗,生活贷,银行卡,免单卡)
3. 问基础知识说补一下之前面试没问到的一些模块
• 栈和堆的区别,为什么会栈溢出,栈的现实应用场景
• 进程和线程,线程的5种状态,进程通信的5种状态
• OSI七层协议模型和TCP/IP 4层协议模型
• TCP/IP分别位于哪个层,网络层除了IP还有什么?(ICMP)ICMP是干嘛的
• Linux ls是是什么作用,实现原理
4. 场景题
给两个文件,一天的日志文件(用户id,访问时间),用户id黑名单文件,找出日志文件中黑名单用户id个数,分析各种时间复杂度/空间复杂度
(这个弄了好久,先是数据量很小的时候的做法,最后再是数据量很大的场景,做的过程就很混乱,感觉排序后用二分查找优化还不行,最后要用哈希(字典表),牺牲空间换取时间)
5. 排序算法的稳定性,快速排序是稳定的吗?快速排序的时间复杂度和空间复杂度,最好时间复杂度和最坏时间复杂度

更新
20201021发邮件给校招组询问面试进度,得到的回答是经过综合比较和谨慎考虑,说我和面试岗位匹配度不够高.........(看来是三面面的不符合面试官预期了),然后也没发感谢信,让等着收到感谢信后可以根据个人意愿选择调剂岗位。
应该是今年池子确实深,排名比较靠后了,被养鱼中。

20201029收到感谢信

#美团点评##面经##校招##数据开发工程师#
全部评论
楼主好强啊
1 回复
分享
发布于 2020-10-15 12:14
不会是金融服务平台吧,感觉和我问的都差不多
点赞 回复
分享
发布于 2020-10-24 16:07
联想
校招火热招聘中
官网直投
Sql题二,感觉可以把开始时间和结束时间转成时间戳,然后炸裂开,再做个聚合就行了
点赞 回复
分享
发布于 2022-10-13 19:48 广东

相关推荐

9 35 评论
分享
牛客网
牛客企业服务