滴滴大数据开发实习一面面经

1. 简历深挖
2. mysql binlog了解吗
3. shell脚本写过吗
4. 两个集群,一张hive表如何进行数据共享,A集群如何同步到B集群中
5. 一张订单表,支付状态会发生变化,如何采集到ods?

面试官说由于每张mysql表都是在系统上有应用的,所以应该用update的方式更新支付状态,不能采用数仓的方式去思考问题,不能用拉链表。数仓可以保存历史数据,但是mysql表必须要用update的方式,不然在系统上数据会显示错误。
用户角度:如果数据状态没有更新就会出现,用户界面就会显示未支付。

6. sql执行流程
7. 数据倾斜,9999w条id为1的数据,如何处理数据倾斜问题
8. 数仓的分层
9. hadoop是什么
10. spark和mapreduce的应用场景。
11. 三个sql题
第一道:b left join a表的返回结果是什么
a:
id name
1   a
1   a
2   b
3   e

b:
id name
1   a
1   a
2   b
第二道:忘了,简单的累计开窗函数

第三道:列转行

tab:

t_1 t_2 t_3

a      c    1

a      d    2

a      e    3

a      c    4

a      d    5

a      e    6

结果表

t_1    res_2   res_3   res_4

a         1           2         3

b         4           5         6

select
  t_1
  ,max(case when t_2 = 'c' then t_3 end) as res_2
  ,max(case when t_2 = 'd' then t_3 end) as res_3
  ,max(case when t_2 = 'e' then t_3 end) as res_4
from tab 
group by t_1

#滴滴##滴滴实习##滴滴数据开发#
全部评论
第五题,用maxwell监视mysql的binlog来同步数据,如果mysql的操作是update,接收到的json里面会有old字段来记录更新之前的数据
2 回复 分享
发布于 2023-09-05 17:15 湖北
你笔试了吗,都的什么部门呀
点赞 回复 分享
发布于 2023-09-15 22:47 陕西
佬,请问第4题怎么回答呀?
点赞 回复 分享
发布于 2023-09-15 09:16 广东
求问数据倾斜这个题怎么回答呀
点赞 回复 分享
发布于 2023-09-10 01:25 北京
什么时候投的呀
点赞 回复 分享
发布于 2023-09-07 18:34 浙江

相关推荐

C9本港硕都给我挂了,好歹给个面试啊
丶西瓜:人太多,给他们惯的
投递海尔等公司9个岗位
点赞 评论 收藏
分享
08-08 16:33
唐山学院 Java
职场水母:首先,简历太长,对于实习和应届找工作,hr一眼扫的是学历,技术看实习,你写的技术栈字太多了,尽量用一句话概括不用写那么详细,技术面的时候会问的,而且技术栈都会在实习或者项目里体现,你要做的是,把你的简历浓缩为一页,删除没用的东西,比如实践经历,自我评价,这些纯废话,没用,专业技能写的太离谱,你真的熟练掌握了吗,建议都写熟悉,找工作和写论文不一样,追求的是干练和实用,把实习经历和项目提前,把掌握的技术栈写到最后,然后去找实习,
点赞 评论 收藏
分享
评论
14
87
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务