滴滴校招数据开发一面面经

1.mapreduce执行流程
2.hdfs如何保证数据一致性
3.flink和kafka如何保证数据的一致性
4.flink的checkpoint里的barrier对齐和非对齐分别如何实现exactly-once;非对齐实现需要怎么做?
5.kafka如何保证数据一致性
6.spark和mr的shuffle有哪些区别
7.spark的内存参数一般怎么调整;一般集群的spark内存参数会在什么样的一个级别?
8.数仓分层,每一层有什么作用?具体的全链路流程是什么样的?
9.维表应该如何进行设计?
10.用户画像如何搭建?
11.然后是一些数据结构的考察。
12.然后是两道sparksql题,不难。其中一个是考察数据构造,需要对sparksql有较深的使用了解。
全部评论
楼主知道二面时间吗?我的进度一面过后卡住了
点赞 回复 分享
发布于 昨天 18:04 陕西
大佬求问第七题是怎么答的哇
点赞 回复 分享
发布于 昨天 18:03 山东

相关推荐

查看17道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务