云智研发 数据开发 二面 35min
1.自我介绍
2.项目细节介绍
3.针对一个指标讲讲你整个链路怎么设计的
4.数据交付时数据质量如何保证
5.如果现在调度的表都是高优先级,你这个表延迟产出了,怎么办
6.hive架构介绍
7.hive优化器会做什么,详细讲讲谓词下推
8.小文件产生原因,危害,解决方法
9.spark遇到的挑战
10.实时了解过吗
11.你们公司的数据链路,数仓分层是怎么样的
12.数据怎么采集的,binglog的格式
13.数仓对外的接口和olap的关系
他们部门实时的场景比较多,我对于实时的了解还是太少了😖 #数据人的面试交流地#
2.项目细节介绍
3.针对一个指标讲讲你整个链路怎么设计的
4.数据交付时数据质量如何保证
5.如果现在调度的表都是高优先级,你这个表延迟产出了,怎么办
6.hive架构介绍
7.hive优化器会做什么,详细讲讲谓词下推
8.小文件产生原因,危害,解决方法
9.spark遇到的挑战
10.实时了解过吗
11.你们公司的数据链路,数仓分层是怎么样的
12.数据怎么采集的,binglog的格式
13.数仓对外的接口和olap的关系
他们部门实时的场景比较多,我对于实时的了解还是太少了😖 #数据人的面试交流地#
全部评论
好难
佬,太猛啦,有美团offer的话,这些公司还要接着面嘛
参考参考意见
大佬你这是哪里的云智
相关推荐
03-24 12:31
河南理工大学 后端工程师 点赞 评论 收藏
分享
02-26 10:01
南方科技大学 产品经理 点赞 评论 收藏
分享
03-15 19:17
门头沟学院 算法工程师 程序员小白条:可以,技术栈别写太多,因为学院本这块,没必要太多,项目的话可以提前,技术栈放最下面,要么技术栈放最前面,多准备下八股文
点赞 评论 收藏
分享

