快手—数据开发面经
项目追问:
1.你如何去评估一个数据仓库的好坏?
2.你如何去完成数据的质量治理?
3.你如何去制定优化数据仓库的方法?
总体来说都是很开放性的题目,要对数据仓库有自己的思维和理解,以及要有一定的整体意识和目标意识。
八股:
1.spark的作业调度
2.spark和mapreduce的区别
3.sparksql的执行流程以及catalyst优化
4.spark的内存结构
5.flink和spark有什么区别?项目的flink是如何使用的?
八股部分比较基础。
算法:
三道简单sql
一道leetcode hot100 是medium还是hard忘了,不过都hot100了出啥都一样
算法部分比较简单。
1.你如何去评估一个数据仓库的好坏?
2.你如何去完成数据的质量治理?
3.你如何去制定优化数据仓库的方法?
总体来说都是很开放性的题目,要对数据仓库有自己的思维和理解,以及要有一定的整体意识和目标意识。
八股:
1.spark的作业调度
2.spark和mapreduce的区别
3.sparksql的执行流程以及catalyst优化
4.spark的内存结构
5.flink和spark有什么区别?项目的flink是如何使用的?
八股部分比较基础。
算法:
三道简单sql
一道leetcode hot100 是medium还是hard忘了,不过都hot100了出啥都一样
算法部分比较简单。
全部评论
相关推荐
点赞 评论 收藏
分享