字节数开一面
1. 自我介绍
2. 实习经历 难点
3. 数据倾斜
4. CTE的执行计划
5. spark stage怎么划分
6. 什么算子会触发宽依赖
7. hive内部表和外部表区别
8. HDFS小文件过多会有什么问题
9. 对数仓分层的理解
10. 数仓业务域和主题域的区别
手撕:
1. sql:查询某段时间借书的uid
2. sql:查询至少连续两天登录的用户
3. 算法:有序重复数组返回n出现的次数
2. 实习经历 难点
3. 数据倾斜
4. CTE的执行计划
5. spark stage怎么划分
6. 什么算子会触发宽依赖
7. hive内部表和外部表区别
8. HDFS小文件过多会有什么问题
9. 对数仓分层的理解
10. 数仓业务域和主题域的区别
手撕:
1. sql:查询某段时间借书的uid
2. sql:查询至少连续两天登录的用户
3. 算法:有序重复数组返回n出现的次数
全部评论
相关推荐
点赞 评论 收藏
分享
mata川152:实习怕啥
点赞 评论 收藏
分享