字节数据开发一面秋招60min
1.项目介绍
2.实习经历 难点
3.数据倾斜
4.CTE的执行计划
5.spark stage怎么划分
6.什么算子会触发宽依赖
7.hive内部表和外部表区别
8.HDFS小文件过多会有什么问题
9.对数仓分层的理解
10.数仓业务域和主题域的区别
手撕:
sql1:查询某段时间借书的 uid
sql:2.sql:查询至少连续两天登录的用户
3.算法:有序重复数组返回n出现的次数
2.实习经历 难点
3.数据倾斜
4.CTE的执行计划
5.spark stage怎么划分
6.什么算子会触发宽依赖
7.hive内部表和外部表区别
8.HDFS小文件过多会有什么问题
9.对数仓分层的理解
10.数仓业务域和主题域的区别
手撕:
sql1:查询某段时间借书的 uid
sql:2.sql:查询至少连续两天登录的用户
3.算法:有序重复数组返回n出现的次数
全部评论
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
点赞 评论 收藏
分享
查看20道真题和解析