字节大数据一面
1. 自我介绍
2. 挑一段你觉得收获最大的实习经历聊聊吧。比如当时做的业务是什么,技术用在了什么场景,最后有没有一些具体的指标来衡量效果?
3. 我们来聊聊数仓吧,为什么要对数据仓库进行分层设计?
4. Hive里的视图(View)用过吗?它主要是解决什么问题的?
5. Hive的分区和分桶,能讲讲它俩的区别和各自的应用场景吗?
6. 能详细说说Spark的shuffle过程吗?
7. 在之前的工作中,有没有碰到过什么让你印象深刻的性能优化案例?
8. 大数据处理中常说的数据倾斜,一般是什么原因造成的?你都知道有哪些解决方法?
9. 编程语言这块,你比较熟悉哪些?
10. MySQL索引的底层原理是什么?能展开讲讲吗?
11. 数据库和数据仓库,它俩的核心区别是什么?分别适合用在什么样的业务场景里?
12. 算法题:写一个二分查找。
13. SQL题:写一条SQL,用窗口函数找出连续登录N天的用户。