快手一面9.3
快手面到我人麻了,以为凉了但是过了的一面
总时长80分钟左右
- 自我介绍
- 性能调优的经历
- 数仓分层,你之前实习的公司主题域怎么划分的?
- 你开发的数据在数仓里最后是如何服务出去的,如何做产品化、做页面展示的?
- 那如果数据比较大从hive同步mysql的问题如何解决的?
- 讲一下纬度建模的思想?
- hive的文件存储格式有哪些,说说区别和优劣势?
- hive里的非textfile文件是无法直接同步到mysql的,你们的同步是怎么做的?
- Hive是如何把sql转化成mapreduce执行的?
- hive和spark的区别是什么?
- shuffle原理说一下,map reduce的shuffle和spark的shuffle
- hadoop其他组件你了解哪些?
- hdfs有哪些部分? secondary namenode的作用是什么?
- yarn里有哪些部分?resource manager主要干什么工作?yarn的工作流程
- 拉链表有了解过吗??????妈的我忘记了
- 大数据场景!!连续登录>=7天的用户
- 两个sql执行效率是否一样
由于面试官看起来比较严肃我全程说话都有点抖甚至逻辑有点不清晰这种。但是收获很大,因为每一道题答完都有反馈和延伸讨论,这个不得不点个赞!