26秋招快手数据开发面经

1.介绍一下项目以及项目中用到的一些大数据组件
2.HDFS的文件存储格式有哪些?
3.MapReduce过程,MapTask和ReduceTask个数怎么确定?
4.MapReduce阶段哪些因素会影响性能?
5.Flink和Spark Streaming的区别是什么?
6.Kafka的消息传递机制是怎样的?
7.大数据处理中的一致性、可靠性、可用性如何权衡?
8.数据仓库和数据湖的区别是什么?
9.Hive和传统数据库的区别?
10.Spark如何进行数据倾斜的优化?
全部评论

相关推荐

11-11 19:24
河海大学 Java
嵌入式的小白:这种时候,我觉得是不是说有offer(证明别的公司也认可你),但更想来字节,字节是我的第一选择好
字节求职进展汇总
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务