26秋招快手数据开发面经
1.介绍一下项目以及项目中用到的一些大数据组件
2.HDFS的文件存储格式有哪些?
3.MapReduce过程,MapTask和ReduceTask个数怎么确定?
4.MapReduce阶段哪些因素会影响性能?
5.Flink和Spark Streaming的区别是什么?
6.Kafka的消息传递机制是怎样的?
7.大数据处理中的一致性、可靠性、可用性如何权衡?
8.数据仓库和数据湖的区别是什么?
9.Hive和传统数据库的区别?
10.Spark如何进行数据倾斜的优化?
2.HDFS的文件存储格式有哪些?
3.MapReduce过程,MapTask和ReduceTask个数怎么确定?
4.MapReduce阶段哪些因素会影响性能?
5.Flink和Spark Streaming的区别是什么?
6.Kafka的消息传递机制是怎样的?
7.大数据处理中的一致性、可靠性、可用性如何权衡?
8.数据仓库和数据湖的区别是什么?
9.Hive和传统数据库的区别?
10.Spark如何进行数据倾斜的优化?
全部评论
相关推荐
只会一面挂:拼多多这强度,低于30k谁去呀,就该报高点
点赞 评论 收藏
分享
查看17道真题和解析 点赞 评论 收藏
分享
文远知行公司福利 498人发布