苏州思必驰数据开发一面回顾
1.ES,ES的项目好几年前接触的了几乎忘光了,被狠狠拷打
什么是倒排索引
ES写数据流程
ES读数据流程
项目里ES集群规模,分了几个索引,做过哪些优化来提升性能
2.Kafka
Kafka如何实现高吞吐量
Kafka如何保证消息按顺序消费
Kafka偏移量怎么保存
Consumer出错如何恢复
Consumer想从指定时间开始重新消费如何实现
3.Spark和Flink
Spark和Flink在使用场景和设计上有何不同
什么是shuffle
什么是数据倾斜
如何优化数据倾斜
Flink消费kafka什么情况下会出现数据倾斜
之前项目里Spark写数据是往什么地方写的
4.其他一些零碎问题,本来想问hadoop和hive,但我们之前项目用的aws,所以改问了s3一些问题,比如s3和传统文件系统相比有什么缺陷,为什么选择s3,s3上的文件能否编辑
什么是倒排索引
ES写数据流程
ES读数据流程
项目里ES集群规模,分了几个索引,做过哪些优化来提升性能
2.Kafka
Kafka如何实现高吞吐量
Kafka如何保证消息按顺序消费
Kafka偏移量怎么保存
Consumer出错如何恢复
Consumer想从指定时间开始重新消费如何实现
3.Spark和Flink
Spark和Flink在使用场景和设计上有何不同
什么是shuffle
什么是数据倾斜
如何优化数据倾斜
Flink消费kafka什么情况下会出现数据倾斜
之前项目里Spark写数据是往什么地方写的
4.其他一些零碎问题,本来想问hadoop和hive,但我们之前项目用的aws,所以改问了s3一些问题,比如s3和传统文件系统相比有什么缺陷,为什么选择s3,s3上的文件能否编辑
全部评论
相关推荐
点赞 评论 收藏
分享
美团 数据开发 23x15.5 硕士985 点赞 评论 收藏
分享
点赞 评论 收藏
分享