Keep大数据开发一面
哎,属于是面麻了,,,,,,啥时候是个头啊
项目:
1.介绍实时数仓的各个层及作用
2.redis在项目中是怎么用得?
3.配置信息是如何打给业务数据的?
4.为什么用maxwell和cannal?为什么用了cannal还要用flink cdc?
5.filnk cdc实现原理?
基础
6.说说LinkedList和Arraylist区别?
7.HashTable,HashMap,ConcurrentHashMap是如何实现的?异同?
8.jvm虚拟机中的分代复制算法?
9.synchronized和volatile的区别?
10.Hadoop中基本架构?
11.MR的具体流程?
12.Yarn的三种调度器,适用场景?
13.Hive中row_number和rank的区别?
14.SparkStreaming和Flink的区别?
15.Spark宽窄依赖?
16.GroupByKey和ReduceByKey的区别?
17.Flink的两阶段提交协议?
18.Flink中的CheckPoint实现原理?
19.Flink有哪些窗口?
20.Flink中Exactly_once如何保证?
21.Kafka和Flume有用过吗?
22.Kafka如何实现数据可靠性?
23.Kafka为什么用得如此广泛?
24.给你一个有序的数据,输入Kafka,消费者消费的时候数据还是有序的吗?为什么?
#大数据求职##实习#