9.26-特来电-大数据-面经
HR一面
面试时间:25min
常规询问,家庭生活、学校、实习、科研
二面
面试时间:30min
自我介绍
项目是怎么搭建的?用的哪家的服务器?配置怎么样?遇到过什么问题
项目组建选型?
Hadoop介绍?配置过高可用吗?
数据库三范式?
维度模型?
Hive原理?
Kafka保证数据不丢失原理?
zk对kafka上的作用?
项目的数据是如何分区的?
项目中的Superset是怎么用的?对接的是什么数据源?
Superset底层是用什么开发的?
Superset配置过什么图表?
用的什么调度器?什么不用DolphinScheduler?
小文件问题?在什么情况下遇到的?如何解决?
Clickhouse了解吗?介绍一下原理
数据湖看法?
科研项目介绍,论文都是什么方向的
这么多特征用什么算法筛选的?
预测模型改进的创新点?
现在项目处于什么阶段了?落地应用了吗?
平时是怎么学习的?
有什么爱好?
后续HR告知大数据没HC了,让我考虑转安卓或者后端。。。。特来电的后端感觉不纯是Java好像还有C#,进去要搞.net,不太想接了