【实习面经】爱学习(高斯教育)—大数据开发实习生(暑期)
JD
一面 3.3(40min)
- 无自我介绍
- 实习中数仓建模工作的介绍(大概讲了15min)
- HDFS中副本机制的优点
- YARN调度的流程
- 如何查看HDFS中的磁盘占用量以及YARN中的资源使用情况
- MapReduce运行过程中某一个YARN节点挂掉有什么影响
- 说一说对Spark的理解
- 数据同步工具除了Maxwell还用过哪些
- MySQL有用过吗?联合索引(A,B,C),查询条件中(B,C)是否会生效
- Redis和MySQL的对比
- Java中异常处理的方式
- map和list有了解吗
- Linux中如何查看一个日志文件中是否存在某个订单号
- Linux如何查杀进程
二面 3.4(40min)
- 个人背景,简单聊聊天
- 实习工作拷打,数仓建模流程和系统运行流程,画图讲解
- 日志文件的采集只用Flume吗?
- 日志文件的增长速度远超业务数据,有没有更好的采集策略
- 项目拷打,实时数仓系统运行流程,画图讲解
- DIM层的数据存储在哪里
- 有一个指标既需要用到离线数仓的数据,又需要用到实时数仓中的数据,如何处理