美团数开面经
[一面 1h
- 自我介绍
- 围绕项目:数据接入表的介绍
- MySQL索引分类
- 索引如何添加的,为什么要添加索引,哪些不需要添加索引,有些情况为什么索引会很慢
- 实习公司自研调度平台介绍
- 数据流介绍,数据写入的过程
- 异构数据源融合是怎么做的,碰到了什么问题,如何解决的
- 数仓分层
- 数仓建模方式:范式建模,维度建模
- Hive表的存储格式,为什么要这么存,不用别的存储
- 数据倾斜
- Mapjoin原理,介绍一下
- 主题表是如何制作的,处于数仓的哪一层,你这个项目的数仓是如何分层的
- 写sql,自联结的,还算简单。没有手撕
- 没有反问。。。。。
二面 1h 10min - 自我介绍
- 范式建模,说一下数据库范式,分别举个例子
- 范式建模用的多还是维度建模用的多
- MR应该了解吧,详细说说;说完之后,spark和他有什么区别
- 说说shuffle的过程,哪些算子,我又说了说对不同算子的优化
- 索引机制,用到了哪些引擎,区别是什么
- 事务和锁
- 平时用的最多的开发语言是什么,我说是Java,然后面试官不说话了,我就自己说了说HashMap 1.7和1.8的区别。。。说的一半被打断了,问我用Java写过什么?我说hive里的udf写过一些,然后开始了udf的介绍
- Udf分为哪几种,每种类型是干什么的,如何使用
- 那你用Java写个快排把。
- 写完partition被打断了,又写了一个sql,很简单,但是当时脑子有点短路,引导了一下,说了思想,面试官要去吃饭了,就没让写了
- 反问环节。。。终于给反问的机会了
](https://www.nowcoder.com/discuss/484810?channel=666&source_id=subject)