滴滴(国际化)数据开发校招一面面经
1. 说说对数仓的理解
2. 为什么要对数仓分层和维度建模
3. 说说数仓怎么分层
4. 说说项目
5. ADS层指标的依据
6. Hive的复杂类型有哪些,有什么区别
7. 计算TopN有哪些函数可以实现,有什么区别
8. sql题:
rt_ data表存放了当天每半小时的店铺销售数据,表名: rt_ data,字段名: shop _id (店铺id),stat_ date (时间) , ord_ amt(销售额)。
shop_id stat_date ard_amt
s001 2020-12-04 08:30:00 100
s002 2020-12-04 08:30:00 100
S003 2020-12-04 08:30:00 100
s001 2020-12-04 09:00:00 200
s002 2020-12-04 09:00:00 350
s003 2020-12-04 09:00:00 500
(1)找出昨天10点各店铺的销售金额及前半小时的销售金额和后1个小时的销售金额。(开窗函数,lead和lag)
9.Hive优化通常怎么做
10.Hive的mapjoin开启参数是什么
11.group by和distinct对应MR执行过程有什么区别
12.遇到过数据倾斜吗
#面试题目##滴滴##面经##秋招#