好未来 数据仓库开发实习

一面
项目深挖
数仓分几层,每一层的作用
事实表如何设计
维度表如何设计
数据域如何划分
业务总线矩阵的概念
如何设计完整的指标
开发中和上线后数据质量如何保证
如何设计调度,依据是什么
hive数据倾斜解决办法
hivesql常见优化手段
什么是spark宽窄依赖,起到什么作用
sql题:用户连续登录游戏的最大天数,允许间隔一天
反问
做什么业务 教培业务中的线下面授分析
网络问题迟到了一会,面试官很不爽,没想到秒约二面
二面
感觉两面问的都很相似
项目深挖
维度建模理论介绍
范式建模和维度建模的特点和区别
为什么数仓不用范式建模
缓慢变化维的解决办法
数据质量的几个性质,分别如何保障
hive表三种格式text,orc,parquet的区别
hive数据倾斜解决办法
如果参数调优无法解决倾斜,还有别的办法吗
sql题,又是连续登录,这回要求至少2种不同的解法
反问 数据来源有哪些 有没有转正机会
流程很快,oc
#面经##好未来#
全部评论
SQL,1.连续问题可以用,subdate(day,row_number()over(partition by user_id order by day )),user_id分组求出。 2.用datediff(day,lead(day,1)over(partition by user_id order by day) )=1,进行判断,符合等0,不符合等于1,然后,得到结果sum(结果)over(partition by user_id order by day desc) ,连续的user_id,和这个值是一致的,group by 在求出来就行。小白浅见,请大佬多多见谅。
1
送花
回复
分享
发布于 04-28 15:19 北京
网易还来这😞
点赞
送花
回复
分享
发布于 04-28 17:04 北京
秋招专场
校招火热招聘中
官网直投
想问问二面结束多久oc的呀
点赞
送花
回复
分享
发布于 05-21 12:24 河南
Boss上投的有转正机会吗
点赞
送花
回复
分享
发布于 05-22 16:50 辽宁

相关推荐

6 23 评论
分享
牛客网
牛客企业服务