好未来 数据仓库开发实习

一面
项目深挖
数仓分几层,每一层的作用
事实表如何设计
维度表如何设计
数据域如何划分
业务总线矩阵的概念
如何设计完整的指标
开发中和上线后数据质量如何保证
如何设计调度,依据是什么
hive数据倾斜解决办法
hivesql常见优化手段
什么是spark宽窄依赖,起到什么作用
sql题:用户连续登录游戏的最大天数,允许间隔一天
反问
做什么业务 教培业务中的线下面授分析
网络问题迟到了一会,面试官很不爽,没想到秒约二面
二面
感觉两面问的都很相似
项目深挖
维度建模理论介绍
范式建模和维度建模的特点和区别
为什么数仓不用范式建模
缓慢变化维的解决办法
数据质量的几个性质,分别如何保障
hive表三种格式text,orc,parquet的区别
hive数据倾斜解决办法
如果参数调优无法解决倾斜,还有别的办法吗
sql题,又是连续登录,这回要求至少2种不同的解法
反问 数据来源有哪些 有没有转正机会
流程很快,oc
#面经##好未来#
全部评论
SQL,1.连续问题可以用,subdate(day,row_number()over(partition by user_id order by day )),user_id分组求出。 2.用datediff(day,lead(day,1)over(partition by user_id order by day) )=1,进行判断,符合等0,不符合等于1,然后,得到结果sum(结果)over(partition by user_id order by day desc) ,连续的user_id,和这个值是一致的,group by 在求出来就行。小白浅见,请大佬多多见谅。
2 回复 分享
发布于 2024-04-28 15:19 北京
Boss上投的有转正机会吗
1 回复 分享
发布于 2024-05-22 16:50 辽宁
想问问二面结束多久oc的呀
点赞 回复 分享
发布于 2024-05-21 12:24 河南
网易还来这😞
点赞 回复 分享
发布于 2024-04-28 17:04 北京

相关推荐

06-12 17:46
门头沟学院 Java
运营你豪哥:来说重点: ​1.项目前置,时间倒序。​​ 2.​项目描述强化结果与量化效果(STAR原则里的R)。​​ ​3.个人技能精炼,明确掌握程度,突出核心。​​ ​4.增加强有力开头的个人总结部分。​​ 5.​优化教育背景(成绩排名)、合并奖项与活动。​​
听劝,我这个简历该怎么改...
点赞 评论 收藏
分享
06-26 15:33
青岛工学院 Java
积极的秋田犬要冲国企:他现在邀请我明天面试
点赞 评论 收藏
分享
不愿透露姓名的神秘牛友
07-10 13:54
点赞 评论 收藏
分享
评论
12
52
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务