数据BP一面

整体流程:30min 项目 +  两道sql
离线数仓 + 指标计算
1、聊聊离线数仓
2、介绍数仓主题、数仓分层?
3、DWD和ADS层的区别?
4、数仓表数量、数据量多大?数据量级的困难,计算参数
5、快速完成ODS表的清洗和过滤?
6、实现最复杂的UDF?继承Hive UDF类?其他的UDF类?GenericUDTF 和 UDF区别?
7、计算引擎选择?为什么计算量大却选择Hive计算引擎?
--
8、海外简单聊聊?(接下来你该如何去展开?
9、这个项目你做的最复杂的、最有价值的?对比Flink、SparkStreaming
10、为什么使用SparkStreaming?
11、下游怎么使用数据?
12、数据及时产出??指的是离线的还是实时的?
13、先聊离线,怎么保证及时产出?
14、期待公司可以给到你什么呢?组件的剖析 和 业务支持
---
35min的聊天,开始上题SQL
1、统计阅读最多的五类文章(按照文章id先聚合,将uid、时间粒度抹去,再去join)
为啥使用开窗函数?为啥不用order by?
2、某一天的24小时分段统计高低峰,然后连续高峰、就将其合在一起
00-03  high  04-06 低峰
1、需要对时间串截取
2、开窗取上、取下 -> 辅助类,相同标1、不同标0,不同才会跳变一次,辅助类相同就是同一个字段
写了15min,开始针对此进行:数据倾斜、窗口函数使用

----
面试官人很好,很开心的过去,就是我能力不够





全部评论

相关推荐

今天投了以下岗位!😁影石:影石共有三次投递机会,这次我投的是数据bp管培生,影石数据类型都岗位还是比较多的。搜狐畅游:游戏公司,投简历时会要求填写游戏经历以及游戏运营活动,投递之前可以好好构思一下快手:今天的重头戏,我投的是销售运营(跟销售半毛钱没有,妥妥的宝藏岗),快手一定要早点投,因为是无限复活的,早点挂掉早点开始下一次投递,另外,快手都测评点击就送,还会显示得分。~~~~~~~~~~~~~今日不能投递极感科技:一家搞手机摄像方面的科技公司,不能投递原因与之前一样,都是技术岗为主————————小tips😁1:大家有特别想投的岗位一定要快点投,很多公司已经有些岗位在关闭了(比如小鹏)2:一天投五个建议可以先投一个想去但是很难的,再投两个和岗位jd很符合的,再投两个比较随缘的,不要把鸡蛋全装到一个篮子里——————————秋招进度😁挂 百度提前批 百度管培生 京东tet 正式岗 极客未来 优酷 海信 英雄电竞 虾皮 小鹏(销售管理 质量运营)滴滴提前批 拼多多提前批 拼多多管培 大参林医药测评挂:多益网络面试挂:京东新锐之星测评:大疆 汇川技术 科大讯飞 远景能源 点点互动 快手一面:京东门店运营
26届校招投递进展
点赞 评论 收藏
分享
点赞 评论 收藏
分享
评论
2
12
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务