快手数据研发凉经
1h10 min
面试官是个大佬,全程面试偏场景题
八股:数仓建模,分层,每层作用,数据倾斜(group by,join)很细,小文件
场景题:
快手在某一时刻某主播开播时流量巨大,然后同一时间段还有多个主播开播
有一些些主播可能粉丝少,但因为在搞活动,把在线列表和主播表join时会发生数据倾斜,这怎么解决
雪花模型用过吗?(用过)讲一个使用雪花模型的场景(多值维度?)面试官说不对。然后只能说没用过
上层埋点时如果出现时间不一致怎么解决(什么玩意,不会)
离线数仓的实时性了解吗?(没太听懂面试官的点)但还是答了自己理解
为什么实时数仓现在还是在企业里无法完全替代离线数仓?
FLINK的缺点知道吗(不太了解)
手撕3个sql:比较简单,经典连续登录,留存率,left join 问题,全搞出来了
反问:面试表现:基础尚可,但缺少实际的企业项目经验。(寄了)
面试官主要做的工作:管整个大数据组的,什么项目都做一点
鉴定为寄
面试官是个大佬,全程面试偏场景题
八股:数仓建模,分层,每层作用,数据倾斜(group by,join)很细,小文件
场景题:
快手在某一时刻某主播开播时流量巨大,然后同一时间段还有多个主播开播
有一些些主播可能粉丝少,但因为在搞活动,把在线列表和主播表join时会发生数据倾斜,这怎么解决
雪花模型用过吗?(用过)讲一个使用雪花模型的场景(多值维度?)面试官说不对。然后只能说没用过
上层埋点时如果出现时间不一致怎么解决(什么玩意,不会)
离线数仓的实时性了解吗?(没太听懂面试官的点)但还是答了自己理解
为什么实时数仓现在还是在企业里无法完全替代离线数仓?
FLINK的缺点知道吗(不太了解)
手撕3个sql:比较简单,经典连续登录,留存率,left join 问题,全搞出来了
反问:面试表现:基础尚可,但缺少实际的企业项目经验。(寄了)
面试官主要做的工作:管整个大数据组的,什么项目都做一点
鉴定为寄
全部评论
我感觉面试官有病,要是有企业项目经验,那还是应届生吗
这跟我二面一模一样,怀疑是同一位面试官
几面呀
请问第一个场景题,开播流量大数据倾斜应该怎么解决呀~
为啥现在问的八股越来越难了😭
官网流程咋样。我这一直面试中
啥部门呀
相关推荐
等闲_:业务开发就是prompt+数据,Ai就是中间件,中台或者鸡架会做一些Agentic infra和智能体记忆之类的,再底层一点就是AI infra,MLops,模型微调,推理优化之类的了,所以对于普通后端就是纯业务,没啥技术含量,除非去技术架构组或者底层一点的组,要不AI就是个API,别神话AI应用开发 点赞 评论 收藏
分享
点赞 评论 收藏
分享
程序员花海_:实习写的太偏技术了 分库分表这种一看就和应届生没关系
点赞 评论 收藏
分享
点赞 评论 收藏
分享
