小米大数据一面

1.自我介绍
2.熟悉flink还是spark
答:flink
3.介绍下flink架构吧
答:这里越深越好,我就讲到了flink的jobmanager(dispathcer,jobmaster)和taskmanager
4.flink有哪些算子?
答:map,flatmap,filter,window,union等,RichFunction提供生命周期open close,上下文环境。
5.flink你知道有哪些窗口吗?计数窗口能介绍下吗?
答:时间窗口有滚动滑动会话,计数窗口有滚动滑动。
6.你知道窗口什么时候触发吗?
答:讲了一下窗口触发器trigger
7.你能介绍下flink有几种窗口触发器吗?底层怎么实现的。
答:讲了一下事件时间触发器和处理时间触发器的原理。
8.假如flink窗口突然不触发了,你怎么排查。
答:这里我答了一下排查上游其中一个流是否断流,如果其中一条流断流可以设置withIdleness空闲时间,让窗口的最小水位线机制去掉那个断流的依赖,靠另外的流触发计算。

这里面试官提了一个场景,如果小米商城半夜就是没人买东西或者数据量很小导致水位线不能及时更新,(就是每条流都没数据)那你该怎么触发呢?利用窗口触发器ProcessingTimeoutTrigger
9.口述一道sparksql题
10.sparksql优化
答:
(1)sort by 代替 order by,需要结合distribute by使用。
(2)count(distinct)优化
(3)列裁剪
(4)谓词下推
(5)优化MAPJOIN阈值。
(6)定期合并小文件,防止maptask数量过多
(7)多用explain看执行计划,避免笛卡尔积等意外情况
11.执行计划怎么看
每个stage是根据shuffle切分,执行计划会写上具体的操作符和数据量和JOIN规则。
12.distrubute by 会发生shuffle吗?根据什么字段distribute by? 这个和cluster by的区别是什么?
13.反问:
(1)小米数仓具体是做什么数据?
(2)为什么岗位介绍上写了机器学习?面试官说这个有专门团队去做,跟数仓关系不大
牛客字数限制,答案写的有点简略
小米面试官的技术感觉很强,态度好,体验很不错,希望以后有机会能进吧#大数据开发#
全部评论
八股轰炸啊,佬这个是春招还是实习
2 回复 分享
发布于 2024-04-28 22:37 浙江
请问下大概面了多久呢
1 回复 分享
发布于 2024-04-30 00:30 天津
佬,问下春招行情怎么样,感觉秋招来不及了。另外问下整个过程不考算法嘛
点赞 回复 分享
发布于 2024-07-12 11:28 广东
你这个贴子 我看到过一个一摸一样的,不知道你们谁抄的谁的
点赞 回复 分享
发布于 2024-05-14 17:23 北京
兄弟我准背找实习,你做什么项目,几个
点赞 回复 分享
发布于 2024-05-06 15:39 广西
一面有算法题嘛?还是之前笔试有
点赞 回复 分享
发布于 2024-05-03 21:40 辽宁
有后续吗?
点赞 回复 分享
发布于 2024-04-30 09:50 安徽

相关推荐

不愿透露姓名的神秘牛友
05-29 22:21
Offer1:小马智行,深圳,测试开发工程师,17.0k*16.0,Offer2:追觅科技,深圳,嵌入式工程师,18.0k*15.0,
嵌软狗都不学:各位base深圳的同事,作为也是并肩作战的一员,今天想站在管理视角,和大家开诚布公地聊一聊:从近几个月的上下班数据对比看来,我们发现一个明显的差异:深圳同事的在岗时间普遍比苏州同事短。很多深圳同事早上9点之后才到公司,晚上不到 20 点就下班了;而总部那边,20点半甚至 22 点后还有不少同事在办公室忙碌,特别是研发团队,加班更是常态。相信去过苏州的同事,对这种场景都不陌生。我很好奇,这是因为苏州工作任务太重还是咱们深圳同事效率真的高到能在更短时间内完成工作?MOVA在深圳成立分公司是为了吸引更优秀的人才贡献更多更高质的价值,公司管理层给我反馈的是深圳招到的多是行业的专家大拿,大部分都是薪资比苏州高的,而且我们办公的租金等也远高于苏州的..MOVA虽脱胎于强壮的集团母体不久,各业务板块尚未实现全面盈利,虽说公司管理层目光长远,不纠结当下的人才投入,但行业内的普遍标准是,员工创造的价值要达到公司雇佣成本的 15 倍以上。大家不妨自我审视一下,自己是否达到了这个标准?如果是抱着划水、按时打卡走人拿毛爷爷的心态那不适合来MOVA,那样过下去不但自己过得尴尬也会影响MOVA这个大船的攻城略地的速度.我并非鼓励大家盲目加班,而是倡导高效工作,拒绝无效忙碌,不要让项目进度因低效受影响,也别把精力浪费在和苏州同事拼打卡时长上,提倡更高的人效比;考虑到两地地域和交通差异,相信大家会找最适合自己发挥的工作方式(比如按时下班后1小时到家晚饭后继续未竟工作等..)大家在遵守公司规章的情况下尽情地体现自己的能力价值,为MOV!和深圳公司争光我们在这边才能更安心更有信心的工作下去;请客BU长、名部门长、项目管理和各业务单元负责人,全面梳理团队情况,及时评估成员工作负荷与成果质量,坚决清退划水害虫痕疫,践行公司价值观,相互监督,防止管理漏洞及渎职。感谢人家的理解,也请人家多担待我的直言不讳……
点赞 评论 收藏
分享
05-14 20:34
门头沟学院 Java
窝补药贝八股:管他们,乱说,反正又不去,直接说680
点赞 评论 收藏
分享
评论
24
74
分享

创作者周榜

更多
牛客网
牛客企业服务