讨厌红楼梦1

04-27 08:44 太原理工大学计算机类

关注

美团数据仓库工程师一面 40min

👥 面试题目
1.自我介绍，能不能从几个方面说一下项目
2.有什么收获
3.简历里面哪个技术学的最好
4.spark的client模式和集群模式
5.yarn
6.能够重分区的算子
7.为什么用rdd,不用df和ds，他们的区别
8.为什么spark比mapreduce更快(磁盘io和进程线程模型)
9.spark也会OOM和溢写磁盘啊，mapreduce也有缓冲区啊，都是内存计算，为什么更快(统一内存模型和流水线加载内存，面试官说没到点上)
10.真实的优化经历，不要那些从网上背的八股
11.什么是aqe
12.为什么是动态调整，具体体现在哪方面(好像没说到他要的东西😭)
11.hdfs查看文件大小命令，这个没答出来
12.写一个SQL
13.反问：技术栈和建议
14.数据治理问题

第一次面试太紧张了，话术出大问题了😭，说话不流畅，面试官说自我介绍不太过关，回答思路有些混乱了，要分点回答，多练练表达。

全部评论

推荐最新楼层

门头沟学院公安学类

点赞

送花回复

发布于 04-27 12:51 山西

练习时长两年半的铁锤很爱吃烤肠

北京工业大学计算机类

老哥，哪个部门，风控吗

点赞

送花回复

发布于 04-27 13:02 北京

滴滴

校招火热招聘中

官网直投

怎么又出bug

华南师范大学计算机类

佬是本吗

点赞

送花回复

发布于 05-10 09:11 北京

破防了的沸羊羊很想玩飞盘

门头沟学院教育学类

日常？

点赞

送花回复

发布于 05-12 09:26 北京

04-28 11:11

已编辑

大数据开发工程师

滴滴外包——数据中台开发（最平淡的一集）

面试内容1、你刚毕业吗？之前做过开发吗？会java吗？（不会！大声！）2、接触过阿里云吗？对哪一部分比较熟？3、实习做什么工作？为什么不干了？4、你对数仓是怎么理解的？公司为什么做数仓？5、之前工作任务是怎么调度的？上游和下游怎么建立联系？（绕了几分钟，问了几遍怎么连的，实在搞不懂面试官想了解的点，就海豚上直接连线啊（要疯掉了。。。））6、sql同时在线人数7、问了几个hive的函数8、数仓结构？最底层怎么接入的？实际做过吗？9、数据倾斜优化方案？反问工作主要负责什么？想招一个什么样的人？面试总结1、面试官感觉很年轻，比我打不了几岁，应该是想找个有经验的2、纯开发，写sql的，别的岗位也轮不到...

大数据面试回顾

点赞评论收藏

转发

04-29 18:27

沈阳城市建设学院电子信息类

美团暑期实习什么情况

求助求助团子暑期实习数开方向10号一面16号二面25号有个hr问了一嘴什么时候能到岗现在还没任何消息😥请问各位大佬这是什么情况，还有希望吗 #实习#

点赞评论收藏

转发

05-11 21:28

大数据开发工程师

大数据面试题 V5.0

历年面试题总结：大数据面试题 V4.0大数据面试题 V3.0大数据面试题 V2.0不知不觉面试题已经到5.0了，从19年拿到offer后，陆陆续续整理，5.0能整理的八股内容也不多了，废话不多说了，说下这次更新了多少题。越长大，想说的就越少，愿你我都能成为一个普通人，保持好学心态，好好生活。

点赞评论收藏

转发

04-28 11:59

已编辑

河北科技大学数学类

小米大数据一面

1.自我介绍2.熟悉flink还是spark答：flink3.介绍下flink架构吧答：这里越深越好，我就讲到了flink的jobmanager(dispathcer，jobmaster)和taskmanager4.flink有哪些算子?答：map,flatmap,filter,window,union等,RichFunction提供生命周期open close,上下文环境。5.flink你知道有哪些窗口吗？计数窗口能介绍下吗？答：时间窗口有滚动滑动会话，计数窗口有滚动滑动。6.你知道窗口什么时候触发吗？答：讲了一下窗口触发器trigger7.你能介绍下flink有几种窗口触发器吗？底层怎么实现的。答：讲了一下事件时间触发器和处理时间触发器的原理。8.假如flink窗口突然不触发了，你怎么排查。答：这里我答了一下排查上游其中一个流是否断流，如果其中一条流断流可以设置withIdleness空闲时间，让窗口的最小水位线机制去掉那个断流的依赖，靠另外的流触发计算。这里面试官提了一个场景，如果小米商城半夜就是没人买东西或者数据量很小导致水位线不能及时更新，（就是每条流都没数据）那你该怎么触发呢？利用窗口触发器ProcessingTimeoutTrigger 9.口述一道sparksql题10.sparksql优化答:(1)sort by 代替 order by，需要结合distribute by使用。(2)count(distinct)优化(3)列裁剪(4)谓词下推(5)优化MAPJOIN阈值。(6)定期合并小文件，防止maptask数量过多(7)多用explain看执行计划,避免笛卡尔积等意外情况11.执行计划怎么看每个stage是根据shuffle切分，执行计划会写上具体的操作符和数据量和JOIN规则。12.distrubute by 会发生shuffle吗？根据什么字段distribute by? 这个和cluster by的区别是什么？13.反问：(1)小米数仓具体是做什么数据？(2)为什么岗位介绍上写了机器学习？面试官说这个有专门团队去做，跟数仓关系不大牛客字数限制，答案写的有点简略小米面试官的技术感觉很强，态度好，体验很不错，希望以后有机会能进吧。#大数据开发#

小米一面129人在聊

点赞评论收藏

转发

努力的Mattttt

04-26 16:11

太原理工大学计算机类

AI小厂-数据开发面经

自我介绍：是怎样的人，有怎样优势，做怎样改进岗位是否匹配预期介绍工作内容业务方沟通需求整理数据，提出数据，可视化提供给业务方能力：沟通，数据分层实践数仓了解多少机器学习拷打SQL考察思维题什么是数据分析面试官简述数据分析理解反问

点赞评论收藏

转发

8 25 评论

全站热榜

正在热议

# 牛客帮帮团来啦！有问必答 #

714914次浏览 11557人参与

# 想实习转正，又想准备秋招，我该怎么办 #

107794次浏览 1215人参与

# 机械人，你的秋招第一份简历被谁挂了 #

31389次浏览 545人参与

# 浅聊一下我实习的辛苦费 #

80874次浏览 755人参与

# 铜五铁六真的存在吗？ #

27632次浏览 293人参与

# 找工作中的意难平 #

187735次浏览 3368人参与

# 非技术岗是怎么找实习的 #

74002次浏览 1385人参与

# 实习与准备秋招该如何平衡 #

170044次浏览 3091人参与

# 投了多少份简历才上岸 #

56895次浏览 949人参与

# 市场营销面经 #

4597次浏览 125人参与

# 找工作，你会甘心进小厂还是猛冲大厂 #

35220次浏览 353人参与

# 如何写一份好简历 #

260219次浏览 3929人参与

# 通信硬件人笔面经互助 #

108489次浏览 2186人参与

# 无实习如何秋招上岸 #

225476次浏览 3526人参与

# 互联网公司爆料 #

36742次浏览 369人参与

# 找工作时遇到的神仙HR #

178239次浏览 1746人参与

# 产品实习，你更倾向大公司or小公司 #

36025次浏览 548人参与

# 24届软件开发秋招薪资爆料 #

149692次浏览 693人参与

# 租房前辈的忠告 #

33360次浏览 2079人参与

# 你的秋招进展怎么样了 #

502133次浏览 13433人参与

牛客网
牛客企业服务