大数据开发工程师精选面经合集
36家公司
74篇面经
最新 热门
/feed/main/detail/15d2ca19211d4eb5bef80d150790a2eb/feed/main/detail/3bb10e39ff3849d3b637052e1275b662/discuss/608994293511970816/feed/main/detail/104531819b8e440a893eabfee9c824b6
美团软开-大数据科学方向面经
#美团暑期[话题]##美团暑期[话题]##美团数据开发#4.8美团数据开发一面,记录一下面经供大家参考,同时积攒人品,希望顺利OC。(25暑期转正实习)面试官人很好,整个面试过程约一小时十五分钟,非常nice,面试官全程视频,也给了我很多建议,受益匪浅,整个过程八股较少,都是穿插项目问八股,感觉面试官一直在从我会的角度深入。具体如下:1.你知道hive的窗口函数吗,窗口函数有哪些,都是干什么用的,知道lag函数吗,做什么的2.平时用Spark的时候关注过内存管理吗(没了解,面试官说可以多看看这个)3.Spark算子类型了解吗,种类和具体的算子案例4.Spark内存管理了解吗,内存管理的机制介绍一下5.Spark sql调优是怎么做的6.使用过scala语言吗,用在什么地方,在编写代码过程中有什么挑战7.spark缓存机制了解吗,有那几个函数(cache、persist)Spark缓存级别有几个,具体内容是什么8.Spark一般用在什么场景,了解Spark图计算的框架吗(这里因为我项目里有一个图计算的项目,就问了一些图计算的内容,比如用到的算法,还有一个中心度算法,可以多了解一下)9.Spark的数据倾斜问题,map-side-join,spark的spill机制,如果内存不够了要怎么办,如果手动设置了某个参数呢(这里具体的参数名忘掉了)10.SQL题,牛客SQL 16题,较难,一开始没啥思路,就把那些SQL语句都写上了,包括limit啥的,测试没跑通,刚刚想重新分析一下,面试官说没关系,题比较难,也基本上写出来了,就没让我再继续改了。之后又问了我一些问题,比如base北京能不能来,居住问题,了解美团的业务群吗,中间还问了我一些项目管理的问题,感觉都不像技术面了。整场面试感觉题目答上来百分之95吧,SQL题没做出来有点遗憾,不过感觉好像面试官不是很在意。反问问了一下base,是不是在望京那边,然后问了一下面试官对于大数据学习的一些建议,面试官建议我可以先区分一下大数据的具体内容,比如离线在线、源码开发还是数据仓库等等,然后根据具体的方向学习对应知识。最后总结一句,面试很nice,面试官也很nice,大家都说美团的面试让人感觉很好,现在看来的确如此。分享一下,积点德,希望能顺利二面然后OC
点赞 评论 收藏
转发
/feed/main/detail/1e0b696265e44a7c84c74bbf06609995/feed/main/detail/ac47cde30c4140b89d260f7fbf64820d/feed/main/detail/8fcc0cf8d93a4abcb9de29a9453494ea
Flink常见面试问题(附答案)
 适合小白或者其他领域转Flink或者轻度使用者查看,大佬轻轻喷基础篇1. 什么是Apache Flink?​Apache Flink是一个开源的流处理和批处理框架,可以实现快速、可靠、可扩展的大数据处理。​2. Flink与Hadoop的区别是什么?​Flink是一个全面的流处理和批处理框架,提供了低延迟和高吞吐量的实时数据处理能力,而Hadoop更侧重于离线批处理。​3. Flink中的事件时间(Event Time)和处理时间(Processing Time)有什么区别?​事件时间是数据实际生成的时间,而处理时间是数据到达Flink系统的时间。事件时间可以通过时间戳标记数据,而处理时间是Flink根据数据到达的顺序生成的。​4. Flink的容错机制是如何实现的?​Flink使用检查点(Checkpoint)机制实现容错。它会定期保存应用程序的状态,并在发生故障时恢复到最近的一个检查点状态。​5. 什么是Flink的窗口(Window)?窗口是Flink中用于对无限数据流进行有界处理的机制。它将无限流切分为有限的、不重叠的块,并对每个窗口进行计算。6. Flink支持哪些类型的窗口?​Flink支持滚动窗口(Tumbling Window)、滑动窗口(Sliding Window)和会话窗口(Session Window)。7. Flink中的状态后端(State Backend)是什么?​状态后端是Flink用于保存和管理应用程序状态的机制。它可以存储状态到内存、文件系统或分布式存储系统(如HDFS)中。8. Flink的水印(Watermark)是什么?​水印是用于表示事件时间进度的标记。它通常与数据流中的时间戳一起使用,用于处理乱序事件和延迟数据。9. Flink的时间窗口触发器(Trigger)是什么?​时间窗口触发器用于控制何时触发计算窗口的输出。它可以基于元素数量、处理时间、水印等条件进行触发。​... 完整版见:原文链接:https://blog.csdn.net/qq_30757161/article/details/137459710#数据开发##金三银四,你有感觉到吗##大数据#
点赞 评论 收藏
转发
/feed/main/detail/0b6bdee3f8a749989ef6e41f0060c765/feed/main/detail/692d2f1edd3d4770a0e588a0381e6190/feed/main/detail/c1acfe30f2284d0b8386160eebdd3c0e/feed/main/detail/b1090c3d40844671ac7ff8f9fbd928b4/feed/main/detail/2763f959cf14411ab06d8fd0b3d6b5ab/feed/main/detail/d64da807cbf0457ab57464733f93ba72/discuss/604410389610123264
头像
04-01 16:38
已编辑
门头沟学院 计算机类
【2025届暑期实习记录】淘天数开一面
点赞 评论 收藏
转发
/feed/main/detail/7cd4e080d52747b3b2391241817ec478/feed/main/detail/c5ca252498dc448ab7bbdc68a1133bcb
小米大数据开发3.29一面冰经
我是学数学的2024应届,本科阶段有选过大数据的专业选修课,但是编程语言真的不太会,跟科班出身的计院同学没法比,今年数分岗又卷到爆炸,双选会问了几个公司都说数分岗爆满(快手中移信息技术中心),只好一并找找其他方向,上周笔试以为铁挂了就没怎么准备,结果昨天晚上22点发今天的一面邀,一个晚上加上午恶补大数据知识。面试官非常和蔼:问项目:大数据技术实验做了什么东西?是为了实现什么?(本科课程里的实验)有学到什么东西吗?(linux操作经验和Hadoop架构搭建)你对Hadoop的理解到什么程度?机器学习算法实验用了什么算法?(朴素贝叶斯和随机森林)这两个算法分别是用来干什么的?回归还是分类?你用的是什么数据集?(Python sklearn自带数据集)这两个的具体原理知道吗?有监督学习和无监督学习是什么?区别在哪里?你用的这两种是有监督还是无监督?数据库设计用什么实现的?(MS Access)主要用什么语言?你说SQL比较熟练,那select where having执行顺序是什么样的?其余记得不太完整了,有印象的有:MR里的shuffle你知道吗?有什么操作?你知道事务吗?事务的四个性质知道吗?叙述一下?重磅:你本科是数学,那你有学过计组和网络吗?(没有,大一的时候有学习计基,但是培养方案比重不大所以学的不深…汗流浃背…)算法题:链表反转(怕我不知道链表是什么问了我一下知不知道),我问我只有C语言比较熟练可以用C写吗(可以,用你熟悉的语言写)C语言的结构体和指针对我来说还是很复杂的,10分钟左右(我还差主函数打印没写完)ok差不多了(您刚刚不是说还有一道SQL)没事,不用了我看你这个思路还是可以的,时间快到了SQL就不用你做了反问:后续流程大概要多久?(需要整合所有人的表现才能评估,要一段时间)我是数学专业的话想往大数据开发方向发展您觉得我还应该在哪里深入学习?(要多深入学习计组,网络等等计算机专业的课程,搞大数据开发的这些不能不熟练,另外你的机器学习算法的理解不可以流于表面,重点不仅要放在懂得用,编码这块,原理也要深入研究。对了你这些关于大数据和机器学习的东西是自学的还是专业课程学的)哦哦,这些是专业选修课,有计院的老师给我们上的。后面我自己有点研究兴趣所以自己也有学习。结束,现在就是等挂…算是积攒了面试经验吧,春招刚开始找工作处女面给了小米。
点赞 评论 收藏
转发
/feed/main/detail/c3c152295a374525a671a931f3df9ff0/feed/main/detail/9a929f425be54cdcbaceec4c0976e731/feed/main/detail/8992823148ee446c888ca952b53af3e5/discuss/602536180843827200
玩命加载中
写面经
发动态
发动态
发帖子
写文章

全站热榜

牛客网
牛客企业服务