大数据开发工程师精选面经合集
1家公司
4篇面经
最新 热门
/feed/main/detail/7429c5df50a542fea1ded2cc9da9b58c/feed/main/detail/51eac42db4714792a8e4a3188ab0c809
滴滴 大数据开发 一面 40分钟
查看12道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/7c3bb71369db4148befba1ed539ba6cb/feed/main/detail/d984859e2d2745db94eaaecc2c9f3dc9
百度数据工程拷打
又是超过一小时的拷打,感觉这次挺综合的,八股、语言、大数据全都问了一遍1. 项目拷打,主要问我的项目为什么采用Hive Transform这种比较小众的方案,我的回答感觉他还是比较满意的2. 简述至少3种常见的排序算法,时间复杂度,稳定性3. 关系型数据库的索引的常用数据结构是?选择这种数据结构的原因是?4. MySQL中什么时候会导致索引失效?5. Java线程安全的数据结构有哪些?6. ConcurrentHashMap是怎么实现的?相比于在直接在HashMap外边加锁有什么区别?7. HashMap的key可以是什么类型?有什么要求?8. 处理金额相关的数据的时候,应该如何存储?在Java中和MySQL中应该选择什么数据类型?9. Linux下如何用一条命令统计某个目录下各个子目录的占用空间大小?10. 如果把Linux换成HDFS呢?如何统计?11. 对于一个超大的HDFS系统,会有什么性能风险?有什么优化手段?12. Spark的并发度是如何控制的?在一个任务中什么情况会导致并发度变化?13. 考虑以下场景:某电商网站有一个用户表(用户id,用户所在城市)和一个订单表(订单id,下单用户id,订单金额),请(1)统计总销售额前十的城市和这些城市对应的销售额(2)统计总销售额在10万元至20万元之间的城市14. 一个表有年、月、pv三个列,要求写行专列代码,转成年、一月、二月、三月……
查看14道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/901da1cfde83451486ef76c5f9945d2c/feed/main/detail/09e05d1534fc4dfa9d790db9efac44a9/feed/main/detail/6534cc233c8841f9bd546c36b85c389e/feed/main/detail/c3166525420c44f5b1105b0dc10f0682/feed/main/detail/80d232cffdfd47059c3ed5a1794bf0c2/feed/main/detail/04691218474c4f1d9b8873d708f61892/feed/main/detail/b2ee48e237a64d8aa98f44d8bd671050/feed/main/detail/e3a63194e34e42f5b9b76194fcdf5939/feed/main/detail/97937eb24dae4a21b88869d9e71915ae
03-12 15:05
中原工学院 Java
大学生春招大厂面试了四五十分钟最后问我手里有几个Offer,然后没有谈薪资是什么情况😔
今天参加大厂的线上面试职位是大数据分析师。走的是校招。上来面试官先让自我介绍,然后介绍了一下学校跟专业,还有在学校学习的相关课程和做过的相关项目。之后面试官问了哈杜夫的整体框架主要由哪三部分组成?说说你对flink的了解。Spark中行动函数和转换函数说一下这个忘记了,说说你最骄傲的项目中间运用了什么技术?你遇见过什么难题,然后是怎么处理的?我说计算数据非常慢,延时高,用索引来优化然后问我索引怎么创建,怎么创建唯一索引,然后索引的优缺点是什么?之后又问了锁的建立方法是什么?然后问这个锁优缺点和内部结构是什么?衍生出来look手动锁是用双向链表结构。说说你对链表结构的认识。优缺点是什么?学科方面问了操作系统的资源调度算法都有哪些?Linux系统中的shell命令,你能想起来的都说一下。重点问了我一个怎么给文件分配权限命令。我回答用chmod。之后又问了一些JAVA的相关的问题。最后做了一个编程题是计算字符串中字母出现的频率。不用区分大小写,不用管标点符号和空格。没有做完,但是他问我想法。讲了讲。后面他说今天先这样,因为后面还有一个面试。然后他问了我手中有几个offer?因为我没有经验,不会回答。然后我想问一下,他问了我这么多问题,面试也有四五十分钟,最后没有跟我讨论薪资问题,是什么情况?😔鼠鼠在线求解答
牛客在线求职答疑中心
点赞 评论 收藏
分享
/feed/main/detail/13588e08436649d8803299c70f846e74
03-06 12:24
门头沟学院 Java
多益网络大数据研发工程师技术面
昨天刚面试的,面试官很好,没看到网上有2026多益的大数据工程师面试,所以说分享一下(首先本人网上关于多益的讨论我也知道,至于为什么选择多益,主要是其他公司没有回应,多益完全是走一步看一步,能进就进)1:自我介绍2:你实习做的是软件测试,为什么会应聘大数据开发?3:本科阶段大数据主要学习了什么大数据生态?有什么项目经验吗?4:刚刚说到你有三个月软件测试实习经验,,你有什么心得或者你学到了什么?5:你最了解的是java语言,那就从java开始吧,java中你最熟悉的集合是什么?6:你刚刚说到了ArrayList,那么他的底层是什么?用在什么场景?7:还有一种集合叫LinkedList,他的底层是什么,使用场景又是什么?8:LinkedList和ArrayList相比在查找元素方面那个更快?9:java中锁有几种实现方式?10:如果有一个字符串String name = "名字”,里面有几个对象?存放在哪里?11:你刚刚说到了堆对吧,那么栈是用来干什么的?12:java中还有其他内存结构吗?13:过往程序出现过内存溢出的情况吗?14:MySQL存储引擎有那些?15:InnoDB的索引有什么用?16:InnoDB是怎么实现的?17:为什么要用B+树?能不能用B树?18:MySQL是行存储还是列存储?19:行和列存储有什么区别?20:MySQL的主键和唯一索引的区别?21:你知道的MySQL表连接有那些?22:假如A表有123,B表有124,他们用RDD连接,然后要查出他们的差异用什么实现?23:你主要使用的hadoop版本是什么呢?24:hadoop的HDFS有那些角色构成?25:NameNode和DataNode分工是什么?26:在HDFS上创建海量小文件,会给HDFS带来什么问题?27:Hive数仓搭建过吗?用的什么模型?28:星型模型的特点是什么?29:SORT BY和ORDER BY的区别30:Hive内部表和外部表的区别31:代码题:给定一段英文字符串,你需要找出其中出现频率最高的单词。如果多个单词出现频率相同,则以字典序依次输出。忽略大小写和标点符号。33:你手上有其他offer吗?能透露薪资吗?34:你期望工资是什么?后续就是一下疑惑解答1:公司有加班情况吗?有工资吗? 答:有加班,加班主要是学习为主2:公司有出差吗? 答:没有,后续可能会有浙江那边的出差需求基本上就这些,代码题要求先说思路然后写代码,只有5分钟(可能前面问答浪费太多时间了,代码没写完就没时间了)主要就是围绕项目的技术进行提问,然后根据上一个问题带出新的问题。有什么想问的可以评论区交流!希望能过
点赞 评论 收藏
分享
/feed/main/detail/fbbc32f5c8b84637bed04a9d1b17e674/feed/main/detail/73ffb1b715dd473a903e29cf4a88d4ac/feed/main/detail/2826e0cb1e8448cc8a383223c84ed8be/feed/main/detail/33f6fd6073a6440fbc72793183f4569e
快手大数据开发
我前几天面的大数据开发岗位,社招,岗位薪资是30-60k的,面试问题如下1 先自我介绍2 从你做的实时项目和离线项目重点讲一下你建设的过程和遇到的问题3 对于离线来说,你的dwd,dws,dim,ads是怎么建设的,dwd是按照什么划分的dws建设的时候需要遵循什么规范,如果一个业务在最开始做基建的时候需要怎么规划,dws如何建设可以做到后续的复用,如何体现可扩展性4 对于dqc规则一般都是配置哪些,触发了规则怎么止损,对于数据治理你怎么治理的,治理有啥量化的指标,对于一些耗时很久的任务如何进行优化5 对于实时来说我看你经验比较丰富,你平时实时主要是用哪些技术栈,对于实时一般哪些问题比较严重,你主要是做了哪些优化,优化之后提升了几倍性能,如何确保这个实时任务不延迟不出现计算问题,对于监控怎么监控的6olap的几个都聊一下,为啥需要选型这个,都各有哪些好处,为啥现在各大公司都在追求湖仓一体,对于超大的数据,一天如果有千亿起步的量级,对于数据生命周期和每个表的分区分桶和索引有啥好的方案7 对于用户画像你是怎么建设的,是如何高效的运用你建设的数仓模型,对于时效性你怎么做到的稳定可靠8 ai你们公司有用吗,ai如何进行提效的,对于一些常规的报警和一些常规的上线ai可以解决吗,怎么玩的9 你也干了几年大数据开发了,如果你作为一个领导者如何评价你们团队数仓建设的好不好,对于好的地方如何量化,不好的地方如何改进,如何平衡各个业务的模型规范10 你这边有啥问我的,我面试了2场了,给我的感觉就是人家招的是需要有实时和离线能力的人,而且是需要有快速解决问题,并且可以给团队带来技术的人,还可能要点对整体技术基建和带人的领导能力,当然薪资估计也比较高,我估计给40k起步应该问题不大的,而且我估计过了,hr频繁给我打电话呢,我还是不打算去,毕竟去年刚来这家新公司,对于需要玩大数据实时离线的可以看看我上面的问题你们都能不能会,都会估计可以去试试快手
查看9道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/42b85be257ec4517aec88a99eb4b2acc/feed/main/detail/c1c81fb61b034019a0663d221d217f04
玩命加载中
写面经
发动态
发动态
发帖子
写文章

全站热榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务