首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
牛客584553875号
北京理工大学 数据分析师
发布于北京
关注
已关注
取消关注
@三石大数据:
史上最全的大数据开发面经及答案汇总【字节跳动】
这是一篇总结了牛客网中10+篇字节大数据开发面经的文章,希望能够对大家有所帮助本篇后续将会持续更新~~~ 【不断更新答案】Hadoop篇1.介绍一下Hadoop hadoop是什么2.谷歌的三篇论文是否了解,三驾马车GFS,BigTable,MapReduce3.hdfs源码你知道的话,讲讲元数据怎么管理的?4.hdfs 你知道namenode的问题吗?怎么解决?应该就是联邦机制5.hdfs写数据流程6.namenode如果挂掉了怎么办 【HA配置】7.说一下mapredeuce 8.哪个阶段最费时间,环形缓冲区的调优以及什么时候需要调 shuffle:排序和溢写磁盘 原则上说,缓冲区越大,磁盘 io 的次数越少,执行速度就越快】9.环形缓冲区了不了解?说一下他的那个阈值高低的影响10.写一个wordcount11.WordCount在MapReduce中键值对变化 <偏移量, 一行数据> -> <单词1, 1> <单词2, 1> .... -> <单词1,10> <单词2,15>12.map端为什么要排序?13.map端输出的文件组织形式是什么样的?14.reduce怎么知道从哪里下载map输出的文件 通过MRAPPMaster获取哪些节点有map输出,当map执行结束后,会汇报给MRAPPMaster。reduce中的一个线程会定期询问MRAPPMaster以便获取map输出的位置15.如果map输出太多小文件怎么办 开启combiner合并,但是在求平均值的时候是不能使用的16.MapReduce优化的case 输入端:合并小文件 combineinputformat map端:提高环形缓冲区的大小,减少IO次数 开启combinerzookeeper篇1.zookeeper简单介绍一下,为什么要用zk?zk的架构?2.zk的数据存储,当重启后怎么重构zk的数据模型3.zk的原理,基于什么协议,follower和observer的区别,zk怎么扩容4.zab和raft的区别 引申到paxos和raft5.zk机房扩容有什么要注意的吗?(我只知道过半所以奇数个,其他的不知道6.cap原则Flume篇1.Flume都有什么组件,channel的特性以及什么时候该用什么类型的channel,除了Flume还有什么数据收集工具DataX,SqoopKafka篇1.Kafka在项目中起到的作用,如果挂掉怎么保证数据不丢失,不使用Kafka会怎样2.Kafka呢 怎么保证数据一致性 引申到exactly once3.Kafka通过哪些机制实现了高吞吐量?Hive篇1.如何理解Hive,为什么使用Hive2.Hive的实现逻辑,为什么处理小表延迟比较高因为其计算是通过MapReduce,MapReduce是批处理,高延迟的。小文件也要执行MapReduce。Hive的优势在于处理大数据,对于处理小数据没有优势HBase篇1.Hbase的架构,读写缓存?2.blockcache的底层实现?你提到了LRU那除了LRU还可以有什么方案?3.Hbase重启后怎么重构blockcache?(不会 只知道hlog和memstore)4.Hbase写入方式 bulkload 不同写入方式的应用场景Spark篇1.Spark on yarn的流程,分部署模式答2.怎样提高并行度 相关参数3.client和cluster模式的区别4.Spark shuffle以及为什么要丢弃hashshuffle5.讲讲Spark为什么比Hadoop快 6.RDD是什么,有什么特点7.RDD的血缘8.宽窄依赖9.stage划分10.Transform和Action算子分别有什么常用的,他们的区别是什么11.Spark 能产生shuffle的算子12.Spark里的reduce by key和group by key两个算子在实现上的区别并且说一下性能13.Spark内存管理14.Spark数据落盘15.看过Spark底层源码没有16.Spark程序故障重启,checkpoint检查点17.Spark 数据倾斜18.用Spark遇到了哪些问题19.Spark join的有几种实现20.背压机制应用场景 底层实现Flink篇1.Flink的组成2.Flink流批一体解释一下3.聊聊Sparkstreaming和Flink?为什么你觉得Flink比Sparkstreaming好?4.那Flink shuffle呢?你了解吗?5.watermark用过吗6.checkpoint Chandy-Lamport算法7.如何用checkpoint和watermark防止读到乱序数据。8.Kafka和Flink分别怎么实现exactly once,问的比较深入,我只回答了一些用法,二阶段提交说了流程,没说出来机制。9.流式框架1)节点挂了,怎么保证任务正常执行2)有状态怎么维护之前的状态3)checkpoint数据重用前提java基础篇1.java限定词(private那些)2.ArrayList原理,为什么初始是10,为什么扩容1.5倍3.hashmap的实现原理4.怎么解决hash碰撞+ 时间复杂度+优化+改成红黑树了时间复杂度+继续优化5.实现单例模式6.多路复用,NIO这些了解过吗?7.100M的数组 随机查快还是顺序查快 解释为什么?并发编程篇1.如何实现多线程 写过多线程吗2.4种线程池功能3.java内存模型4.java内存模型中,线程和进程会如何分配这些资源5.volatile的作用6.synchronized和volited的区别7.synchronized与lock的区别8.公平锁与非公锁的区别9.java锁都有什么,JUC包10.lock是公平的还是非公平的(答案是可以根据逻辑去自己实现是否公平)11.怎么保证线程同步?12.sychornized讲一下 和其他的区别13.sychornized怎么优化14.volatile可以保证原子性吗?15.cas呢?我讲了cas的原理 结果怼我 我不是问你原理 我是问你怎么保证原子性的?16.reentrantlock底层原理17.除了reentrantlock,你还知道什么锁18.读写锁底层实现原理和应用场合19.synchronize底层实现 锁升级 公平?20.多线程(线程间的通信,锁,volatile,CAS)算法篇都是网上的一些原题,自行寻找答案1.岛屿问题2.矩阵最小路径和问题 求矩阵最短路径3.判断一棵二叉树是否镜像对称4.判定二叉排序树5.二叉树之Z遍历6.非递归实现中序遍历7.二叉搜索树查找第k个8.堆排序9.桶排序10.股票交易1 211.二分查找12.k个一组反转13.重排链表14.链表排序(归并排序实现)15.包含min函数的栈 O(1)16.搜索旋转排序数组17.最长回文子串18.LRU19.数据结构 让你设计一个hash表 怎么设计?20.那设计一个hashtable21.string转int
点赞 24
评论 4
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
01-26 15:22
OPPO_AI算法部_AI研究员(准入职员工)
霸王茶姬内推,霸王茶姬内推码
1️⃣霸王茶姬面经(hr面) “简单自我介绍一下” 我大概讲了专业成绩和获奖等,我特意提到了我在社团有过活动策划的经历 “嗯有过活动策划经历是吧,说一下你对最近的市场热点有关注吗” “你了解霸王茶姬吗?就你的了解说一下” “你知道我们最近做的活动吗?” “你觉得你的沟通能力怎么样” “你知道达人是什么吗” “你了解我们这个岗位吗” “你觉得以你的经历,能为这个岗位带来什么,你做这个岗位的优势是什么” “你从大学城到公司大概要多久” -反问环节 问了薪资和上下班时间之类的 2️⃣霸王茶姬复试面经(部门主管面) “简单介绍一下自己” “你觉得做一个活动策划最重要的是什么” “你想从我们这个实习中获...
点赞
评论
收藏
分享
01-26 08:22
北京邮电大学 嵌入式工程师
秋招我最常用的托offer的话术
理由1:与父母沟通型话术1:您好,收到贵公司的offer非常荣幸,贵公司的发展前景和公司文化我都非常看好,与我的所学专业也很契合。目前我还没有和家里沟通,等我和家里沟通之后第一时间给您答复(这个时候一般可以拖2-5天,只要单位不催你,你就可以装死)。话术2:您好,这几天和家里沟通了贵单位的基本情况,家里各方面都挺满意的,但由于通勤较远(可替换其他原因)家里有点担心,想问问您公司有没有市内通勤车或者人才公寓呢(这里不管他回答什么,你都可以往下接)?我再和家里商量一下,三天内给您答复(这次如果催得紧最好说个时间,让公司感受到你的诚意)。理由2:系统故障型话术1:您好,我们学校的签约系统是网签。由于...
点赞
评论
收藏
分享
01-20 16:20
郑州升达经贸管理学院 Java
求助,今年大四,之前没有过实习,简历投出去都说不合适
实习,投递多份简历没人回...
点赞
评论
收藏
分享
01-12 13:39
西安电子科技大学 Python
怎么找实习
朋友说他那的实习生连环境都不会装,还不如我。可我怎么感觉找个实习特别难🥲
实习简历求拷打
点赞
评论
收藏
分享
01-19 10:15
库洛游戏_HR(准入职员工)
步步高内推,步步高内推码
步步高实验学校 2026届校招启动啦【学校简介】东莞市步步高实验学校于 2023 年投入运营,占地 230 亩,是一所集幼儿园、小学、初中、高中于一体的十五年一贯制非营利性高端民办学校,学校全面实行小班化教学,学校师生比为 1:5;步步高教育专家团队由来自一流大学的国家课标专家、教育学家,来自著名学校的卓越校长,来自一线、有着丰富教学经验的著名特级教师,以及来自国家级教育媒体的教育策划专家共同组成,为步步高的课程、教学、管理奠定了坚实基础。【招聘岗位】• 幼儿园、小学部及初中部各学科类教师 & 国际教师,类别多多,等你pick! 【福利待遇】• 薪资:幼儿园老师年收入16万起 、中小学...
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
牛客吐槽大会 | 有槽不吐,留着过年?吐完领现金红包,痛快!
4890
2
...
拥抱AI,程序员的最后出路
2371
3
...
J人永远闲不下来于是去提前实习
2076
4
...
真正会被取代的,是你心里面的幻觉
2006
5
...
马斯克最新炸裂采访,AI会带走一半工作岗位,普通人将何去何从?
1519
6
...
努力挣钱的意义具象化了
1443
7
...
mentor视角下的优秀实习生
1425
8
...
去独角兽做龙头还是去大厂做凤尾
1319
9
...
为什么说AI时代,老人反而没有新人吃香?
1315
10
...
大厂提前实习对AI开发的新感悟
1293
创作者周榜
更多
正在热议
更多
#
没关系,至少我的__很曼妙
#
3016次浏览
57人参与
#
机械人你知道哪些单休企业
#
82731次浏览
408人参与
#
赚钱的意义在这一刻具象化
#
3284次浏览
82人参与
#
AI时代的工作 VS 传统时代的工作,有哪些不同?
#
6803次浏览
154人参与
#
今年春招是金一银二嘛?
#
5383次浏览
58人参与
#
1月小结:你过的开心吗?
#
1217次浏览
41人参与
#
你的第一家实习公司是什么档次?
#
3159次浏览
54人参与
#
为什么有人零实习也能进大厂?
#
3508次浏览
74人参与
#
抛开难度不谈,你最想去哪家公司?
#
2706次浏览
70人参与
#
你的landing期是如何度过的?
#
6987次浏览
121人参与
#
一人一道大厂面试题
#
113989次浏览
1263人参与
#
当你问AI“你会取代我的工作吗”,它说_?
#
2634次浏览
83人参与
#
除了Java,最推荐学什么技术?
#
4621次浏览
121人参与
#
AI求职实录
#
2302次浏览
63人参与
#
你觉得什么岗位会被AI替代
#
36373次浏览
250人参与
#
在找工作求抱抱
#
1653399次浏览
10964人参与
#
参加完秋招的机械人,还参加春招吗?
#
103137次浏览
676人参与
#
哪些瞬间让你真切感受到了工作的乐趣
#
23160次浏览
99人参与
#
机械人春招想让哪家公司来捞你?
#
378897次浏览
3134人参与
#
银行笔面经互助
#
176420次浏览
1295人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务