首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
课程
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
在线笔面试、雇主品牌宣传
登录
/
注册
卫池虎然
华中科技大学 电子信息类
发布于湖北
关注
已关注
取消关注
@优秀的张先生:
十余家公司大数据开发面经
背景介绍 楼主5月初入职滴滴实习,7月底得知今年滴滴不好转正,遂离职复习巩固 基础+项目 备战秋招。因为准备的时间比较早,有幸赶上了各大厂的提前批面试,面试岗位是大数据开发工程师,因为牛客上关于大数据的面经一直很少,所以写一篇大数据面经造福后来人,也记录一下这段难忘的时光。我本科是水利水电专业,研究生转入软件工程,编程语言用Java,做过一个大数据开发的项目,以Kafka作为数据总线,所以Kafka的问题会涉及的比较多,实习期间主要是写hive sql,所以会有比较难的sql题,大家可以结合自己的项目和实习经历进行针对性复习。下面的面经只涉及技术,hr面就不写了,因为不同公司会有重复的问题,重复的问题也不写了。个人觉得不错的大数据学习网站:http://dblab.xmu.edu.cn/blog/ 腾讯IEG(offer) 一面(全程问基础): 1、介绍项目 2、String、StringBuffer、StringBuilder的区别,怎么理解String不变性 3、==和equals的区别,如果重写了equals()不重写hashCode()会发生什么 4、volatile怎么保证可见性,synchronized和lock的区别,synchronized的底层实现 5、sleep和wait的区别,sleep会不会释放锁,notify和notifyAll的区别 6、了不了解线程的局部变量,讲讲线程池参数 7、什么情况会发生死锁,死锁的处理方法 8、Cookie和Session的区别,怎么防止Cookie欺骗 9、从用户在浏览器输入域名,到浏览器显示出页面的过程 二面(全程怼项目,压力面): 1、看你写过UDF,谈谈对UDF的理解,写UDF的目的,代码怎么写的 2、改造hive表后怎么进行数据一致性校验的,有没有自动化流程 3、看你读过kafka源码,讲讲kafka broker的源码里面你最熟悉的类,以及这个类的主要方法,用的什么设计模式 4、项目里面从数据采集到最终的数据可视化,每个环节都有可能丢数据,怎么判断数据有没有丢,如果丢了如何定位到在哪一个环节丢的 5、项目里面为什么要用kafka stream做实时计算,而不是用spark或者flink,kafka sql和spark sql了解过吗 6、项目里面用到了时序数据库opentsdb,为什么要用这个,有没有跟其它的时序数据库对比过 7、平时逛不逛社区,有没有参与过开源项目 三面(接着怼项目): 1、看你写了实时计算的程序,你怎么保证计算的结果肯定是对的 2、数据接入的时候,怎么往kafka topic里面发的,用的什么方式,起了几个线程,producer是线程安全的吗 3、kafka集群有几台机器,怎么确定你们项目需要用几台机器,有评估过吗,吞吐量测过吗 4、spark streaming是怎么跟kafka交互的,具体代码怎么写的,程序执行流程是怎样的,这个过程中怎么确保数据不丢 5、kafka监控是怎么做的,kafka中能彻底删除数据吗,怎么做的 面委会(全程聊天): 平时是怎么学习的,爱看哪些博客,怎么看待加班,有没有成为leader的潜力 网易考拉(offer) 一面: 1、sql题:学生成绩表,把每科最高分前三名统计出来 2、算法题:二维数组中的查找 3、kafka如何保证高吞吐的,了不了解kafka零拷贝,具体怎么做的 4、sql有几种join,map join了解过没 5、hbase中row key该怎么设计 6、hdfs文件上传流程,hdfs的容错机制 7、怎么解决hive数据倾斜问题 二面(全程写写写): 1、算法题:二维矩阵相乘 2、算法题:链表中环的入口 3、写一下mysql binlog的数据格式,怎么进行数据清洗的 4、写一个正则表达式进行手机号匹配 5、讲一下数据仓库层级的划分,每层的作用 美团新到店(offer) 去了北京美团公司里面试,一上午面完,第二天通知高分通过 一面(简单的聊了聊,10min): 1、介绍项目,以及滴滴的实习经历 2、JVM内存的划分 3、垃圾收集算法 4、数据建模,星型模型和雪花模型 5、数仓层级的划分,怎么对接到mysql拿数据 二面: 1、sql题:写一条sql删除订单表中重复的记录 2、sql题:一张网页浏览信息表,有两列,一列是网页ip,一列是浏览网页的用户(比如a或者b、c、d直到z),求这些网页被a和b或者a和c或者b和c两两组合访问的次数 3、hive数据倾斜产生的原因,怎么解决 4、设计学生成绩管理系统,符合第三范式要求,并绘出UML图 5、算法题:斐波那契数列 6、spark程序的运行流程 7、spark streaming从kafka中读数据的两种方式 8、讲讲数据库索引,B树和B+树 9、Elasticsearch的索引,单field索引和多field的联合索引 10、linux查看某文件的大小,vim中怎么替换内容 11、海量数据的Count问题(单机),如果把大文件hash成不同的小文件,此时小文件装不下某个key对应的数据,该怎么办 12、智力题:8升水,有一个5L的杯子和3L的杯子,怎么得到4升水 三面: 1、osi七层模型,三次握手和四次挥手,为什么两次握手不行 2、kafka怎么保证高吞吐量,项目中有测过吞吐量吗,相比于其它MQ,为什么会选择kafka,kafka怎么保证exactly once语义 3、了解hbase吗,hbase为什么查询速度快 4、hive sql怎么转换成底层的MapReduce程序,以及shuffle的过程 5、算法题:被围绕的区域,leetcode第130题原题 6、智力题:一头母牛每年生一头小母牛,每头小母牛从第四年开始,每年也会生一头小母牛,写个公式求第n年会有多少头牛 小米(offer) 一面: 1、java和python的区别,对面向对象的理解,和面向过程相比有什么区别 2、java为什么不能多继承 3、讲一下java抽象类和接口 4、java中为什么要写非static方法 5、volatile和synchronized的区别 6、算法题:跳台阶问题 7、算法题:树的非递归后序遍历 8、设计题:一个停车场有一些大车位和小车位,大车只能停大车位,小车既能停大车位又能停小车位,实现这种场景下的调度系统 二面: 1、算法题:输入一个字符串,输出该字符串中字符的所有排列 贝壳(offer) 一面: 1、synchronized的底层实现 2、线程等待时位于哪个区域,具体讲一下 3、谈谈对kafka的理解,能讲多少讲多少 4、算法题:二分查找 5、快排的时间复杂度和空间复杂度,最优情况和最差情况分别是多少,是稳定排序吗,快排为什么快 二面: 1、介绍项目,项目中涉及到了一些算法,介绍一下 2、两道算法题:路径问题,leetcode上63题和64题原题 3、写正则表达式匹配电话号码 4、智力题:一张圆桌子,我和面试官轮流往桌子上放硬币(随便放),直到桌子放不下为止,最后一个放硬币的人赢,如果我先放,怎么保证我肯定赢 华为(offer) 一轮玄学面: 面试官是做安卓的,瞧不起大数据,觉得大数据很虚,我跟他bb了一堆。然后问我有没有女朋友,我说以前有,现在分了;问我什么时候谈的,什么时候分的,我说本科谈的,毕业分了;问我为什么要分,此处省略一万字......问我现在想没想过再谈,我说毕竟转专业过来的,想趁在校期间利用好短暂的时光提升自己的技术水平(其实因为找不到);然后面试官说以后工作了就不好找咯,我说您说的有道理............ 快手(offer) 一面: 1、jvm类加载机制,类加载器,双亲委派模型 2、java实现多线程的方式 3、spark怎么划分stage,宽窄依赖,各包括哪些***作 4、zookeeper怎么保证原子性,怎么实现分布式锁 5、写个快排,为什么要用三数取中法,好处是什么 二面: 1、sql题:找出单科成绩高于该科平均成绩的同学名单(无论该学生有多少科,只要有一科满足即可) 2、sql题:找出单科成绩高于该科平均成绩的同学名单(该学生所有科都必须满足) 3、算法题:求数组中连续子数组的最大和 4、算法题:使用最小花费爬楼梯,leetcode746题原题 三面: 1、讲一下java IO 2、算法题:输入n个整数,找出其中最大的k个数 3、算法题:给一个整数数组和一个目标值,找出数组中和为目标值的两个数 完美世界(offer) 京东广告部(四面完没了消息) 阿里菜鸟(三面完已回绝) 阿里的面试还是比较重视基础的,应该是bat里面问基础问的最多的 一面: 1、HashMap和HashTable的区别,HashMap怎么解决hash冲突,jdk1.8后对HashMap的改进 2、讲讲ConcurrentHashMap,ConcurrentHashMap怎么保证线程安全,HashTable怎么保证线程安全 3、HashSet的底层实现,是不是线程安全的 4、ArrayList和LinkedList的区别,是不是线程安全的 5、讲讲设计模式,最常用哪种设计模式,单例模式的实现方式 6、进程和线程,Java实现多线程的方式,什么是线程安全,怎么保证多线程线程安全 7、可重入锁的可重入性是什么意思,哪些是可重入锁 8、为什么要用线程池,线程池的好处 9、JVM垃圾处理方法,对象什么时候进入老年代,什么时候进行FullGC 10、Java堆溢出问题怎么处理,内存泄漏和内存溢出的区别 11、智力题:50个红球和50个黑球往两个桶里放,然后自己去抽,怎么样才能使抽到红球的概率最高 二面: 1、讲讲数据库存储引擎 2、介绍一下索引,索引设置的规则,聚簇索引和非聚簇索引的区别,索引的最左前缀原则 3、用过redis吗,redis支持哪些数据类型,redis与mysql的区别 4、了解垃圾收集器吗,分别介绍介绍 5、jvm调优做过没,-Xms和-Xmx分别指什么 6、算法题:输入两个字符串,输出它们合并排序后的结果 三面: 1、讲讲数据库的范式 2、Linux进程通信和线程通信 3、线程池的参数 4、什么是内部类,什么是匿名内部类 5、设计题:一个市有9个消防站,现在要新增3个消防站,这3个消防站应该放在哪里 另: 欢迎探讨相关技术;欢迎探讨人生规划;欢迎在逆境中昂起头颅、继续阔步向前!
点赞 104
评论 71
全部评论
推荐
最新
楼层
蔚来
校招火热招聘中
官网直投
相关推荐
软件部长
06-06 10:25
研发工程师
数据分析全流程详解:只需三步,让你从数据小白变大神
“数据分析”这个词可能大家都非常熟悉,但是对数据分析的具体流程和步骤可能比较迷茫。一个完整的数据分析流程是怎样的?从数据采集到最终分析的整个流程中,哪些是关键节点?今天,我用一个简单通俗的例子,让你轻松掌握数据分析的全流程!一、为什么需要数据分析我们现在已经进入数据时代,企业的运营中离不开数据。然而,仅仅拥有数据并不足以支撑企业的决策和未来发展,关键在于我们如何有效地利用这些数据。通过数据分析,我们可以发现业务运营中的潜在问题、市场趋势以及客户需求等关键信息;在面临重大决策时,我们可以基于数据分析的结果来评估不同选项的潜在风险和收益,从而选择最优方案;在企业运营中,通过对业务数据进行实时监控和...
点赞
评论
收藏
分享
林小白zii
06-07 14:24
香港大学 计算机类
阿里大文娱笔试 阿里大文娱笔试题 0423
笔试时间:2024年04月23日 历史笔试传送门:2023秋招笔试合集第一题题目小红定义一个矩阵的“转置权值”为该矩阵与其转置知阵对应位置差的绝对值之和。例如,对于矩阵: 1 2 3 4 而言,其转置矩阵是: 1 3 2 4 所以该矩阵的转置权值是 |1-1|+|2-3|+|3-2|+|4-4|=2,小红拿到了一个 n*n 的矩阵。她想知道该矩阵的转置权值是多少。输入描述第一行输入一个正整数n,代表矩阵的大小。接下来的 n行,每行输入n个正整数,用来表示矩阵。输出描述输出一个整数,代表该矩阵转置权值的值。样例输入21 23 4样例输出2参考题解累加abs(a[i][j] - a[j][i]) ...
查看3道真题和解析
投递阿里巴巴等公司10个岗位 >
2024 BAT笔试合集
点赞
评论
收藏
分享
范晨
04-29 20:16
唐山师范学院 计算机类
7k 996
❤️职场感受7k 996 我看谁能去
点赞
评论
收藏
分享
九门空城
06-10 21:13
西安交通大学 计算机类
26届java后端简历求拷打
26届,想暑假找个日常实习,希望大佬帮忙修改一下简历。另外求求经验
点赞
评论
收藏
分享
点赞
收藏
评论
分享
回复帖子
提到的真题
返回内容
全站热榜
1
...
一位计算机应届生的回首。
7699
2
...
除了互联网,还能关注哪些公司
6189
3
...
25届机械/制造笔面经互助来啦!!
5839
4
...
学后端压力太大了,我昨晚做梦我死了,然后来到了阎王殿,阎王爷让我给生死簿做一个后台管理系统 #段子#
5489
5
...
25校招痛苦文学
4819
6
...
简单记录一下找实习的这几个月吧~
4237
7
...
oppo VS 京东
3975
8
...
6.12校招&实习招聘信息汇总
3849
9
...
网易互娱 许愿许愿🥹🥹
3712
10
...
海康威视实习真的挺香的
3322
正在热议
#
牛客帮帮团来啦!有问必答
#
1294067次浏览
18333人参与
#
来聊聊你目前的求职进展
#
226336次浏览
2855人参与
#
OPPO开奖
#
56215次浏览
807人参与
#
和牛牛一起刷题打卡
#
39846次浏览
3232人参与
#
实习好累,可以辞职全力准备秋招吗
#
6697次浏览
156人参与
#
参加过提前批的机械人,你们还参加秋招么
#
15962次浏览
372人参与
#
极具前瞻性,现代汽车编程题
#
4585次浏览
129人参与
#
谈薪时HR压价该怎么应对
#
42830次浏览
317人参与
#
机械制造笔面经
#
6080次浏览
190人参与
#
如何确定求职岗位
#
157132次浏览
3002人参与
#
你觉得今年秋招难吗
#
346739次浏览
6119人参与
#
如果可以选,你最想从事什么工作
#
216521次浏览
3351人参与
#
学历对求职的影响
#
170669次浏览
1882人参与
#
0offer是寒冬太冷还是我太菜
#
469511次浏览
5222人参与
#
2023届毁约公司名单
#
104358次浏览
459人参与
#
秋招提前批启动你开冲了吗
#
32266次浏览
805人参与
#
硬件人的简历怎么写
#
84404次浏览
885人参与
#
2022届毕业生现状
#
357178次浏览
4770人参与
#
非技术岗薪资爆料
#
50295次浏览
710人参与
#
运营人求职交流聚集地
#
41030次浏览
659人参与
#
晒一晒我的offer
#
3987763次浏览
60103人参与
#
我的成功项目解析
#
99709次浏览
2781人参与
牛客网
牛客企业服务