小红书 数据开发一面二面面经

3.26 一面 40min 目前已约二面
岗位:数据湖开发 (今年春招感觉hc实在太少了,写点面经攒攒人品)
感觉自己发挥的并不是很好,但是也过了。。。
1. 自我介绍之后开始问项目
2.Hadoop 和spark的区别和优劣
3.谈到spark shuffle原理,hashshuffle 和 sortshuffle(这里我描述的不太清楚,说了半天,不知道最后说明白了没)
4.谈谈线程池,阻塞队列有界无界,救急线程
5.JVM内存模型
6.栈溢出的场景和应对方法
7.方法区能不能溢出,如果溢出的话储存的那些类信息怎么办
8.mysql索引设计原则
9算法题:经典两数之和,秒了后 延伸为三数之和
10 反问业务:数据湖技术栈主要为iceberg+flink(这个我确实没想到,以为是hudi)

总的来说偏八股,喜欢问细节,面试官比较少给反馈。。。搞得我后面好多都感觉答的不太好,但确实也是细节复习不到位

来更新下二面(在写的时候收到了三面通知)
一面以java八股为主,果然二面开始以大数据知识为主
1. 还是问项目
2. 还是问Hadoop和spark(不知道为什么面试官听了我的项目就喜欢问这个问题)
3. 谈谈spark的组件都有什么,on yarn模式有什么区别
4. spark那些外部资源 还有第三方jar包之类的都放在哪(应该是这么问的,不太会,说了下内存结构,告诉我是java classloader相关的机制)
5. 既然提到了内存结构,那就谈谈内存结构,堆外内存有什么优势(我脑子里面想的全都是劣势...)
6. spark standalone模式是怎么调度资源的,on yarn模式呢
7. spark executor内的task是怎么彼此隔离的(从线程池的角度,还有切分stage)
8. flink怎么实现exactly once(几乎是flink必问问题)
9. flink和spark streaming的区别
10. 详细说一下flink checkpointing吧,最好底层一些
11. 平时刷leetcode吗(我说刷,但对这部分不是很自信,就给我出了一道很简单的题哈哈)
12. 算法:很基础的把输入单词首字母大写输出,acm模式处理输入输出,随便写一写
13. 反问: 再问iceberg,确实比较好奇为什么不用hudi

小红书的面试感觉难度不低,好多问题其实都不是特别理解在问什么,纯按自己的理解在说,不够总体面试体验还是不错的

更新结果:4月就三面挂了 大家有兴趣我再更三面面经
#小红书校招##春招##面经##小红书##大数据开发工程师#
全部评论
老哥,,想请教一下,第7点spark executor内的task是怎么彼此隔离的(从线程池的角度,还有切分stage),这个问题怎么回答哇。。
1 回复 分享
发布于 2022-04-18 23:09
蹲一个二面面经
1 回复 分享
发布于 2022-04-01 08:34
更新结果:一个月前就三面挂了 大家有兴趣我再更三面面经
1 回复 分享
发布于 2022-05-11 15:12
请问楼主有专门学过jvm和MySQL的底层,还是只要背八股就行了
1 回复 分享
发布于 2022-03-28 18:50
应届生这么卷了么
点赞 回复 分享
发布于 2022-07-19 20:44
虽然已经是老大数据了,但还是鼓励你把三面发出来哈
点赞 回复 分享
发布于 2022-07-15 21:21
蹲更新后续3面
点赞 回复 分享
发布于 2022-04-12 13:06
楼主二面之后有消息吗?
点赞 回复 分享
发布于 2022-04-11 09:58
楼主,这个没有写sql题吗。数据开发一般是写算法题,然后不写sql题嘛。
点赞 回复 分享
发布于 2022-04-06 19:45
请问楼主简历上大数据相关的项目写的什么呀?
点赞 回复 分享
发布于 2022-04-02 18:29
二面问了我个很简单的dp,二十分钟不到给我挂了,甚至面着面着摄像头关了开始吃方便面了,妈耶,既然要刷干嘛还让我进二面呢?
点赞 回复 分享
发布于 2022-04-01 10:51

相关推荐

timeline6.5 ssob投递6.6 一面 (当天下午打电话一面过,但是没有接到,4天后问hr说面试已通过)6.11 二面 当场oc运气很好,没有遇到严厉地拷打。一面面试官极其温柔,每一个不会的点都笑着跟我说没事放一下面经一面:1.kotlin的by lazy是怎样实现的,by和lazy分开讲讲2.讲讲reified3. let,also,run,apply的具体实现讲讲4.多线程平时怎么使用5.线程池复用的底层是怎样实现的6.讲讲arraylist的底层,扩容7.讲讲SparseArray8.一个framlayout里面一个textview,点击textview,讲讲事件分发9.讲讲解决过的滑动冲突10.讲讲绘制流程11.onDrawForeground方法内部,滑动相关的发生了什么,什么是前景,有用过吗?12.代理模式是什么,动态代理和静态代理分别举例13.讲两个责任链式的样例,怎样实现的14.怎样使用对策略模式15.怎样进行的布局优化16.讲讲x2c17.讲讲实习所做的性能优化18.讲讲RecyclerView缓存复用机制19.http预热是怎样进行的,发生head请求后会为什么能达到预热的效果20.讲讲coil的内存缓存21.讲讲Lrucache的底层22.算法题:从BST中查找第k小的元素二面1.自我介绍2.怎样共享RecyclerViewPool3.讲讲RecyclerView的缓存复用机制4.讲讲启动优化是怎样进行的5.协程为什么比线程效率高6.讲讲什么是有栈线程 ,无栈协程7.怎样进行的网络优化8.讲讲对ai的使用9.如果让你在工作中进行图文相关内容的优化,你会对哪些方面下手10.在高速滑动的列表中,怎样去处理图片的加载11.怎样实现根据滑动的速度去动态调整加载内容的多少算法题:1.八皇后2.n 个人围成一圈, 并依次编号1~n。从编号为1 的人开始,按顺时针方向每隔一人选出一个,剩下的人重新围成一圈,如此循环直到剩下两人,这剩下的两人就是幸运儿。如果你想成为最后两个幸运儿,请问开始时应该站在什么位置?
求求你别挂我:另外赛码网真是烂极了
我的OC时间线
点赞 评论 收藏
分享
06-17 13:04
门头沟学院 C++
bg 大二 6.11一面 过1进程线程协程区别2协程3进程间通信4死锁条件5如何解决6tcp udp区别7三次握手四次挥手8time_wait9http各版本区别10网址请求流程 拓展如果是返回的是图片资源(断点续传)11websocket12弱网情况下13心跳机制14mysql数据结构15为什么b+16索引17索引失效18模糊情况下是否都失效19分库分表20主从时延的可能21如何解决22redis数据结构23底层实现24zset实现25跳表实现26持久化27aof和rdb区别28如何恢复29微服务和传统优势30微服务特别的优势31微服务通信32讲讲protobuf33protobuf优势34项目一结构35线程池实现36项目二rbac是什么37redis和mysql一致性38如果用canal伪装从库强一致性如何保证39算法:实现kvlru,附带过期机制40讲讲redis内存淘汰机制6.16二面 凉1. rbac是什么,怎么实现2. 超级管理员如何继承普通管理员的所有权限3. 缓存如何实现4. spring cache底层如何实现5. 更改数据库后删除缓存,如何保证缓存的删除6. 采用canal和消息队列就一定能保证缓存的删除吗7. 伪装的从服务器挂了怎么办8. 伪装的从服务器集群挂了怎么办9. 分布式锁能实现事务吗10. 如何优化一条sql语句11. explain会关注哪些参数12. 参数如何拼写13. 讲讲mysql中隔离级别14. 可重复读的隔离级别底层如何实现15. 讲讲https中的tls16. 了解非对称加密和对称加密吗17. 讲讲nginx的反向代理以及和正向代理的区别18. 讲讲负载均衡算法19. 具体实现知道吗20. 场景:超卖库存变更的mysql语句怎么写21. 算法:任务调度器
字节跳动二面531人在聊
点赞 评论 收藏
分享
评论
9
91
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务