小红书 数据开发一面二面面经

3.26 一面 40min 目前已约二面
岗位:数据湖开发 (今年春招感觉hc实在太少了,写点面经攒攒人品)
感觉自己发挥的并不是很好,但是也过了。。。
1. 自我介绍之后开始问项目
2.Hadoop 和spark的区别和优劣
3.谈到spark shuffle原理,hashshuffle 和 sortshuffle(这里我描述的不太清楚,说了半天,不知道最后说明白了没)
4.谈谈线程池,阻塞队列有界无界,救急线程
5.JVM内存模型
6.栈溢出的场景和应对方法
7.方法区能不能溢出,如果溢出的话储存的那些类信息怎么办
8.mysql索引设计原则
9算法题:经典两数之和,秒了后 延伸为三数之和
10 反问业务:数据湖技术栈主要为iceberg+flink(这个我确实没想到,以为是hudi)

总的来说偏八股,喜欢问细节,面试官比较少给反馈。。。搞得我后面好多都感觉答的不太好,但确实也是细节复习不到位

来更新下二面(在写的时候收到了三面通知)
一面以java八股为主,果然二面开始以大数据知识为主
1. 还是问项目
2. 还是问Hadoop和spark(不知道为什么面试官听了我的项目就喜欢问这个问题)
3. 谈谈spark的组件都有什么,on yarn模式有什么区别
4. spark那些外部资源 还有第三方jar包之类的都放在哪(应该是这么问的,不太会,说了下内存结构,告诉我是java classloader相关的机制)
5. 既然提到了内存结构,那就谈谈内存结构,堆外内存有什么优势(我脑子里面想的全都是劣势...)
6. spark standalone模式是怎么调度资源的,on yarn模式呢
7. spark executor内的task是怎么彼此隔离的(从线程池的角度,还有切分stage)
8. flink怎么实现exactly once(几乎是flink必问问题)
9. flink和spark streaming的区别
10. 详细说一下flink checkpointing吧,最好底层一些
11. 平时刷leetcode吗(我说刷,但对这部分不是很自信,就给我出了一道很简单的题哈哈)
12. 算法:很基础的把输入单词首字母大写输出,acm模式处理输入输出,随便写一写
13. 反问: 再问iceberg,确实比较好奇为什么不用hudi

小红书的面试感觉难度不低,好多问题其实都不是特别理解在问什么,纯按自己的理解在说,不够总体面试体验还是不错的

更新结果:4月就三面挂了 大家有兴趣我再更三面面经
#小红书校招##春招##面经##小红书##大数据开发工程师#
全部评论
老哥,,想请教一下,第7点spark executor内的task是怎么彼此隔离的(从线程池的角度,还有切分stage),这个问题怎么回答哇。。
1 回复 分享
发布于 2022-04-18 23:09
蹲一个二面面经
1 回复 分享
发布于 2022-04-01 08:34
更新结果:一个月前就三面挂了 大家有兴趣我再更三面面经
1 回复 分享
发布于 2022-05-11 15:12
请问楼主有专门学过jvm和MySQL的底层,还是只要背八股就行了
1 回复 分享
发布于 2022-03-28 18:50
应届生这么卷了么
点赞 回复 分享
发布于 2022-07-19 20:44
虽然已经是老大数据了,但还是鼓励你把三面发出来哈
点赞 回复 分享
发布于 2022-07-15 21:21
蹲更新后续3面
点赞 回复 分享
发布于 2022-04-12 13:06
楼主二面之后有消息吗?
点赞 回复 分享
发布于 2022-04-11 09:58
楼主,这个没有写sql题吗。数据开发一般是写算法题,然后不写sql题嘛。
点赞 回复 分享
发布于 2022-04-06 19:45
请问楼主简历上大数据相关的项目写的什么呀?
点赞 回复 分享
发布于 2022-04-02 18:29
二面问了我个很简单的dp,二十分钟不到给我挂了,甚至面着面着摄像头关了开始吃方便面了,妈耶,既然要刷干嘛还让我进二面呢?
点赞 回复 分享
发布于 2022-04-01 10:51

相关推荐

03-28 10:27
已编辑
门头沟学院 Java
没有手撕算法环节一面 技术面1.==和equal的区别2.主要考察的是对jvm的理解吧静态变量 实例变量 局部变量的存储在jvm哪个位置,什么时候会释放2.集合遍历的时候能删除元素吗3.SpringBean的生命周期4.设计模式 讲一讲策略模式 然后问了一下优缺点5.如何做一个接口限流 一分钟限制一百次?我答用redis在拦截器层直接做就好了 有请求过来用户标识对应的接口路径请求次数+1  用过期时间来维护一分钟然后我突然想到了边界性问题 万一是还剩五秒过期请求了80次然后过期后的五秒钟又请求了80次 不是还会突破限流吗 然后我在那里想这个 卡了一下面试官问有什么疑问吗 我重新回答了一下 说可能会临界窗口突刺 这种情况要用滑动窗口了 他说没事 不用考虑这种复杂情况 就是很简单的做限流就好了 所以考察的应该是redis的简单使用吧6.在5的基础上问的 说这个接口限流要一起给同事用 怎么操作 其实我没太听明白这道题的意思 我问了两遍啥意思 还是没太听懂 最后他引导了我一下 我答出来了 原来考察的是aop 用注解的形式对方法进行功能增强拓展7.在6的基础上问了spring三大特性应该就没了…中间可能有一点点遗漏的问题 前一段时间面的 不太记得了 但一面整体难度偏低二面 技术面纯项目 无自我介绍1.让我说说我的项目2.问我项目中用到微信支付 出现一笔订单支付两次的情况怎么办 第一次支付了回调没过来 第二次又支付了 这一点我没考虑过 我一直觉得一笔订单只能支付一次 支付过的订单就没法支付了 微信服务端会替我处理好 下来问了问ai 还真有可能出现这种情况 还是太才疏学浅了3.问微信支付回调中 如果我代码逻辑有问题 或者网络抖动 没有回调成功 边界性问题我怎么处理的我稍微答出来一点点 微信回调避免业务逻辑耦合 直接推rabbitmq处理 其它是真想不到了 因为我做的平台和pdd这种电商平台是完全不一样的 实体产品可能网络恢复后还可以做重发货处理 但我是虚拟产品 用户也不用注册没有标识 都是匿名操作 退出页面 我也没办法继续操作了 只能用户手动补偿 我觉得面试官没太理解我的项目的机制 他直接按传统的货物交易平台来直接问我经典的场景问题了 导致我对他的问题感觉无从下手 因为很多策略都不通用4.问我对ai的了解和使用5.分享一下用ai的技巧6.prompt在哪个文件里改…基本就没了 二面整体感觉强度挺大的 每一个点都要刨根问底 你回答的时候他觉得你会的就会直接跳过 然后你不会的 他就会一直逮着问 问的很具体很细致 给我营造了一种我什么都答不上来的感觉 到后面直接压力爆炸了 感觉二面应该是G了
查看14道真题和解析
点赞 评论 收藏
分享
查看13道真题和解析
点赞 评论 收藏
分享
评论
9
92
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务