虾皮一面

#发面经攒人品# #数据开发面经#  #我的秋招日记# #数据人的面试交流地# #26届秋招投递记录#

数开岗,面的非常愉快

一开始先介绍了面试流程
1.自我介绍,挑实习经历讲一讲
2.代码手撕
3.八股考察
4.QA环节

直接介绍实习经历,没有自我介绍,讲了10分钟开始手撕。
1.数据是真实数据吗
2.来源系统是同一个系统吗
了解了一下主要做的项目数据来源

手撕:
问了下比较熟的编程语言(java)
连续子数组最大和多少

知道虾皮是干嘛的吗
SQL  求销量表,每个类别下售量TOP10的商品id

排名连续怎么做

衣服这一品类数据量特别多,导致数据倾斜怎么处理,只针对这一场景处理
(二次聚合)
给谁加随机值,怎么加,举例
还有别的方法吗,只针对这个情景
(压缩)
你知道spark有做这件事吗(压缩)
自己工作中会开这个配置吗

spark和flink哪个比较熟,或者其他组件哪个学的好,可以自己挑个熟悉的来讲,还是随便挑个问

1.flink状态后端知道哪些
2.讲一下checkpoint是在干嘛
3.如果状态后端是Rocksdb,checkpoint是怎么存的
4.一个算子是怎么知道自己该做checkpoint
5.从checkpoint恢复的时候,怎么做的
6.一个算子,怎么知道恢复时应该读哪份文件
7.看过checkpoint文件里面的结构吗
8.有遇到过从checkpoint恢复时失败,是由于算子找不到从哪恢复的问题吗

spark方面的问题
1.executor, 他的内存分成几部分?
堆内堆外内存区别
为什么会有堆内堆外内存
2.在shuffule的过程中,这几部分是否/如何参与其

3.节点0OM,我有哪些方法或者配置,去优化?

最后反问

总结,面试官全程态度超好,一直在说别着急,没问题,会有正反馈,体验最好的一次面试

全部评论
佬什么bg,有后续吗?
点赞 回复 分享
发布于 09-28 21:30 河北

相关推荐

09-25 09:48
已编辑
南京大学 Java
9.23一面本人投递岗位:后端开发工程师Base:深圳面试时长:预计一小时但最后只面了40min(感觉已经挂了)面试之外: 面试当天会发邮件提醒,不过比较意外的是时间被改到了下午三点,之前约的是下午四点半,在这之前一点没有通知我改时间,好在我那个时间段也是有空的,各位可以注意下。题目总览: 八股+场景/设计+一道手撕+一道SQL自我介绍计网:- 介绍下TCP- TCP三次握手& 四次挥手 (感觉是必问的,我看虾皮的面经基本都问了这个)pring:- Spring MVC处理流程Java:- HashMap源码(底层实现)- HashMap为什么用红黑树- HashMap怎么扩容JVM:- 做项目遇到过OOM么?- OOM一般发生放在哪些区域- 怎么处理OOM- JVM调优场景/设计:- 十亿左右的订单数据,主要有订单ID,用户ID,商品ID三个字段,怎么把它存到MySQL中去- 分库分表的话那么单表的数据你觉得应该设置多大?- 你会按照什么逻辑进行分库分表?- 假如按照刚才的设计,现在需要查询用户A最近一个月的所有订单,怎么查询?(这里岔开讲了redis八股,然后又回到了场景设计)- 在线购物平台,如果出现大规模订单请求,怎么对系统进行优化升级(高并发)- 怎么确保订单数据不丢失(从前端到后端)Redis:- 你平时用redis会用到哪些数据结构- zset为什么可以排序/实现有序- 你在项目中怎么用Redis的,具体说明手撕:- 二叉树原地转成链表(按照前序遍历的顺序),核心代码模式即可写完不需要跑样例,只需要说明思路以及时空间复杂度SQL:一个employee表,一个department表,要求查询出每个部门工资最高的5个员工。自我反省: 八股回答地还可以,但是场景设计被拷打烂了,还是缺少相关的积累,虽然目前还没把我挂了,但感觉已经没啥机会了,就当积累经验吧9.25更新:不出意外收到感谢信了
查看22道真题和解析
点赞 评论 收藏
分享
评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务