Shopee 大数据开发暑期实习面经

📍 公司:虾皮(Shopee)

💼 岗位:大数据开发工程师

📅 面试时间线:

7.30 一面
8.4 二面
8.8 收到感谢信(未通过)
面试问题记录
请介绍你实习中负责的数仓数据流向及核心业务场景。
详细说明一个具体业务模块,包括所用技术栈与上下游用户。
针对问题2中的业务,如何处理并发场景下的“不可重复读”问题?
大数据技术栈掌握情况?重点提问 Spark 的使用经验。
如何优化实际 Spark 任务?请举例(如数据倾斜、Shuffle 优化)。
描述快速排序算法的基本思想(穿插在数据倾斜优化中考察基础)。
是否遇到过数据写错的情况?若数仓数据写入 Kafka 错误,如何修复?
➤ 进一步追问:HDFS 数据已错,但 Kafka → 业务表已生效,如何保证一致性与服务可用性?
若需从某个 Kafka Topic 消费数据并入库数仓,你会如何设计流程?(开放性问题)
🙌 面试感悟
虽为实习经历深挖,但问题贴近真实生产场景,尤其关注高可用、数据一致性、容错与恢复机制;
对数据链路的闭环理解要求较高,需清楚“从出错到修复”的全链路影响;
建议提前准备:
✅ 典型数据倾斜解决方案(如加盐、两阶段聚合)
✅ Kafka 重放与幂等写入策略
✅ 数仓分层中各层容灾与回溯能力设计
📌 C端业务对数据质量与系统稳定性要求高,面试更倾向考察“出问题后怎么办”的应急思维。

#发面经攒人品#
全部评论
这么复杂还没通过嘛 太哈人了
2 回复 分享
发布于 2025-09-12 17:25 澳大利亚

相关推荐

2025-12-16 10:10
上海大学 Java
1.先上秋招结果,共面试场数40+:最终去向:pddoffer:vivo、去哪儿、pdd、华为、碧桂园、京东hr面挂 or 排序挂:米哈游、贝壳、顺丰、百度三面挂:网易雷火、得物二面挂:美团一面挂:浪潮主动拒绝:网易互娱、度小满、作业帮、美的、巨人网络简历挂 or 笔试挂:数量100+2.心路历程个人bg双非本211硕,从研一就开始准备就业,主Java副Unity,因为实验室是搞Unity的,所以有不少项目,上半年找实习时,我总觉得没准备好,就一直没投,直到3月底才投出去第一份简历,但其实那时候已经很晚了,加上找暑期之前0实习,0真实项目,自然是被挂麻了。最后在六月的尾巴侥幸去了一个非互联网但在房地产和物业领域是龙头的企业,并且真的去入职了之后内部氛围也是非常的好最后那边也给了转正机会,但是考虑了很多还是拒掉了,这里也是非常非常感谢那边给我的机会我实习的时候因为工资不高,只能住学校,但是学校跟公司有两个小时左右的车程,转两站地铁+走一公里多一点。每天6点半就要起床,晚上8点左右才能回学校,回去之后再去操场健身,大概10点才回寝室吃晚饭。这是周一到周五,周末因为还要给导师干项目,所以周六周天全部去实验室工作。就这样早7晚10,一周7天的作息,我坚持了三个月。现在回头看看也是颇具感慨~一转眼到了八月份秋招,我深刻意识到不能再拖了,早早的写好了简历开投,但是由于我bg比较差,且只有一段实习还不是互联网,尽管开始的早一点,还是被挂麻了后面面试机会慢慢多起来之后,才有点转机,最后也是顺利能拿下几家意向这段经历实属宝贵,挺过来之后感觉个人的心态和抗压能力都成长了不少
2025年终总结
点赞 评论 收藏
分享
评论
2
8
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务