大数据开发工程师精选面经合集
1家公司
5篇面经
最新 热门
/feed/main/detail/8cbdaee7e9a84c36a934c9072a94d685/discuss/797963803425001472/discuss/797851969380470784/feed/main/detail/ee52a7bf5dbe48f694012bec9a326960/feed/main/detail/50348a6070b545d78248924e6938de3a/discuss/797851628010225664/feed/main/detail/074b48c88b064ae2ac3fe7899ecb2afc/discuss/797524636320681984/discuss/797851109275582464/feed/main/detail/5fa49da59ae44651bf631852e9983537/discuss/797376009342357504/feed/main/detail/b61f0078e4c64688b2b6b23ac19e7fbc/feed/main/detail/da3bfa0185744c92a8a57b80f0559c53/discuss/796737137390391296/feed/main/detail/981467dd8a4740d488e23dffc0a522dc/feed/main/detail/ea637f0b14394333b11336774feafbf0/discuss/795404971502997504/feed/main/detail/70b85c9721604ffb9089bc20e9c2b5df
09-15 20:34
已编辑
门头沟学院
JDS 京东秋招数开一面
查看18道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/85c4ec7ae5274672afb85a7e1d7261f2
09-09 20:08
产品经理
Shopee 大数据开发暑期实习面经
📍 公司:虾皮(Shopee)💼 岗位:大数据开发工程师📅 面试时间线:7.30 一面8.4 二面8.8 收到感谢信(未通过)面试问题记录请介绍你实习中负责的数仓数据流向及核心业务场景。详细说明一个具体业务模块,包括所用技术栈与上下游用户。针对问题2中的业务,如何处理并发场景下的“不可重复读”问题?大数据技术栈掌握情况?重点提问 Spark 的使用经验。如何优化实际 Spark 任务?请举例(如数据倾斜、Shuffle 优化)。描述快速排序算法的基本思想(穿插在数据倾斜优化中考察基础)。是否遇到过数据写错的情况?若数仓数据写入 Kafka 错误,如何修复?➤ 进一步追问:HDFS 数据已错,但 Kafka → 业务表已生效,如何保证一致性与服务可用性?若需从某个 Kafka Topic 消费数据并入库数仓,你会如何设计流程?(开放性问题)🙌 面试感悟虽为实习经历深挖,但问题贴近真实生产场景,尤其关注高可用、数据一致性、容错与恢复机制;对数据链路的闭环理解要求较高,需清楚“从出错到修复”的全链路影响;建议提前准备:✅ 典型数据倾斜解决方案(如加盐、两阶段聚合)✅ Kafka 重放与幂等写入策略✅ 数仓分层中各层容灾与回溯能力设计📌 C端业务对数据质量与系统稳定性要求高,面试更倾向考察“出问题后怎么办”的应急思维。
查看9道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/c7f1548b4aba4bad99897bcbc4841d34
玩命加载中
写面经
发动态
发动态
发帖子
写文章

全站热榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务