【数开秋招面经】百度-电商
面试时间:2025.09
面试部门:电商
timeline:09.24一面,09.29二面,然后转到正式批流程中,就没有后续了
一面(80min)
- 面试官介绍部门业务
- 自我介绍+实习经历简介
- 实习经历全方位拷打(35min)
- Spark SQL的运行流程
- Spark SQL编译过程中做的一些优化手段
- 刚才提到的都是静态优化,有没有动态优化的手段
- Spark有哪些Join方式,如何选择,优先级是什么
- sql题:给一张表student,记录了学生的分数:id, item(课程), score
- 求科目前10名 以及每个科目的最高分
- 追问:求最高分是否可以不用join
- 求各学科均>60的学生
- 追问:如果极端情况,某一科所有学生都缺考了,如何处理
二面(1h)
- 自我介绍
- 实习内容介绍(业务背景,核心指标,主要工作内容)
- 业务域的划分情况
- Flink实时链路如何处理数据的
- Spark shuffle方式,hash shuffle和sort-merge shuffle的对比,各自的适用情况
- 如果一个Spark任务运行时间特别长,如何去排查问题
- Spark如何解决数据倾斜问题
- 一道sql题:给一张员工工资记录表,记录了2020年各员工每月的工资发放情况,从中找出连续工作3个月以上的月份,计算每月的累计工资,结果按照月份升序排序

