26校招百度推荐算法面经
1. 详细讲讲你第一个实习项目的内容和背景。
2. 你们采用的是四塔结构(多目标建模),相比传统的双塔结构(用户塔+商品塔),它的优势体现在哪些方面?带来了哪些实际提升?
3. 离线流程是如何设计的?线上服务调用离线结果时,是实时更新还是按固定周期刷新?
4. 用户塔中用了哪些特征?模型上线后,你们重点监控了哪些指标?比如场景内的表现,以及跨类目的泛化能力等。
5. 多模态特征的维度大概是多少?为什么加入多模态特征后,全量上线效果显著提升?
6. 在商品塔中引入多模态 encoder 后,为什么离线评估效果反而下降了?你们有分析原因吗?
7. 讲讲你参与的第二个项目。这个项目中特征工程是如何优化的?混合负采样策略是怎么设计的?损失函数选的是什么?有没有尝试不同的激活函数?效果如何?
8. 在模型迭代过程中,有没有尝试其他结构,比如专家网络(如 MMoE)?效果如何?
9. 基础知识点:
- 如何有效防止模型过拟合?
- Transformer 的基本结构是怎样的?
- 决策树的构建原理:基尼指数、信息增益率的计算公式?它们分别代表什么?是越大越好还是越小越好?节点如何划分?树的深度如何控制?如果树太深了怎么办?
- GBDT 相比传统决策树做了哪些改进?
10. 编程题:给定一个升序排列的数组和一个目标值,编写函数找出该值在数组中出现的起始位置和结束位置。
2. 你们采用的是四塔结构(多目标建模),相比传统的双塔结构(用户塔+商品塔),它的优势体现在哪些方面?带来了哪些实际提升?
3. 离线流程是如何设计的?线上服务调用离线结果时,是实时更新还是按固定周期刷新?
4. 用户塔中用了哪些特征?模型上线后,你们重点监控了哪些指标?比如场景内的表现,以及跨类目的泛化能力等。
5. 多模态特征的维度大概是多少?为什么加入多模态特征后,全量上线效果显著提升?
6. 在商品塔中引入多模态 encoder 后,为什么离线评估效果反而下降了?你们有分析原因吗?
7. 讲讲你参与的第二个项目。这个项目中特征工程是如何优化的?混合负采样策略是怎么设计的?损失函数选的是什么?有没有尝试不同的激活函数?效果如何?
8. 在模型迭代过程中,有没有尝试其他结构,比如专家网络(如 MMoE)?效果如何?
9. 基础知识点:
- 如何有效防止模型过拟合?
- Transformer 的基本结构是怎样的?
- 决策树的构建原理:基尼指数、信息增益率的计算公式?它们分别代表什么?是越大越好还是越小越好?节点如何划分?树的深度如何控制?如果树太深了怎么办?
- GBDT 相比传统决策树做了哪些改进?
10. 编程题:给定一个升序排列的数组和一个目标值,编写函数找出该值在数组中出现的起始位置和结束位置。
全部评论
相关推荐
10-23 10:26
山东大学 前端工程师 点赞 评论 收藏
分享

