淘天集团 算法工程师-搜索推荐 一面凉经
时间:2025.5.12
部门:淘天集团-搜推智能产品事业部-自营&近场算法
时长:35min,电话面
全程围绕项目进行提问以及相关八股的拷打
- 项目为什么会选择ESMM框架,是否有分析过ESMM和MMoE的区别,包括最终对结果的影响或架构上的区别
- ESMM对解决样本偏差这方面的优势,模型结构上的体现
- 多目标建模理论具体细节,是否是label方面实现CTR和CVR二分类
- 如何体现的eCPM最大化
- 在正常的广告系统里面有两种方式去做eCPM的最大化,一种在推荐侧,他的label可能就是我最终的eCPM序,表示在精排产生后,有一个bid和eCPM,这样面向eCPM去做预估理论上不是point-wise而是pair-wise或list-wise的排序,直接在模型里面去做优化。另一种是在eCPM公式里面将pCTR、pCVR做的更准,你这边是倾向于第二种是吗?
- 精排这一部分在训练的时候负采样/正负样本怎么取的,最终的label是广告商品已经曝光的,曝光里的CTCVR?
- 是否有考虑对广告商品的出价
- 对广告第一部分粗排和召回是否有了解,召回模块目前比较主流的方法有哪些,召回模块比较有挑战的方法,算法模型中遇到的最困难的点
- 召回部分,对于长尾商品难以召回的解决方案
- 介绍一下DIN模型,是否有尝试分别用DIN和LightGBM两个模型做排序对比结果差异性
- 详细DIN里的注意力机制,包括特征维度,Attention公式以及其时间和空间复杂度
- 描述一下Transformer的网络结构,是否有尝试将Transformer里encoder某一部分(比如Attention)去掉做消融实验
- Transformer里Multi-head Attention的时间和空间复杂度
- 介绍一下LightGBM模型,介绍GBDT模型,做GBDT模型调优的时候树的深度等方面怎么设置,在设置树的深度方面需要考虑的维度是什么,这个超参根据什么来调整
- 分类任务存在正负样本不均衡问题如何解决
- 精排部分除了DIN模型还了解哪些
- 是否有了解强化学习有关内容
- 项目如何评估
反问:
- 部门业务:大部分是做搜索推荐广告,面试官这边做的是广告相关,业务主要包含预算的分配,偏优化方向的一部分是做推荐广告的召回、粗排和精排,另一部分做继续强化相关包含出价和一些机制的设计
- 往广告算法相关发展的基本路线:广告基本的召回、粗排和精排,广告本身属性出价和拍卖机制。CTR、CVR预测相关主流模型以及所解决的问题和难点
- 学习建议:文章和实战