字节抖音推荐算法二面
1.自我介绍
2.项目深挖
3.推荐业务目前的优化目标是什么?
4.多场景建模具体指什么?不同场景下用户行为有什么差异?
5.这些场景是分开建模还是统一建模?特征或网络层面有没有做场景区分?
6.如果特征落盘时刻上下文发生变化
7.介绍一下 RankMixer 的结构原理。它与 MLP 、 Transformer 或 DIN 相比,核心区别和优势是什么?
8.如果拓展 token 数量,具体如何实现?
9.所有场景样本是一起训练还是分开训练?指标是看全局还是分场景?
10.超长序列建模的长度是多少?具体实现方案是什么?
11.多尺度注意力指的是什么?与全序列原生 attention 相比有何区别?
12.不同时间段的序列输出如何融合?如何平衡每个时期兴趣的权重?有没有自适应机制?
13.手撕代码: Request 维度的 GAUC 计算
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
2.项目深挖
3.推荐业务目前的优化目标是什么?
4.多场景建模具体指什么?不同场景下用户行为有什么差异?
5.这些场景是分开建模还是统一建模?特征或网络层面有没有做场景区分?
6.如果特征落盘时刻上下文发生变化
7.介绍一下 RankMixer 的结构原理。它与 MLP 、 Transformer 或 DIN 相比,核心区别和优势是什么?
8.如果拓展 token 数量,具体如何实现?
9.所有场景样本是一起训练还是分开训练?指标是看全局还是分场景?
10.超长序列建模的长度是多少?具体实现方案是什么?
11.多尺度注意力指的是什么?与全序列原生 attention 相比有何区别?
12.不同时间段的序列输出如何融合?如何平衡每个时期兴趣的权重?有没有自适应机制?
13.手撕代码: Request 维度的 GAUC 计算
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
相关推荐
04-17 17:12
门头沟学院 Java 点赞 评论 收藏
分享