1.自我介绍2.项目拷打3.为什么这种架构可以提升 MFU ?4.超长序列建模具体怎么做的?这种方案的区别和优势在哪里?信息被压缩的程度有什么不同?5.假如你要引入向量索引系统,在线 serving 服务要做什么改造?6.样本和线上实时特征如何保持一致?7.OneTrans 把序列和非序列特征放在一起组织,不同行为特征是怎么组织的?8.OneTrans 的金字塔结构具体怎么做?为什么要这么设计?9.attention 机制为什么随着序列变长耗时增加很快?时间复杂度是什么关系?10.如果要优化性能,做什么样的优化?11.多任务学习中的负迁移/跷跷板问题怎么解决?12.特征重要性是怎么评估的?13.除了 mask 特征的方式,还有什么方案可以建模特征重要性?14.如果通过特征加 gate 的方式学习特征重要性,你会怎么设计?15.手撕代码:两两反转链表16.反问环节📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。