大厂推荐算法面经小结

1. 用一些特征建模预估一个中间目标,将该中间目标作为特征预测最终目标
2 .用所有特征训练一个复杂的端到端模型直接预测最终目标,两种方案各有什么优劣?
3.测试集如何选择?如何判断测试集和应用场景是一致的(无偏的)?模型的离在线效果差异如何解决?
4.召回和粗排的主要作用?为什么不直接用精排?
5.怎么评估粗排模型的好坏?粗排怎么做冷启动?
6.B站首页推荐模型可能包含哪些目标作为精排融合分的项?
7.k个有序链表合并,时间复杂度
8.打家劫舍,状态转移方程的含义
9. 依旧是拷打项目(25分钟)。
10. attention有几种形式,分别讲一下?
11. 讲一下Transformer的计算复杂度?
12. 讲一下推荐系统的链路?
13. 多路召回的结果如何融合?
14. 召回的损失函数?
15. NCE Loss的主要思想?
16. 手写逻辑回归的损失函数推导
17. code:买卖股票。
18. 反问。
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论

相关推荐

1.实习介绍2.简历拷打3.除了MMOE还用过其他的方案吗?cgc或者ple有尝试过吗?4.如何解决mmoe输出特征一样,专家的参数最终会趋于一致的现象?在网络参数随机初始化的情况下,不会发生问题中提到的问题。核心原因在于数据存在multi-view,只要每一个expert网络参数初始化是不一样的,就会导致每一个expert学到数据中不同的view。5.多任务loss调整中回归损失会主导训练任务是怎么处理的?在我的场景中是采用包序累积多分类替代了回归,也可以通过映射label上界或者禁止回传的方法,都试过。6.transformer的参数量是多少?层数(L):Encoder/Decoder 的堆叠层数注意力头数(H):多头注意力 的并行任务数隐藏层大小(D):特征向量的维度序列长度(T):输入/输出的最大 token 数 公式:总参数量 ≈ L×(4D^2+2D×H×T)7.介绍一下encoder和decoder?Encoder(编码器)作用:将输入序列(如文本)转换为上下文相关的表示向量。Decoder(解码器)作用:根据编码器输出生成目标序列(如翻译或回答)。8.在你场景中用的是二阶段的训练如何调整成一阶段的?代码 给一个整数数组a,对a中的相邻整数进行浮点除法,如a=[2,3,4],即为2/3/4 在任意位置添加任意数目的括号,来改变算数的优先级,使得值最大,输出表达式
查看8道真题和解析
点赞 评论 收藏
分享
1. 手撕 合并区间2. 八股1)请介绍 Transformer 的结构组成及各部分作用,在长序列时空数据中,2)如何降低 Transformer 的计算复杂度?常见的稀疏注意力变体有哪些?3)GNN的消息传递机制是怎样的?在时空图中,如何结合时间信息编码节点特征?你接触过哪些时空 GNN 模型?4)LoRA微调的原理是什么?秩 r 的选择会对模型表现产生什么影响?5)RAG的完整流程,在时空出行数据场景里,构建向量检索库时如何处理时间衰减对召回的影响?6)强化学习在 Agent 优化中的应用,结合出行推荐 Agent,你会如何设计 Reward 函数?3. 项目1)微调时的训练数据是怎么构建的?如何保证样本多样性和质量?2)在 RAG+时空知识图谱的 Agent 系统中,知识图谱更新的机制是怎样的?是怎样保证实时性的?3)在大规模轨迹数据下是怎么做负采样(Negative Sampling)的?4)训练 LoRA 模型时,你是如何选择冻结层的?依据是什么?5)在高并发查询 Agent 系统中,你会如何优化召回和生成阶段的延迟?4. 开放题1)大规模 Agent 系统在多线程/多进程场景下的资源调度策略如何设计?2)如果你要在 GPU 资源有限的条件下同时提供推理和微调服务,如何做资源分配和任务调度以保证时延和吞吐?
查看14道真题和解析
点赞 评论 收藏
分享
评论
点赞
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务