美团也爱问AI

搜推+大模型算法
一面面试题
SFT & RL 方向
先 answer 后 cot vs 先 cot 后 answer:两种 SFT 范式在训练效果上有什么差异?你是否做过对比实验?
标注质量管控:如何保证人工标注数据的准确率达到预期标准?有哪些校验或质控手段?
Checkpoint 选择:如何挑选合适的 SFT checkpoint,用于后续的 RLHF 阶段?
多模态输入:图片是如何输入到 VLM 模型中的?一张图片通常会被编码为多少个 token?
RL vs SFT:你认为强化学习(RL)和监督微调(SFT)的核心区别是什么?
训练范式选择:为什么不直接从零开始做 RL,而是要采用「SFT → RL」的两阶段流程?
RL 关键机制:什么是重要性采样?为什么在 RL 训练中要引入 CLIP 机制?
策略类型差异:On-policy 和 Off-policy 算法的核心区别是什么?各自的适用场景有哪些?

八股文(Transformer 基础)
因果掩码作用:Transformer Decoder 中为什么必须使用自回归因果掩码?
缩放点积注意力:为什么注意力分数要除以d​k​?(补充:Layernorm 前置后,除以d​可将方差归一到 1,避免 softmax 梯度饱和)

推荐系统方向
生成式推荐 vs 传统推荐:两者的核心区别是什么?生成式推荐的目标是什么?你如何看待它的未来发展前景?
指标计算:AUC、HR、NDCG 的计算公式分别是什么?GAUC 和 AUC 的区别在哪里?
编码方式:如何在模型中加入时间编码和位置编码?常用的位置编码方法有哪些?
Coding:手撕 Multi-Head Attention(MHA) 实现

二面面试题
SFT & CoT 细节
概率分布特性:在「先 cot 后 answer」的 SFT 范式下,为什么越靠后的 token 概率(prob)会越高?
蒸馏噪声处理:用大模型蒸馏得到的 CoT 数据存在大量噪声,该如何缓解?
VLM 幻觉问题:对 VLM 做 SFT 时,发现模型更信任文本信息,看图时反而容易产生幻觉,有哪些解决思路?

RL 进阶
PPO 核心:写出 PPO 中 GAE 的公式,并说明如何递归计算每个 token 的优势函数(advantage)?
DPO 损失:写出 DPO 算法的损失函数公式?
算法对比:GRPO 和 PPO 的核心区别是什么?GSPO 和 GRPO 又有哪些不同?
训练稳定性:你遇到过 RL 中的熵塌缩(entropy collapse)和 reward hacking 问题吗?分别有哪些改进方法?最近有哪些新论文提出了新方案?
采样困境:在采样类 RL 算法中,on-policy rollout 无法得到正确答案时该怎么办?
自蒸馏:了解 Self-Distillation 吗?为什么要做自蒸馏?最近这方向有哪些代表性论文?
震荡优化:RL 训练中 reward 或 loss 震荡严重,该如何调整?(提示:可从学习率 lr、KL 散度约束等方向入手)

推荐系统进阶
结构对比:HSTU 和 Transformer 结构的差异是什么?它和 OneRec 的整体流程有什么不同?
SID 优化:如何降低 SID 碰撞率,同时提高特征利用率?
量化算法:RQ-VAE 和 RQ-Kmeans 的算法原理分别是什么?
OneRec 工程:OneRec 中是如何将 SID 加入模型词表和 tokenizer 的?
多模态融合:如何更好地结合文本特征和多模态特征?
模型演进:Rankmixer 是如何发展到 Tokenmixer 的?
Coding:给定一个行内严格递增的 m×n 矩阵,找到矩阵中第 k 大的数 #面试官最爱问的 AI 问题是......#
全部评论
问题好多啊
点赞 回复 分享
发布于 03-22 17:08 浙江

相关推荐

1. 请做个自我介绍,包括你的个人背景、大学经历或实习经历。1.1. 在你的学习和实践中,AI大模型工具是如何发挥作用的?是否帮助你解决过具体问题,或提升了某些项目的效率?2. 请你谈谈IPv4与IPv6的区别与过渡策略。2.1 实际过渡过程中,IPv4和IPv6之间互通的关键问题,有哪些技术手段可以实现互通?3. 请你解释一下Java中的垃圾回收机制GC以及常见的垃圾收集器有哪些?3.1 结合实际开发场景,解释在什么情况下你会选择使用G1垃圾收集器,而不是CMS或其他收集器?3.2. G1垃圾收集器是如何优化停顿时间的?它在设计上有哪些特点,使其适合大内存应用?4. 请你谈谈分库分表的常见策略及其在并发场景下的应用。4.1. 在高并发场景下,如何选择合适的分库分表策略?具体会考虑哪些因素来决定使用垂直还是水平分库分表?4.2 实际应用中,垂直分库和水平分库可能会遇到哪些挑战?你会如何应对这些挑战?5. 设计一个简单的项目管理系统,请描述项目、任务、成员的关系及主要的数据库表结构。5.1. 在项目管理系统的设计中,如何确保任务的分配和成员的工作负载是合理的?5.2. 在这个项目管理系统中,如何处理任务的优先级和紧急情况?6 设计一个文本生成HTTP接口供业务方调用,设计请求与返回关键字段,至少包含输入上下文、模型参数、输出结构、错误码以及用于追踪的一次调用ID。该文本生成接口如何支持流式返回?(这道题我换成下面的第六题了)6. 做成本控制,把每次调用成本拆到业务维度,后端如何统计token用量、工具调用次数、重试次数,并按业务方场景、模型版本做聚合报表?6.1. 在设计存储上述统计信息的数据库表时,如何考虑数据的扩展性和性能问题?第十四题是问答题,可以有换题的机会。我以为前面也有换题的机会,结果没有😭,对于IPv4和IPv6的过渡策略刚好考到我了,回答不出来还一直追问可能是我回答的时候太长了,应该还有个第七题,可惜错过了,第七题应该会问日常点的问题
查看15道真题和解析
点赞 评论 收藏
分享
评论
点赞
5
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务