百度大模型实习 agent面经
欢迎友好讨论,信息共享
1. 了解过哪些大模型?它们在结构上的差异?
2. 大模型常用的位置编码有哪些?优缺点分别是什么?
3. 介绍预训练—后训练—推理的流程
4. 详细问了 RLHF,包括 PPO 算法原理
5. DPO 和 PPO 的区别
6. 超长上下文是怎么实现的,比如 Kimi 这类模型
7. 大模型智能体 Agent 的工作原理和组成部分
8. 场景题:如何训练一个大模型,让它能更好地精确提取摘要
9. 代码题:经典股票四连问,对应 LeetCode 121、122、123、188
1. 了解过哪些大模型?它们在结构上的差异?
2. 大模型常用的位置编码有哪些?优缺点分别是什么?
3. 介绍预训练—后训练—推理的流程
4. 详细问了 RLHF,包括 PPO 算法原理
5. DPO 和 PPO 的区别
6. 超长上下文是怎么实现的,比如 Kimi 这类模型
7. 大模型智能体 Agent 的工作原理和组成部分
8. 场景题:如何训练一个大模型,让它能更好地精确提取摘要
9. 代码题:经典股票四连问,对应 LeetCode 121、122、123、188
全部评论
相关推荐
查看11道真题和解析