26校招百度文心一言Agent算法一面
1.了解过哪些大模型?它们在结构上的差异?
2.大模型常用的位置编码有哪些?优缺点分别是什么?
3.介绍预训练—后训练—推理的流程
4.详细问了 RLHF(包括 PPO 算法原理)
5.DPO 和 PPO 的区别
6.超长上下文是怎么实现的(例如 Kimi)
7.大模型智能体(Agent)的工作原理和组成部分
8.场景题:如何训练一个大模型,让它能更好地精确提取摘要
9.码题:经典股票四连问(121、122、123、188)
2.大模型常用的位置编码有哪些?优缺点分别是什么?
3.介绍预训练—后训练—推理的流程
4.详细问了 RLHF(包括 PPO 算法原理)
5.DPO 和 PPO 的区别
6.超长上下文是怎么实现的(例如 Kimi)
7.大模型智能体(Agent)的工作原理和组成部分
8.场景题:如何训练一个大模型,让它能更好地精确提取摘要
9.码题:经典股票四连问(121、122、123、188)
全部评论
相关推荐
查看12道真题和解析 点赞 评论 收藏
分享
