1.自我介绍2.介绍主流 Transformer-based 模型架构3.讲一下 LoRA 原理4.为什么 SFT 之后还要进行后训练5.讲一下 DPO 的损失函数怎么计算6.讲一下 GRPO 原理7.使用 GRPO 时,构造数据要符合什么要求8.熟悉哪些 Agent 框架9.如果要设计一个好的 Agent,除了大模型,还会设计哪些部分10.怎么构造高质量训练集11.Dense 模型和 MoE 模型有什么区别12.量化发挥作用的原理是什么13.讲一下 ZeRO-1、ZeRO-2、ZeRO-314.如果显存有限,会选择哪个方案训练15.算法题:LeetCode 56 合并区间📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。