整体面试还是不错的,但是没后续了,不知道是哪里出了问题1.介绍实习项目中主要负责的工作和具体任务2.介绍实习项目中 GRPO 的设计思路,包括工具调用能力的设计考量3.简单讲解 yarn 的设计思路4.讲解原始 RoPE 的原理5.讲解 GRPO 的实现方式6.讲解 PPO 和 DPO 的相关原理7.讲解 Transformer 的 Encoder 和 Decoder 相关内容,包括 Encoder 的模块组成8.定义 rag 中召回率的计算和评判标准9.讲解 MHA 中 Q 的定义, Attention 计算过程10.说明 MHA 采用多头设计的原因11.对比 Encoder 和 Decoder 的主要区别12.讲解 MQA 和 GQA 的相关原理23.说明大模型中归一化操作的应用维度13.手撕1:最长括号序列