感觉自己好菜、面试很难,还是要多多练习生成式推荐1.介绍一下 RQVAE 算法,落地过程中遇到了什么问题?(自己做的项目哪来落地,笑)2.第一层 code book 的初始化你是怎么做的?3.code book 的大小和层数你是怎么设计的?4.RQVAE 训练过程中,损失函数的构成?训练中的 loss 曲线、AUC 这类指标大概是什么水平?5.有没有调过码本初始化、相关超参,这些参数调整对模型效果的影响是什么?SFT&GRPO 算法细节提问1.你项目里提到了 SFT 和 GRPO 算法,分别讲一下这两部分你是怎么设计和计算的?2.在推荐任务上,你的 SFT 的 label 是怎么设计的?对应的 loss 函数是怎么设计的?3.详细讲一下 GRPO 算法的核心逻辑?相对于 PPO,核心优化了哪个部分?优化带来的效果是什么样的?PPO 的优势函数,对 GRPO 有影响吗?group 代表了什么?它是想替换原来 PPO 里面优势函数里的什么价值?代码考核 & 专业背景提问1.单词拆分这道题,先说说解题想法,然后写一下代码?2.最长回文子串这道题,简单说一下思路,然后写一下代码?