1. 先做个自我介绍吧,可以结合你之前的工作经历聊聊。2. 你对 SFT(监督微调)中的 scaling law 有了解吗?在实际训练中,你遇到过哪些比较大的困难?3. 在模型训练时,如果发现 advantage 或者 loss 突然变成 0,一般可能是什么原因导致的?4. 在构建 AI Agent 时,它的记忆(Memory)机制通常是怎么设计的?5. 当模型出现 bad case 时,你一般会怎么分析?后续会采取哪些措施来改进?6. 如果需要为特定领域的文本训练一套 Embedding,你会怎么做?7. 聊聊你实习时团队的组成和分工吧,大家是怎么协作的?8. 你对大模型分布式训练的底层了解...