给我面没招了,发点面经攒攒人品~1. 实习拷打2. 项目拷打3. reward怎么设计4. 技能库中的技能长什么样,能举个例子吗,和skill有什么区别5. 技能内化的流程6. 强化学习用的什么损失,讲一下grpo的损失函数,和ppo的区别7. rag怎么做的8. 检索怎么做的,来访者的query长什么样 举个例子,召回完技能之后怎么给llm9. 讲一下autoskill的流程10. 怎么自进化,怎么去获取反馈11. 做下来最大的技术难点是什么code: 01矩阵,找被1包围的0连通块染色