1. 你的 Agent 系统Prompt 是怎么设计和迭代的?有没有做过 Prompt 自动优化?当用户提出不完整的请求时,如何补全用户意图的?2. 构建 Agent 的时候,遇到过哪些瓶颈?LangChain 的 memory 默认机制在多用户并发中怎么做隔离?你是如何保证线程安全的?3. 微调 Llama2 你是怎么选择训练样本的?清洗逻辑是什么?你有没有观察到哪些训练样本质量问题对模型行为有很大影响?举例说明。4. DPO相比 SFT,有哪些优劣?它在 Agent 任务上效果提升明显吗?你怎么构造偏好对?构造逻辑是自动的还是人工?5. 你说你服务部署在 vLLM 上,为何选择它?KV-c...