感觉面完人都通透了,还是太菜了,下去沉淀一下1.实习项目相关问题2.介绍智能客服系统中你的负责部分、面临的问题及解决方案。3.如何解决大模型在客服场景中的幻觉问题?4.是每个场景对应多个 Agent?5.新架构是否存在泛化性损失问题?如何处理新活动规则等未见过的知识注入?6.Expert Agent 是以什么维度划分的?7.新架构的 AB 测试指标提升具体来自哪些模块?8.如何从线上真实对话构造Expert Agent 的 SFT 训练数据?9.Expert Agent 的 prompt 主要输入有哪些?模型输出是什么?10.Expert Agent 是否有预设工作流(workflow)和任务描述?11.Expert Agent 的评价指标(出商品率、商品正确率)具体如何定义和获取评测数据?12.智能客服 Chatbot 是否面临多轮对话中信息遗忘、流程偏离、回复机械感的问题?如何应对?13.如何优化多智能体系统(MAS)中各 Agent 的协作,避免局部优化但整体效果不佳?14.多智能体系统中如何设计奖励函数促进 Agent 协作而非竞争?八股1.什么是优势函数?2.PPO 中需要训练哪几个模型?3.PPO 中参考模型的作用是什么?4.什么是 Reward Hacking?有哪些缓解 / 优化方案?5.智能对话多轮场景中,attention 机制的局限性是什么?有哪些优化思路?手撕:排序K个升序链表