聊聊agent面试那些事
说实话2025年LLM岗位的薪资真的离谱,校招开到60万到200万,各家公司都在抢人。agent方向更是香,很多同学简历上都写了agent相关的项目或论文。
但面试下来,发现不少同学其实卡在一些关键点上——不是不聪明,是没想清楚。
一、业务背景搞清楚了吗?
这是最基础、也最容易被忽视的一关。面试官第一个问题往往就是:你这个agent应用是干嘛的?输入什么、输出什么?
你得能说清楚:是做客服问答,还是自动生成图片?整个流程是怎样的,比如"输入query → query改写 → RAG检索 → 模型生成 → 后处理",最好脑子里有一张架构图,能顺口说出来。
扣分场景:只会说"这是我主管让我做的",说不清业务价值,更没法讲清楚全链路——这种回答基本直接减分。
二、数据,你真的在意过吗?
很多同学做项目重模型轻数据,这是个大误区。数据的数量和质量,从根本上决定了模型的上限。当年ImageNet出来直接把计算机视觉拉了一个时代,agent应用也是同理,不管是模型训练还是RAG召回,数据都是核心。
面试里你需要能回答这几个问题:数据从哪来?是人工标注的,还是LLM合成的?合成完怎么筛、怎么评质量?数据质量怎么样?准确率多少?谁来评?数据量有多少?SFT只有几百条数据大概率练不好。
其他像数据多样性、难度分布,也都会影响最终效果。
扣分场景:不知道数据准确率是多少,也没做过数据质量对比实验。
三、模型和算法,你理解本质了吗?
这一块是最能拉开差距的地方。先把SFT和RLHF的区别搞清楚:SFT是监督学习,只能告诉模型哪些是好结果,泛化性有限。RLHF通过reward信号告诉模型结果好不好,泛化性更强,在推理相关任务上提升明显。
RLHF具体算法:DPO、PPO、KTO、GRPO、DAPO等。DPO的关键在于构造高质量的chosen/rejected pair,GRPO的核心改进是用基于平均的相对奖励。更重要的是:你的项目为什么用这个算法,不用其他的?说不出来就是扣分项。
亮点加分项:如果你结合业务做了针对性改进,比如把GRPO的reward函数调整成更贴合业务场景的设计,面试官会眼前一亮。
agent面试考的是你对业务、数据、算法这三块有没有真正下过功夫。你在哪块掌握得比较扎实?欢迎评论区聊聊 👇
