面试官视角聊聊：秋招AI岗高频面试问题+回答思路

一、Agent模块（秋招顶流！大厂会轮番追问）

为什么做Agent项目？（结合岗位说，比如“想解决XX场景的效率问题，刚好贴合贵司AI落地方向，还能锻炼推理和工程能力”）
讲下你的Agent项目？（必追问预警：难点咋解决的？踩过啥坑？落地有啥数据效果？别只说“做了啥”，重点说“解决了啥问题”）
演示下Agent项目实现细节？（划重点：别只说“用了LangChain”，面试官要听具体的！比如核心代码逻辑、用的框架版本、部署时卡在哪了，怎么解决的）
Agent开发框架咋选？LangChain/LLaMA Index/AutoGPT/Chroma，你为啥选这个？（避坑：别只吹优点，提一嘴框架的小缺点，再说说你怎么规避的，显得你很懂）
Agent的“自主性”咋实现的？（冷门坑题！字节、百度常问，结合记忆机制、推理决策、技能调用说，不用太复杂，说清逻辑就行）
还有其他Agent范式不？（反应式、目标导向、分层、协作式）你项目用了哪种？为啥适配？（别死记定义，结合你做的项目说，比如“我做的任务需要分层拆解，所以用了分层范式”）
Agent项目背景是啥？（必追问：市场上同类产品有啥短板？你做的项目牛在哪？突出你的产品思维，面试官很吃这一套）
Agent推理模式有哪些？（少样本、链式、反向、树状）各自适合啥场景？咋做差异化设计？（举个小例子，比如“简单任务用少样本，复杂任务用链式推理”，更直观）
推理模式咋选？咋实现动态切换？（答题技巧：结合任务复杂度、数据量、响应速度说，比如“任务简单就用少样本，复杂了就自动切换成链式推理”）
多Agent执行策略怎么选？怎么切换？（必追问：任务咋分配？冲突咋解决？有没有容错机制？结合你项目里的实操说，别空谈理论）
跨模块错误追踪的Agent知识库咋建？（说点实在的：数据从哪来、怎么清洗、检索咋优化、错误咋反馈，一步步说，面试官爱听细节）
基于代码构建知识库的Agent咋设计？（补细节：用啥工具解析代码、知识库索引咋优化、能不能适配多语言，这些都是面试官会追问的）

二、大模型相关（所有AI岗必问，别只关注老模型！）

主流大模型有哪些？（开源+闭源，别只说GPT-4、文心一言！补最新的：Qwen-2、Llama 3、Gemini 1.5、GPT-4o，各自的特点说两句，比如“Qwen-2开源，适合企业部署；GPT-4o准确率高，适合复杂任务”）
LLM为什么会产生幻觉？咋解决？（分三层说，好记：数据层面——训练数据有错误；模型层面——推理逻辑有问题；应用层面——没有约束，解决方案对应着来，比如“数据层面清洗数据，应用层面加Prompt约束”）
模型预热是什么？为什么要预热？咋实现？（大白话：预热就是提前加载模型，避免首次调用太慢，实现方案：批量请求预热、模型缓存、负载均衡，结合项目说）
长文本生成怎么做？（解决碎片化问题：滑动窗口、注意力压缩、多轮续写+连贯性校验，比如“把长文本分成小块，逐块生成，再做连贯性调整”）
大模型怎么量化部署？（有点冷门！工程岗必问：INT4/INT8量化、模型蒸馏，比如“用INT8量化，模型体积变小，部署更高效，准确率略有下降但不影响使用”）
大模型微调怎么做？（必追问：数据咋准备？超参数咋设？效果咋评估？比如“用行业相关数据微调，超参数学习率设0.001，用测试集对比微调前后的准确率”）

三、Prompt工程与多轮对话（应用岗非常高频）

如何写好Prompt？（核心原则：清晰、具体、有约束、给示例，每个原则配个小模板，比如“让模型生成NL2SQL：‘基于表user，查询年龄大于25的用户姓名，输出SQL语句，不要多余解释’”）
你做Prompt工程有什么经验？（必追问：咋优化Prompt的？比如“从模糊到具体，加约束条件，多轮迭代，比如一开始Prompt太笼统，模型输出混乱，加了具体要求后，准确率提升了40%”）
写两个Prompt示例？（高频场景，直接抄：1. NL2SQL：“基于表order，查询2024年10月的订单数量，输出SQL语句，仅返回SQL，不添加任何说明”；2. 代码查bug：“以下Python代码有bug，请找出bug并修改，说明修改原因，代码：xxx”）
多轮对话如何实现？（解决模型遗忘问题：上下文压缩、历史信息筛选、歧义处理，比如“只保留最近5轮有效对话，压缩冗余信息，遇到歧义就追问用户”）
Prompt注入有什么风险？怎么防护？（冷门！应用岗必问：风险是恶意Prompt让模型输出不当内容，防护：过滤恶意输入、设置Prompt白名单、添加安全约束）

#AI求职记录#