最常见 AI 岗位（算法岗 / 大模型 / 工程 / 产品）

下面按真实面试高频整理，覆盖算法岗 / 大模型 / 工程 / 产品四类最常见 AI 岗位，直接背就能用。一、通用必问（所有 AI 岗都跑不掉） 1. 自我介绍（1 分钟版：学历→项目→技术栈→亮点） 2. 机器学习基础 ◦ 过拟合怎么解决？ ◦ 正则化 L1/L2 区别？ ◦ 准确率、精确率、召回率、F1、AUC 含义与适用场景 ◦ 交叉熵、MSE 损失函数区别 3. 深度学习基础 ◦ 梯度消失 / 爆炸原因与解决 ◦ BatchNorm 作用、原理 ◦ 优化器：SGD、Adam、RMSprop 区别 4. 编程 & 工程 ◦ Python 基础：装饰器、多线程、GIL ◦ Pandas/Numpy 常用操作 ◦ Linux 常用命令、GPU 查看（nvidia-smi） 5. 项目深挖（必准备） ◦ 你负责哪部分？ ◦ 为什么选这个模型 / 方案？ ◦ 指标怎么提升的？遇到什么坑？ ◦ 数据怎么来的？怎么清洗？

二、大模型 / LLM 算法岗高频题 1）原理类 • Transformer 结构、Self-Attention 计算过程 • 为什么 Transformer 比 RNN 好？ • 位置编码是什么？为什么需要？ • decoder-only /encoder-decoder 区别 • 预训练、SFT、DPO、RLHF 分别在做什么 2）微调 & 训练 • LoRA 原理、优点、适用场景 • QLoRA 和 LoRA 区别 • 全量微调 vs 高效微调怎么选？ • 分布式训练：DDP、FSDP、DeepSpeed 简单说 • 训练不稳定怎么处理（loss Nan、不收敛） 3）RAG & Agent • RAG 流程：分块→嵌入→检索→重排→生成 • 怎么提升 RAG 效果？ • 幻觉怎么缓解？ • Agent 核心：规划、记忆、工具调用 • Function Calling 实现思路 4）部署 & 推理 • 模型量化：INT8/INT4 原理 • vLLM、TensorRT-LLM 优化点（PagedAttention） • 吞吐量、时延、KV cache 是什么 • 如何加速大模型推理？

三、计算机视觉 CV 岗常问 • CNN 感受野、卷积计算 • ResNet 为什么能训练很深？ • 目标检测：one-stage /two-stage 区别 • YOLO 核心思想 • 分割：FCN、UNet、Mask R-CNN • ViT 原理，相对于 CNN 优缺点 • 数据增强常用方法 • mAP、IoU 计算

四、NLP 岗常问 • Word2Vec CBOW & Skip-gram • Bert 双向、GPT 单向区别 • Masked Language Model 原理 • 文本分类 / NER / 文本生成常用方案 • Beam Search、Greedy Search • 长文本处理方案

五、推荐 / 广告 / 搜索算法岗 • 召回 + 粗排 + 精排 + 重排流程 • Wide&Deep、DeepFM、DIN 模型结构 • 特征工程怎么做，类别特征怎么处理 • A/B test 流程、显著性检验 • 负样本构造、样本不均衡

六、AI 工程 / MLOps / 部署岗 • Docker 常用命令 • ONNX、TensorRT 作用 • CUDA 基础，GPU 显存优化 • 模型服务：FastAPI / Flask / Triton • 如何监控模型性能、漂移 • vLLM / TGI 部署流程

七、手撕代码 & 算法题（必考）难度一般 LeetCode 中等偏上 • 数组：双指针、滑动窗口 • 字符串：KMP 思想、子串问题 • 二叉树：遍历、深度、公共祖先 • 动态规划简单题 • 机器学习手撕：LR、KMeans、交叉熵 • Python 实现 Attention 简化版（高频）

八、行为面 & HR 面 • 遇到项目延期怎么处理？ • 与同事意见不一致怎么办？ • 职业规划 1～3 年 • 为什么离职 / 为什么来我们公司 • 期望薪资、到岗时间

最常见 AI 岗位（算法岗 / 大模型 / 工程 / 产品）

全站热榜

创作者周榜