最常见 AI 岗位(算法岗 / 大模型 / 工程 / 产品)
下面按真实面试高频整理,覆盖算法岗 / 大模型 / 工程 / 产品四类最常见 AI 岗位,直接背就能用。 一、通用必问(所有 AI 岗都跑不掉) 1. 自我介绍(1 分钟版:学历→项目→技术栈→亮点) 2. 机器学习基础 ◦ 过拟合怎么解决? ◦ 正则化 L1/L2 区别? ◦ 准确率、精确率、召回率、F1、AUC 含义与适用场景 ◦ 交叉熵、MSE 损失函数区别 3. 深度学习基础 ◦ 梯度消失 / 爆炸原因与解决 ◦ BatchNorm 作用、原理 ◦ 优化器:SGD、Adam、RMSprop 区别 4. 编程 & 工程 ◦ Python 基础:装饰器、多线程、GIL ◦ Pandas/Numpy 常用操作 ◦ Linux 常用命令、GPU 查看(nvidia-smi) 5. 项目深挖(必准备) ◦ 你负责哪部分? ◦ 为什么选这个模型 / 方案? ◦ 指标怎么提升的?遇到什么坑? ◦ 数据怎么来的?怎么清洗?
二、大模型 / LLM 算法岗高频题 1)原理类 • Transformer 结构、Self-Attention 计算过程 • 为什么 Transformer 比 RNN 好? • 位置编码是什么?为什么需要? • decoder-only /encoder-decoder 区别 • 预训练、SFT、DPO、RLHF 分别在做什么 2)微调 & 训练 • LoRA 原理、优点、适用场景 • QLoRA 和 LoRA 区别 • 全量微调 vs 高效微调怎么选? • 分布式训练:DDP、FSDP、DeepSpeed 简单说 • 训练不稳定怎么处理(loss Nan、不收敛) 3)RAG & Agent • RAG 流程:分块→嵌入→检索→重排→生成 • 怎么提升 RAG 效果? • 幻觉怎么缓解? • Agent 核心:规划、记忆、工具调用 • Function Calling 实现思路 4)部署 & 推理 • 模型量化:INT8/INT4 原理 • vLLM、TensorRT-LLM 优化点(PagedAttention) • 吞吐量、时延、KV cache 是什么 • 如何加速大模型推理?
三、计算机视觉 CV 岗常问 • CNN 感受野、卷积计算 • ResNet 为什么能训练很深? • 目标检测:one-stage /two-stage 区别 • YOLO 核心思想 • 分割:FCN、UNet、Mask R-CNN • ViT 原理,相对于 CNN 优缺点 • 数据增强常用方法 • mAP、IoU 计算
四、NLP 岗常问 • Word2Vec CBOW & Skip-gram • Bert 双向、GPT 单向区别 • Masked Language Model 原理 • 文本分类 / NER / 文本生成常用方案 • Beam Search、Greedy Search • 长文本处理方案
五、推荐 / 广告 / 搜索算法岗 • 召回 + 粗排 + 精排 + 重排流程 • Wide&Deep、DeepFM、DIN 模型结构 • 特征工程怎么做,类别特征怎么处理 • A/B test 流程、显著性检验 • 负样本构造、样本不均衡
六、AI 工程 / MLOps / 部署岗 • Docker 常用命令 • ONNX、TensorRT 作用 • CUDA 基础,GPU 显存优化 • 模型服务:FastAPI / Flask / Triton • 如何监控模型性能、漂移 • vLLM / TGI 部署流程
七、手撕代码 & 算法题(必考) 难度一般 LeetCode 中等偏上 • 数组:双指针、滑动窗口 • 字符串:KMP 思想、子串问题 • 二叉树:遍历、深度、公共祖先 • 动态规划简单题 • 机器学习手撕:LR、KMeans、交叉熵 • Python 实现 Attention 简化版(高频)
八、行为面 & HR 面 • 遇到项目延期怎么处理? • 与同事意见不一致怎么办? • 职业规划 1~3 年 • 为什么离职 / 为什么来我们公司 • 期望薪资、到岗时间
查看9道真题和解析