03-09 15:13 吉林农业大学算法工程师发布于河北

关注

AI-Agent 面试题汇总 - 大模型篇

一、大语言模型基础

1. 目前主流的开源模型体系有哪些？

主流开源模型体系包括：LLaMA 系、Qwen 系、GLM/ChatGLM 系、Mistral/Mixtral 系、Baichuan 系、DeepSeek 系、InternLM、Yi 等。面试里建议从以下维度比较：

参数规模（7B/13B/70B…）
上下文长度（8K/32K/128K…）
多语言能力
工具调用能力（function calling / agent）
推理成本与部署难度
开源协议（是否可商用）

2. Prefix LM 和 Causal LM 区别是什么？

Causal LM：严格自回归，token 只能看左侧历史（下三角 mask）。
Prefix LM：把输入分“前缀区”和“生成区”，前缀区通常可双向可见，生成区仍按自回归方式生成。

区别本质：Prefix LM在条件建模上更灵活，Causal LM在统一生成训练上更直接。

3. 为何现在的大模型大部分是 Decoder-only 结构？

核心原因：

训练目标统一：next-token prediction 可直接吃海量文本。
生成任务天然匹配：对话、写作、代码补全都属于自回归生成。
扩展性强：参数和数据放大时性能提升规律清晰。
工程生态成熟：KV Cache、并行推理框架都围绕 Decoder-only 深度优化。

4. LLM 复读机问题

“复读机”是模型重复输出相同短语/句子的现象。常见原因：

温度太低、top-p过窄
repetition_penalty 未设置
prompt指令不明确
长上下文导致局部高概率循环

常见解决：

调高 temperature / top-p
设置重复惩罚与 n-gram 限制
缩短上下文或分段生成
在提示词里明确“禁止重复”

outputs = model.generate(
    **inputs,
    max_new_tokens=256,
    temperature=0.8,
    top_p=0.9,
    repetition_penalty=1.1,
    no_repeat_ngram_size=3
)

5. 如何让大模型处理更长的文本？

常见方案：

分块+检索（RAG）：检索相关片段喂给模型。
长上下文模型：选支持 32K/128K+ 的模型。
滑动窗口：分段重叠处理后聚合答案。
层次摘要：段落总结→全局总结。
位置编码外推技术（如 RoPE 相关扩展）。

def chunk_text(text, chunk_size=1000, overlap=150):
    res, i = [], 0
    while i < len(text):
        res.append(text[i:i+chunk_size])
        i += chunk_size - overlap
    return res

二、大语言模型架构

1. 讲讲对 Attention 的理解？

Attention本质是“按相关性做加权聚合”：给定 Query（当前需求）、Key（索引线索）、Value（内容），先算 Q-K 相似度，再对 V 做加权求和。它让模型在每一步都能动态关注最相关上下文，而不是把信息压缩成固定向量。

2. Attention 的计算步骤是什么？

步骤：

输入经线性层得到 Q/K/V
计算分数：(QK^T)
缩放：除以 (\sqrt{d_k})
加 mask（因果/padding）
softmax 得注意力权重
权重乘 V 得输出

import torch, math
Q = torch.randn(2, 16, 64)
K = torch.randn(2, 16, 64)
V = torch.randn(2, 16, 64)

scores = Q @ K.transpose(-1, -2) / math.sqrt(64)
attn = torch.softmax(scores, dim=-1)
out = attn @ V

3. Attention 机制和传统 Seq2Seq 模型有什么区别？

传统 Seq2Seq（无 attention）把整句压成单一向量，长句易丢信息。Attention 允许解码时直接访问编码端各位置，提高长距离依赖建模能力。Transformer进一步完全用自注意力替代RNN，实现更强并行性。

4. Transformer 中 multi-head attention 中每个 head 为什么要进行降维？

原因：

控制计算量与显存
每个head在不同子空间学习不同关系
保持总维度不变（多头拼接后再投影回去）

5. Encoder 编码器与 Decoder 掩码有什么区别？

Encoder自注意力通常是双向可见（除padding位）。
Decoder自注意力使用因果mask，当前位置不能看未来token。

这决定了：Encoder偏理解，Decoder偏生成。

6. 为什么 BERT 选择 mask 掉 15% 这个比例的词，可以是其他比例吗？

15%是经验上“信息破坏”和“训练信号”之间的平衡点：

太低：监督信号不足
太高：输入被破坏过多，语义上下文不完整可以改成其他比例，但效果要靠实验验证，不同语料/模型可能最优点不同。

7. BERT 非线性的来源在哪里？

主要来自：

FFN中的激活函数（GELU）
注意力中的softmax
多层堆叠后残差+归一化形成的复杂非线性表示能力

8. 为什么要进行 LN（LayerNorm）？

LayerNorm在特征维度做归一化，使每层输入分布更稳定，缓解训练震荡、加快收敛。相比BatchNorm，LN不依赖batch统计，更适合NLP可变长度与小batch场景。

import torch.nn as nn
ln = nn.LayerNorm(768)

三、训练数据集

1. SFT（有监督微调）的数据集格式？

典型格式是指令数据：

instruction / input / output或 chat 格式：
system / user / assistant 多轮消息。

{"instruction":"解释过拟合","i

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

AI-Agent面试实战专栏文章被收录于专栏

本专栏聚焦 AI-Agent 面试高频考点，内容来自真实面试与项目实践。系统覆盖大模型基础、Prompt工程、RAG、Agent架构、工具调用、多Agent协作、记忆机制、评测、安全与部署优化等核心模块。以“原理+场景+实战”为主线，提供高频题解析、标准答题思路与工程落地方法，帮助你高效查漏补缺.

全部评论

推荐最新楼层

牛客310281160号

门头沟学院算法工程师

点赞回复分享

发布于昨天 21:34 江苏

摸鱼文杰

天津工业大学算法工程师

mark一下

点赞回复分享

发布于昨天 17:33 天津

Silencer76

牛客_运营/测试

mark学习

点赞回复分享

发布于昨天 09:57 北京

Java热爱者

蚌埠坦克学院 Java

太强了

点赞回复分享

发布于 03-10 23:38 河北

代码练习生_code

门头沟学院 C++

还有没有别的

点赞回复分享

发布于 03-10 23:02 河北

在迎接offer的牛可乐很想潜水

mark

点赞回复分享

发布于 03-10 22:16 云南

再晒一会鱼

国家开放大学前端工程师

哇写的好详细

点赞回复分享

发布于 03-10 21:38 黑龙江

Data_Seven

杭州电子科技大学大数据开发工程师

哇，能汇总这么多 AI 面试题，恭喜大佬！真羡慕你有这份资料。

点赞回复分享

发布于 03-10 21:36 四川

谷底反弹王

广西科技大学测试工程师

RAG+滑动窗口确实保命组合了哈哈

点赞回复分享

发布于 03-10 18:20 广西

glint@0418

广东工业大学自动化测试

Memory算必问的了吧

点赞回复分享

发布于 03-10 18:20 广东

熬夜修仙但喝枸杞水

门头沟学院大数据开发工程师

不说别的，引用幻觉最坑人…

点赞回复分享

发布于 03-10 18:20 上海

植森

未知通信电源工程师

楼主都是自己找的吗，还是全面了

点赞回复分享

发布于 03-10 18:19 广东

许愿每关都能赢

门头沟学院前端工程师

这玩意真干货啊

点赞回复分享

发布于 03-10 18:19 北京

觉得你很赞的卡尔很emo

门头沟学院机器学习

点赞回复分享

发布于 03-10 10:39 广东

最喜欢秋天的铁锤很成熟

Java

兄弟哪找的

点赞回复分享

发布于 03-09 15:22 浙江

03-09 22:29

已编辑

四平职业大学研发工程师

秋招的尾巴是字节跳动

秋招没有大满败，最终收到节子的offer。

大好人诶：举报了

点赞评论收藏

03-09 18:27

已编辑

复旦大学 Python

聊聊agent面试那些事

说实话2025年LLM岗位的薪资真的离谱，校招开到60万到200万，各家公司都在抢人。agent方向更是香，很多同学简历上都写了agent相关的项目或论文。但面试下来，发现不少同学其实卡在一些关键点上——不是不聪明，是没想清楚。一、业务背景搞清楚了吗？这是最基础、也最容易被忽视的一关。面试官第一个问题往往就是：你这个agent应用是干嘛的？输入什么、输出什么？你得能说清楚：是做客服问答，还是自动生成图片？整个流程是怎样的，比如"输入query → query改写 → RAG检索 → 模型生成 → 后处理"，最好脑子里有一张架构图，能顺口说出来。扣分场景：只会说"这...

AI求职实录

点赞评论收藏

03-07 21:18

中山大学算法工程师

非科班转大模型开发

咨询哥哥姐姐，非科班冷门工科转agent，还需要学习后端那一大坨八股吗，还是说只学习大模型相关rag，agent那些即可。感谢

点赞评论收藏

03-09 15:12

吉林农业大学算法工程师

AI-Agent 面试题汇总 - Linux篇

1. Linux 常用命令有哪些？常用命令按场景分：文件目录：lscdpwdcpmvrmfind文本处理：catlessheadtailgrepawksedsortwc系统资源：topfreedfduiostatvmstat进程网络：pskillssnetstatlsof服务管理：systemctljournalctl2. 如何查看 Linux 系统版本和内核版本？系统版本看发行版，内核版本看 uname。 cat /etc/os-release uname -r uname -a 3. 如何查看 CPU 使用情况？top 动态看，uptime 看负载，mpstat 看多核。 top upti...

AI-Agent面试实战...

点赞评论收藏

03-04 20:00

门头沟学院 Java

淘天2027届暑期实习agent应用/大模型算法招聘

如题，官网流程还没开，有意向私信看简历，岗位开放立马进流程。欢迎大家戳呀。贴一个jd2. 手把手，快成长：由资深技术专家一对一指导。你将完整经历从需求分析、方案设计到代码落地的全过程，掌握大模型应用开发的核心技能，快速完成从学生到工程师的蜕变。3. 高机会，留用优：团队对实习生重视度高，表现优秀者可直接获得正式录用Offer。这里不仅有前沿的技术探索，更有清晰的职业发展路径【岗位职责】4. AI 应用功能开发：参与电商运营系统的智能化改造。利用大模型能力，开发自动化的智能任务，帮助业务提效。5. 智能助手设计与实现：面向内部运营人员和外部商家，开发能“听懂指令、自主干活”的AI 助手。让它不仅能回答问题，还能主动提醒进度、生成报告，甚至协助完成跨系统的操作。6. 多智能体协作探索：尝试让多个 AI 角色协同工作，通过合理的逻辑编排，让它们配合完成更长、更复杂的业务目标。7. 工具链与效率提升：参与部门内部的 AI 开发工具建设，封装常用的业务接口供 AI 调用，并探索如何利用 AI 辅助编程，提升团队整体的开发效率。【岗位要求】8. 基础良好：2027 届本科及以上学历，计算机相关专业；熟练掌握 Python/Java/Go/C++ 中至少一门语言，数据结构与算法基础扎实。9. 热爱 AI：对大模型技术应用有强烈好奇心，平时关注 AI 领域动态。善于思考如何用新技术解决实际问题，具备良好的逻辑思维和沟通能力。10. 技术上手快：-- 了解 Agent（智能体）的基本概念，知道什么是工作流编排、ReAct 模式或多智能体协作。-- 接触过主流开发框架（如 LangChain 等），或对向量数据库、Embedding 技术有初步了解。11. 工程实践能力：-- 理解 Prompt（提示词）编写技巧，了解 RAG（检索增强生成）、工具调用（Tool Calling）等基本原理。-- 有过 API 接口对接经验，能将后端服务转化为 AI 可调用的工具者优先。12. 加分项：-- 有 PyTorch/TensorFlow 使用经验，或尝试过模型微调。-- 做过课程设计、毕业设计或个人项目，且涉及复杂业务流程处理（如电商、ERP、办公自动化等）13. 善用工具：习惯使用 Cursor、Copilot 等 AI 编程助手辅助写代码，追求高效开发。招聘对象2026 年 11 月 1 日至 2027 年 10 月 31 日期间毕业的海内外应届毕业生。

点赞评论收藏

299

全站热榜

创作者周榜

正在热议

# 如果给AI员工评绩效，我的答案是…… #

4434次浏览 103人参与

# 春招 / 实习投递，你最焦虑的一件事 #

30808次浏览 674人参与

# 虽然0面试，但今天___，夸夸自己 #

# AI时代下，你的岗位要求有什么变化？ #

# HR问：你期望的薪资是多少？如何回答 #