昨天 20:51 三江学院 C++ 发布于河北

关注

AI Agent面经 2（持续更新）

Q1：prefix Decoder 和 causal Decoder 和 EncoderDecoder 区别是什么？

答案：prefix Decoder 和 causal Decoder 和 Encoder-Decoder 区别在于 attention mask不同：

Encoder-Decoder：在输入上采用双向注意力，对问题的编码理解更充分。适用任务：在偏理解的 NLP 任务上效果好。缺点：在长文本生成任务上效果差，训练效率低。
causal Decoder：自回归语言模型，预训练和下游应用是完全一致的，严格遵守只有后面的token才能看到前面的token的规则。适用任务：文本生成任务效果好。优点：训练效率高，zero-shot 能力更强，具有涌现能力。
prefix Decoder：prefix部分的token互相能看到，causal Decoder 和 Encoder-Decoder 折中。缺点：训练效率低。

Q2：为何现在的大模型大部分是Decoder only结构？

答案：因为decoder-only结构模型在没有任何微调数据的情况下，zero-shot的表现能力最好。而encoderdecoder则需要在一定量的标注数据上做multitask-finetuning才能够激发最佳性能。

目前的Large LM的训练范式还是在大规模语料shang 做自监督学习，很显然zero-shot性能更好的decoder-only架构才能更好的利用这些无标注的数据。

大模型使用decoder-only架构除了训练效率和工程实现上的优势外，在理论上因为Encoder的双向注意力会存在低秩的问题，这可能会削弱模型的表达能力。就生成任务而言，引入双向注意力并无实质的好处。而Encoder-decoder模型架构之所以能够在某些场景下表现更好，大概是因为它多了一倍参数。所以在同等参数量、同等推理成本下，Decoder-only架构就是最优的选择了。

Q3：大模型（LLMs）后面跟的 175B、60B、540B等指什么？

答案：这些一般指参数的个数，B是Billion（十亿）的意思，175B是1750亿参数，这是ChatGPT大约的参数规模。

大模型、Agent面试八股全集文章被收录于专栏

大模型面试，早已不只是会用 LangChain、会调 OpenAI API 那么简单。真正决定面试深度的，是你是否理解 Transformer、Prompt 工程、RAG 检索链路、Agent 规划与执行、工作流设计，以及复杂场景下的稳定性与工程落地问题。本专栏聚焦大模型与 Agent 开发面试高频八股，系统拆解核心概念、常见追问、项目回答思路，帮助你系统掌握核心考点，提升面试表达与项目答辩能力。

全部评论

推荐最新楼层

昨天 11:05

第一拖拉机制造厂拖拉机学院 Java

学院本拿下字节暑期offer!!!

兄弟们，七面终上岸！😭😭一路走来满是坎坷与波折，从最初的遥不可及、不敢奢望，到如今咬牙坚持终得圆满。付出了无数努力，熬过无数难熬的时刻，也算给前段时间的埋头拼搏画上圆满句号。点赞多的话，后续整理完整面经，分享经验干货，帮大家少走弯路～

点赞评论收藏

分享

昨天 16:10

华为_系统工程师

【面试真题】美团Agent 方向面经整理（思路引导 + 推荐回答）

Agent / LLM 方向面经整理（思路引导 + 推荐回答）  每章开头有一小段本章思路引导（这类题整体上在考什么、怎么组织话）。每道题下先有一行思路（答题时先想什么），再是推荐回答（可参考的表述骨架）。请把里面的名词、数字换成你项目里的真实情况，别整段背。  一、写在前面 如果投的岗位对后端技术栈有一两条要求，你没有相关经历但业务还是放了简历进来，最好针对 JD 里那两条单独准备一下。其实就算 JD 没写死，HTTP、流式、异步这类也算互联网底座，有时间还是摸一遍皮毛，面试里至少能接住话头、显得你是主动补过的人。 没正经后端经历的（比如我），体感是面试官一般不会往死里抠实现细节，更在意知识...

点赞评论收藏

分享

昨天 20:46

西安交通大学算法工程师

今年数据分析的hc怎么样呢uu们

阿里来学校宣讲，跟数据科学的前辈聊天聊了他们的工作内容，真是非常喜欢了，但是数据科学岗位很少啊，感觉基本都是数据分析呢，有什么区别啊，我现在就是两个都投了

我的求职进度条

点赞评论收藏

分享

昨天 20:30

中国矿业大学（北京） Web前端

秋招倒计时：30天从零到一拿下前端实习（附完整冲刺路线）

最近不少学前端的都有提到说，发现今年秋招前端的竞争已经不止卷八股和项目了——“AI 全栈”这个词开始出现在前端 JD 里。很多岗位可能还会明确写“了解大模型应用、Agent 开发优先”，哪怕你是投前端实习。于是就出现了一个尴尬的现状：传统前端路线还在让你慢慢啃 HTML/CSS/JS，做完一个后台管理系统就去面试。但另一边，企业已经开始期待你能聊一聊 Agent、流式响应、工具调用。很多人其实也不是不想学，就是不知道怎么把 AI 项目和前端实习路线揉在一起，又不影响基础学习节奏。所以我趁着放假梳理了一份 30 天“传统前端 + AI Agent”双项目冲刺路线，给秋招前想刷一段前端实习的同学参...

前端面试准备&技...

点赞评论收藏

分享

不愿透露姓名的神秘牛友

04-30 17:45

不愧是字节，问的好难啊🤯

本人简历上 1 个 RAG 项目 + 1 个 Agent demo；这次面的是AI岗一面前我以为：背完八股 + 把项目讲清楚，应该能稳过。0-5 min：自我介绍 + 项目背景- 顺利。讲清楚了我的 RAG 是给法律咨询场景做的，痛点是大模型不懂行业术语。5-20 min：项目深挖（开始崩）- Q1：你的法律文档总共多少？切了多少个 chunk？- 我：约 500 份 PDF，5 万个 chunk- Q2：500 份 PDF 加起来才 5 万 chunk？平均每份 100 个 chunk，你切片粒度是多少？- 我：512 token- Q3：法律文档里"第三条第二款"和"第三条之二"是不同含义，你的切片会不会把它切散？- 我：（沉默 5 秒）……应该会- Q4：那你怎么解决？- 我：我可以加一个 metadata……（开始编）❌ 第一次崩：切片粒度没考虑业务语义。20-35 min：评测体系（继续崩）- Q：你怎么知道你的 RAG 有效？- 我：我用 Recall@5……- Q：评测集多少条？怎么构造的？- 我：100 条，我手工标注的- Q：100 条够吗？分布怎么样？- 我：分布……我没分- Q：那你的 Recall@5 是 0.81，你怎么知道这个数字是好是坏？baseline 是什么？- 我：（沉默 10 秒）❌ 第二次崩：没有 baseline，没分布分析，纯靠"看起来还行"。35-55 min：Agent 部分（彻底崩）- Q：你的 Agent demo 用了几个工具？- 我：3 个，搜索、计算器、文档查询- Q：当用户问一个问题，你的 Agent 怎么决定调哪个工具？- 我：用 ReAct，让模型自己决定- Q：模型决策错了怎么办？- 我：我加了个 reflection……- Q：reflection 失败 3 次后怎么处理？- 我：（沉默 15 秒）……我没想过❌ 第三次崩：异常路径完全没设计。55-65 min：业务理解 + 反问- Q：你觉得字节做 AI 应用最大的瓶颈是什么？- 我：算力？数据？- Q：你看过哪些字节最近发的 AI 产品？- 我：豆包、扣子……- Q：扣子是 Agent 平台还是工作流平台？- 我：（再次沉默）❌ 第四次崩：对面试公司业务一无所知。

面试官拷打AI项目都会问...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 这个offer值得去吗？ #

19214次浏览 170人参与

# 字节开奖 #

149014次浏览 665人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

47366次浏览 513人参与

# 如果春招能重来，我会___ #

19981次浏览 213人参与

# 薪资爆料 #

421725次浏览 2223人参与

# 除了线上，还能去哪些地方投简历 #

10995次浏览 112人参与

# 刚工作的你，踩过哪些坑？ #

46496次浏览 295人参与

# HR问：你期望的薪资是多少？如何回答 #

99162次浏览 830人参与

# 大学四年该怎么过，才不算浪费时间？ #

23715次浏览 104人参与

# 一份好的简历长什么样？ #

41805次浏览 505人参与

# 你面试被问到过哪些不会的问题？ #

122280次浏览 1944人参与

# 今年形式下双非本找得到工作吗 #

328629次浏览 1774人参与

# 诺瓦星云求职进展汇总 #

258853次浏览 1743人参与

# 双非本科求职如何逆袭 #

1646075次浏览 13060人参与

# 你觉得实习能学到东西吗 #

154025次浏览 1493人参与

# 职场破防瞬间 #

381650次浏览 2847人参与

# 你被哪些公司挂了？ #

193110次浏览 1043人参与

# 实习最晚的一次下班是几点 #

35866次浏览 171人参与

# 字节求职进展汇总 #

1845553次浏览 15385人参与

# 26届校招投递进展 #

670156次浏览 3953人参与

# 双非应该如何逆袭？ #

584316次浏览 6376人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务