05-06 17:27 中南大学算法工程师发布于江西

关注

Agent 数据标注 / 训练专家

#想做Agent可以做哪些岗位？#
Agent 的「教练 + 数据工匠」，给模型喂高质量数据，教它怎么思考、怎么调用工具、怎么正确回答。
日常工作：
标注 Agent 专属数据：任务规划、工具调用步骤、多轮对话、思维链（CoT）
清洗、筛选优质问答样本，过滤幻觉、错误回答
做模型微调数据（SFT）、偏好数据（RLHF）
分析 Agent 失败 case，反馈给算法 / 开发，优化 Prompt 和模型能力
维护提示词库、对话模板、工具调用规范

全部评论

推荐最新楼层

桂林电子科技大学数据分析师

111

点赞回复分享

发布于 05-07 12:21 广西

05-04 08:15

门头沟学院 Java

宇树科技实习AI agent开发一面分享

发一下问题给大家参考，攒攒人品！1.请介绍一个你参与的、与AIAgent相关的项目，并说明你的角色和贡献。2.解释一下什么是向量数据库，它与传统关系型数据库的核心区别是什么?3.在RAG流程中，如果检索到的文档相关性不高，导致生成答案质量差，可能有哪些原因?如何优化?4.谈一谈你对ReAct框架的理解。它的核心思想是什么，如何帮助Agent进行推理和行动?5.在AIAgent中,记忆(Memory)通常分为哪几种类型?简要说明它们的作用。6.实现一个简单的多轮对话状态管理，你会考虑哪些关键要素?7.如何评估一个AIAgent的好坏?除了准确率，还可以关注哪些指标?8.了解LangChain或Llamalndex这类框架吗?谈谈它们解决了什么问题，以及可能的局限性。9.在开发Agent时，如何设计提示词(Prompt)来提升其任务执行的稳定性和准确性?10.手写算法:实现一个函数，计算两个向量的余弦相似度。

查看10道真题和解析

点赞评论收藏

分享

05-05 11:47

三江学院 C++

AI Agent面经 1（持续更新）

Q1：⼀句话说明什么是 AI Agent？答案：AI Agent 是以⼤模型为认知核⼼，结合规划、记忆与⼯具调⽤，能在多步交互中根据环境反馈持续决策并完成任务的系统；其本质是 闭环的感知—思考—⾏动 循环，⽽不仅是单次⽂本⽣成。Q2：为什么说 Agent = LLM + Planning + Memory + Tools？缺⼀块会怎样？答案：缺 Planning：容易变成「只会接话」的聊天，⻓任务易跑偏或⼀步登天完不成。缺 Memory：⻓对话会丢线索，多会话⽆法延续⽤户偏好与任务状态。缺 Tools：只能「空谈」，⽆法查实时信息、执⾏代码、改系统状态。LLM 仍是中枢，但单靠 LLM 没有外...

查看3道真题和解析

点赞评论收藏

分享

05-07 14:38

中南大学算法工程师

面试官拷打 AI/Agent/RAG 项目

你这个项目解决什么实际业务问题？不用技术，人话讲一遍。项目整体架构流程画一下，每一步做什么？为什么要做 Agent/RAG？直接用原生大模型不行吗？差在哪？项目技术栈为什么选这些，有没有对比过其他方案？为什么选这个大模型 / Embedding 模型？为什么不换别的？你对比过哪些模型？各有什么优缺点？开源模型和闭源 API 模型你怎么取舍？成本、效果、部署怎么考虑？模型有没有Bad Case？举 3 个真实例子，怎么解决的？模型上下文长度够不够？长文档怎么处理？温度系数 temperature、top_p 你怎么调的？依据是什么？

查看10道真题和解析

点赞评论收藏

分享

05-07 14:32

三江学院 C++

AI Agent面经 4（持续更新）

Q1：请⽤你⾃⼰的话定义 LLM Agent，并说明与单次调⽤的差异。答案：LLM Agent 是以⼤语⾔模型为推理核⼼，在 多轮 中与外部环境交互，通过 规划、记忆与⼯具 完成复杂任务的系统。与单次调⽤的差异在于：单次调⽤是 开环⽣成；Agent 是 闭环决策，每步可依据⼯具返回更新状态，直到终⽌条件。追问：若没有外部⼯具，还能叫 Agent 吗？答案：可称为「弱环境」Agent，仅有对话记忆与推理；但仍可有内环多步 CoT 与⾃我验证。⾯试中强调是否存在「⾏动—观察」循环更清晰。Q2：Agent 的记忆⼀般怎么设计？答案：分层设计最常⻅：⼯作记忆（当前轨迹与关键结论）+ 会话记忆（摘要滚动...

查看5道真题和解析

点赞评论收藏

分享

05-05 20:32

中山大学算法工程师

淘天AI Agent 一面面经

1. 挑选个人复杂度最高、难点最突出的项目完整讲解，重点说明项目核心痛点、落地难点、技术瓶颈与最终落地解决方案。2. 结合项目场景，说明Agent任务目标拆解逻辑，以及PPO算法完整训练指标、效果评估标准。3. 阐述RLHF对齐偏好定义逻辑，大模型对话优劣好坏的标注标准与偏好数据集构建逻辑。4. 详细讲解奖励模型RM、Critic网络结构设计思路，组件有效性验证方式、调优优化策略，以及整体对话效果量化评估方案。5. 对比选型SFT、DPO、PPO、GRPO、RAG多条技术路线，说明为何选用强化学习做Agent对齐优化，完整输出各方案评估维度、适配场景与选型依据。6. DPO全流程效果评估方式，结合实际业务案例说明DPO固有短板，对比DPO与GRPO原理差异、优劣特点与落地适用场景。7. 从算法原理角度，讲解GRPO具备更强探索能力、稳定训练的核心原因。8. 阐述个人参与RAG相关项目初衷，梳理RAG系统整体架构与核心工作内容。9. 对比语义切分、固定长度切分、递归语义切分优劣，说明递归切分选型原因，以及不规则、非结构化文档专属预处理方案。10. 梳理向量数据库选型核心考量维度，结合线上高并发、低延迟生产环境，说明落地选型策略。11. 说明关键词检索+向量检索混合检索设计原因，介绍召回率、准确率等检索效果客观量化评价指标。12. 针对检索召回不足、匹配精度偏低、上下文关联性差等问题，逐条梳理全链路优化手段。13. 讲解用户意图模糊、指代不清、需求不明确类问题的意图识别与澄清处理方案。14. 讲解重排序模型选型、技术实现、解决的检索冗余错乱问题，所用开源/商用工具库，以及不同重排模型横向对比实验结论。📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

查看14道真题和解析

点赞评论收藏

分享

评论

点赞

收藏

招聘动态

“联宝杯”

2026 大学生创新大赛

上海人工智能实验室

2026年春季校园招聘

联想

27届暑期实习

联想

26届补录

27届校招宝典

厦门银行

2026届春季校园招聘

快手

27届实习超多转正机会

联宝科技

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 这个offer值得去吗？ #

32157次浏览 232人参与

# 校招薪资来揭秘 #

961023次浏览 4063人参与

# 在爱玛，骑向未来 #

20491次浏览 395人参与

# 如果春招能重来，我会___ #

29701次浏览 296人参与

# 24秋招避雷总结 #

1020342次浏览 7098人参与

# 你会因为行情，降低找工作标准吗？ #

45532次浏览 333人参与

# 机械人还在等华为开奖吗？ #

339296次浏览 1652人参与

# 米哈游求职进展汇总 #

688799次浏览 3348人参与

# 华为池子有多大 #

178211次浏览 931人参与

# 26届春招投递记录 #

8755次浏览 72人参与

# 25届网易互娱暑实进度 #

109136次浏览 802人参与

# 通信/硬件求职避坑tips #

172139次浏览 1170人参与

# 记录我的毕业季 #

4834次浏览 120人参与

# 机械人，你的秋招第一份简历被谁挂了 #

268837次浏览 2451人参与

# 远程面试的尴尬瞬间 #

363946次浏览 2062人参与

# 大学最后一个寒假，我想…… #

103336次浏览 846人参与

# 机械求职避坑tips #

103725次浏览 589人参与

# 你认为小厂实习有用吗？ #

145116次浏览 763人参与

# 运营商笔面经互助 #

219700次浏览 1833人参与

# 美团秋招笔试 #

216479次浏览 1192人参与

# 网易求职进展汇总 #

213210次浏览 1524人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务