T厂 Agent开发日常实习一面挂凉经

一上来先是手撕,比较简答,大概做了5分钟。
一、多模态 RAG 与检索评估
多模态预处理中,图片在 RAG 系统里是如何向量化检索的?
多模态预处理环节的技术难点是什么?
如何杜绝跨场景召回相似步骤的问题,具体实现方式是什么?
介绍评估精度和召回率所采用的框架,以及召回率的具体计算细节。
该框架中精度和召回率的计算方式分别是什么,二者的核心区别是什么?
能否只关注召回率而不关注精度,原因是什么?

二、实习项目与意图识别
介绍实习业务方向相关的意图识别模型的实现内容。
意图识别模型具体能解决什么问题,结合实例说明模型效果提升的具体表现。
实习项目中遇到的三个技术问题里,最难的是哪一个,具体难点是什么?
实习项目的数据集是如何构造的?
该实习项目的开发周期是多久,开发人员配置如何?

三、代码生成项目与模型适配
代码生成相关项目的开发目的是什么?
该项目与相关经典框架解决的问题是否相同,核心区别是什么?
相关经典框架为何不支持 Qwen 系列模型,具体问题是什么?
如何让 Qwen 模型正常使用相关工具,具体实现方式是什么?
思考模型与非思考模型的输出除标签外,还有哪些核心区别?
如何解决 Qwen 思考模型产生错误工具调用、空工具调用的问题?
项目中遇到的核心挑战是否与相关经典框架解决的问题一致?
该项目是完全自研还是参考相关实现,具体做了哪些内容和思考?

四、Agent 记忆体系(长 / 短期记忆)
模型多轮对话的历史记录中,长期记忆和短期记忆由谁定义、如何区分?
长期记忆和短期记忆的判断主体是谁,判断的指标是什么?
长期记忆的维护需要哪些策略或算法,具体如何维护?
长期记忆是否需要做处理,是直接保留对话内容还是总结后保存?
长期记忆的总结工作由谁实现,总结的触发时机和算法是什么?
结合发现的问题和采取的措施,继续介绍项目后续的开发内容和思路。
模型调用搜索工具的优化实现效果如何,与未使用工具前的核心区别是什么?
项目中状态机的能力具体是如何体现的?
大模型如何感知状态机的当前状态?
短期记忆的 5 轮对话指原始对话还是整理后的内容,短期记忆如何转化为长期记忆?
触发短期记忆转化为长期记忆的条件是什么,如何结合短期记忆和已有长期记忆生长新的期记忆?
长期记忆的淘汰算法是否为先进先出,该算法是否存在问题?
针对长期记忆先进先出算法的潜在问题,是否有新的优化思路?
长期记忆是否一定要淘汰,能否通过检索方式调取而非丢弃,该思路的可行性如何?
长期记忆占用模型上下文窗口会导致输出窗口压缩,该问题的优化方向是什么?

五、RAG 与代码助手落地
项目中 RAG 的作用是什么,其调用时机是怎样的?
该代码生成相关项目整体的技术难点是什么?
现阶段各类大模型代码助手平台大规模落地使用的最大难点是什么,解决哪个核心问题才能实现规模化应用?
如何解决大模型对大代码量项目理解不足、易出错的问题?
代码助手在代码检索时,如何高效找到与问题相关的依赖并提供给大模型?
现阶段为何少有框架做代码依赖相关的优化工作,核心原因是什么?
若要解决代码依赖难以查找、模型无法理解整体代码库的问题,除构建图谱外还有哪些方法?

六、模型训练与技术拓展
介绍实习过程中做的模型后训练相关工作,具体实现方式是什么?
基于 400 条回答不佳的真实数据,如何将其用于模型训练?
仅靠 400 条数据难以训练出靠谱模型,如何将数据集扩展到 1 万条,具体的扩展过程是什么?
介绍近期看过的技术相关文章,说明其核心内容和解决的问题。
该技术框架与其他同类框架(如 Agent 相关框架)的核心区别是什么?
介绍毕业论文的研究方向和核心内容。
能否立即到岗实习,实习的可到岗时间是怎样的? #Agent面试会问什么?#
全部评论
感觉问的可以呀
点赞 回复 分享
发布于 04-11 23:27 北京
这agent面试这么难,这是要结合背后的算法
点赞 回复 分享
发布于 04-11 23:22 辽宁

相关推荐

攒攒人品!有面试过同岗的朋友欢迎评论区交流1.实习拷打2.你刚才提到配合定会议那个是多 agent 架构,一共用了几个 agent?每个 agent 分别负责哪一块?3.在设计上,什么情况下你会用单 agent,什么情况下会用多 agent?4.多 agent 之间的数据传输或者通信一般是怎么做的?5.如果多个 agent 之间有并发的情况,你一般怎么处理?6.如果有多个 agent 同时去操作数据库或者文件,这种并发你怎么处理?7.如果它们是异步执行的,这边会考虑怎么做8.rag混合检索机制,是怎么实现的9.你们项目里有没有遇到幻觉问题?这个问题怎么减少、规避?10.你之前都开发过哪些工具 / function?11.你提到那个 self-refine / 自我修正,你做过哪些修正策略?12.如果 API 返回结果有字段缺失,或者有冗余内容,你会用这种方式处理吗?13.你对 MCP 了解多吗?有没有写过相关的 MCP?14.假设 agent 调工具失败了,一般怎么处理?15.你之前开发过 agent,怎么管理它的 context?16.你自己在做 AI coding 时,一般怎么用?有没有什么方法论?17.上线前主要是通过什么方式保证质量的?只是靠 code review 吗?18.你刚才提到了 skill,你自己写过哪些 skill?19.你自己写 skill 的时候,有没有做评测?怎么判断它是否满足需求、会不会出现异常?20.你之前有接触过移动端开发吗?21.现在有个问题,需要你设计一下:如果是一个微信小程序排查问题的 agent,你会怎么做?22.你刚才提到的是 RAG / 检索,是类似根据关键词看历史有没有问题记录?23.假设不是业务代码问题,而是 JS 框架本身的 bug,这种情况 agent 怎么处理?
查看22道真题和解析
点赞 评论 收藏
分享
评论
1
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务