A厂 Agent开发 一面面经题目整理

1.自我介绍。

2.你目前还在实习吗?你参与的实习吗?你参与的 AI 产品主要面向什么问答场景、包含哪些问题类型?

3.处理查询文档里的异构数据(如图片)时,具体的处理流程是什么?解析成纯文字后如何进一步加工?这样只返回文字给用户,图片信息不会丢失吗?

4.你们是通过人工打标建立图片和文本的对应关系吗?文档量很大的情况下,打标工作能完成吗?

5.如何保证大部分图片异构数据解析后回答的正确性?若回答错误,怎么识别问题?后续要验证回答准确性,你有什么方案?

6.用于评测的另一个大模型,如何构造问题、分析文字并进行对比?这个大模型的正确率以及模型自我一致性怎么确定?

7.你们的模型基于哪些异构图像做增强?模型会不会产生幻觉,生成文档外的内容?

8.若用户的问题不在文档里,你们会怎么处理?是调用其他模型吗?大模型回答不了时,会提示用户补充问题吗?用户补充后仍无法解决该怎么办?模型如何判断何时需要让用户补充提问?

9.你们有框架编排这些流程吗?用的是什么框架?

10.你简历中提到的识别率、检索召回率等指标,怎么理解检索召回率?这些指标具体包含哪些评价项?什么是忠实度?召回率的分子分母是怎么定义的?

11.你之前那段实习的具体工作内容是什么?针对设备故障叙述报告这类复杂文本,模型如何理解?是做了相关检测吗?大模型是怎么实现术语解释的?

12.请讲一下 LoRA 技术,除了减少参数量,它还有什么优点?你做的 LoRA 相关工作,后续有落地应用吗?

13.你写代码主要用 Python 吗?会不会用 Java?了解 Java 的多线程、双亲委派模型以及消息中间件吗?有没有做过 Java 相关项目?

14.你用过 LangChain 吗?如何用它解决模型的幻觉问题?若不熟悉 LangChain,还能通过什么方法做 AI 能力增强?

15.让你实现一个查询天气的对话 AI 顶层设计,具体步骤是什么?聊天记录最终如何返回给用户?除了文本存储,还有其他方式吗?多模态的具体实现方法是什么?

16.天气大模型要关联地理位置信息(如杭州属于中国),该怎么处理?如何对接天气 API?怎么定义 API 调用的相关内容?

17.若查询天气后,还要根据天气推荐买伞这类服务,大模型如何按顺序调用多个服务?如果有七八项服务,每个服务的调用逻辑都要单独写吗?

18.LangChain 和 LlamaIndex 的区别是什么?

19.如何测试这个 AI 系统的技能?它和传统 AI 测试有什么区别?有哪些具体的测试方案?评测数据集该怎么构建?测试具体分哪些步骤,要验证哪些能力?

20.要让模型完成“在公司周边奶茶店(如霸王茶姬)订一杯奶茶”的任务,该怎么实现?若调用高德 API 做定位和门店查询、调用外卖平台 API 下单,这两个 API 该怎么对接?编写大模型让它按顺序调用 API,可能会遇到什么问题?怎么解决?

21.若高德 API 要求输入经纬度坐标,但大模型产生幻觉输出错误公司坐标,导致门店查询错误,该怎么干预模型?如果模型坚持认为自己的坐标是对的,该怎么处理?定位到问题原因后,又该怎么解决? #聊聊Agent开发#
全部评论
?你这是校招吗?感觉像是社招已经干过完整系统项目的啊
1 回复 分享
发布于 03-10 21:32 广东
秋招进度如何
点赞 回复 分享
发布于 03-04 11:16 北京
感觉是新型岗位
点赞 回复 分享
发布于 02-27 13:58 四川
大佬看看简历
点赞 回复 分享
发布于 02-24 08:38 江苏
借楼,谢谢!!希望对大家有帮助。 帮转-小红书视频剪辑Agent开源项目 帮转-求star FireRed-OpenStoryline 基于本地部署项目,使用起来更丝滑哦 github开源链接: https://github.com/FireRedTeam/FireRed-OpenStoryline/tree/main hugging face网页版体验链接: https://fireredteam-firered-openstoryline.hf.space/ RedTech公众号宣传推文: https://mp.weixin.qq.com/s/tr-SEjZp6fNVS6IrjIbCRg
点赞 回复 分享
发布于 02-12 22:30 江西
眼花缭乱了
点赞 回复 分享
发布于 02-12 20:31 山东
点赞 回复 分享
发布于 02-10 16:09 天津
看完瑟瑟发抖
点赞 回复 分享
发布于 02-10 16:08 山东
眼花了
点赞 回复 分享
发布于 02-10 16:08 黑龙江

相关推荐

攒攒人品!有面试过同岗的朋友欢迎评论区交流1.项目拷打2.实习拷打3.OCR 结果有噪声或错误时,你是怎么做纠错或提升解析质量的?4.多模态检索中,图像和文本向量不在同一空间时,如何实现对齐?5.Agent 中长短期记忆如何设计?各自存什么,怎么触发读取?6.多轮对话中,如果不同轮次的记忆发生冲突,你如何处理?7.用户情绪异常(投诉、愤怒)时,Agent 如何在不中断主流程的情况下进行干预?8.长文档为什么一定要切 chunk 再做向量化?不切会有什么问题?9.chunk切分时为什么要有重叠区域?比例一般怎么确定?10.稠密向量和稀疏向量的区别是什么?各自适合什么场景?11.是否做过关键词召回和向量召回的融合?具体怎么做的?12.向量检索中 Top-K 设置过大或过小分别会带来什么问题?13.余弦相似度和欧氏距离在高维空间中的差异是什么?实际怎么选?14.为什么需要 rerank 模型?它解决了向量召回的哪些问题?15.rerank之后的截断策略是怎么设计的?为什么选这个 K 值?16.文档发生局部更新时,如何做增量索引而不是全量重建?17.RAG 中如果没有召回到相关知识,如何约束模型避免胡编?18.HyDE 在 query 模糊时是如何提升召回效果的?19.超长上下文模型出现后,RAG 架构的必要性是否会下降?20.大模型高并发调用时,如何做限流、降级和成本控制?
点赞 评论 收藏
分享
一、开场与项目基础先做个自我介绍。为什么用消息订阅异步落库,而不是同步写库?系统峰值大概在什么级别?有考虑过为什么库支撑不了吗?二、消息队列可靠性MQ 写失败了,怎么保证消息不丢?是先批量更新数据库,再写推送状态吗?先更新数据库再推送?如果推送状态写失败了会怎么办?可以支持重试吗?如果更新成功、推送也成功,重试一次会怎么样?会推两条吗?三、分布式锁项目里用的分布式锁具体怎么实现?锁是怎么释放的?锁过期时间设 30 天,30 天内重试会有什么问题?正常用 Redis 实现防并发的分布式锁,应该怎么实现?释放锁在哪里释放?正常请求结束后,在哪个环节释放锁?四、MySQL 优化线上一条 SQL 执行 5 秒,怎么优化?这 4 种 SQL case,哪些能命中索引,哪些命中不了?知道什么是 ICP 优化吗?五、高并发:商品超卖活动限量 100 件,说出三种防止超卖的方案,并对比优缺点。详细说下 Redis + DB 这种方案,怎么保证 Redis 和 DB 的一致性?这种方案和第二种 Redis + MQ 方案有区别吗?Redis + MQ 方式下,怎么保证 Redis 和 DB 的数据一致性?比如 Redis 扣减成功、MQ 写失败怎么办?如果加入对账机制,对账需要哪些数据?上游、下游分别要存哪些数据?六、大数据量分页与分库分表订单表 5000 万数据,分页查询怎么优化?订单表达到 1 亿条,单表查询越来越慢,怎么处理?水平分表具体怎么分?用户订单表,根据什么字段切分比较合适?七、数据库死锁数据库死锁产生的原因是什么?怎么避免?生产或日常开发中有没有遇到过死锁问题?八、Redis 缓存问题什么是缓存雪崩、缓存穿透、缓存击穿?分别怎么解决?九、缓存更新策略先更新数据库还是先更新 / 删除缓存?方案是什么?先更新 DB 再删缓存,那什么时候写缓存?十、限流方案实现严格一分钟内的请求限流,用 Redis 怎么做?还有其他限流方法吗?滑动窗口(ZSET)、令牌桶、漏桶这几种方案有什么区别?适用场景分别是什么?十一、前端基础前端平时有接触吗?比如 JS?什么是跨域?为什么会有跨域?怎么解决?了解 CSRF 攻击吗?怎么防御?防 CSRF 的 Token 怎么生成?十二、分布式事务了解什么是分布式事务吗?说一下两阶段提交。十三、算法题完成两道算法题,并讲解代码思路。十四、AI 工具与 Agent日常开发用过哪些 AI 工具?豆包帮你解决了什么问题?Cursor 是付费会员吗?怎么付费?AI 生成的代码怎么验证正确性?让 AI 写一个 Redis 分布式锁工具类,你会怎么描述需求、怎么写 Prompt?系统客服角色接入大模型做智能问答,整体架构和流程怎么设计?RAG 的整体流程是什么?一份文档怎么向量化接入?向量检索后,是把所有相关 wiki 都交给大模型吗?检索出的内容做精简压缩用什么实现?什么是 AI Agent?和普通写 Prompt 有什么区别?
点赞 评论 收藏
分享
评论
11
96
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务