27实习 AI应用开发一面 蚂蚁

发点面经攒攒人品~
1.论文拷打
2.拷打实习
3.拷打第一个项目:MinerU解析出的结果是Markdown,相比纯文本,Markdown的层级结构对检索有什么好处?在你的流程中,VLM是在检索阶段参与,还是只在最后生成答案时参与?Ragas评测中,如果Faithfulness得分低,说明模型出现了什么问题?
4.拷打第二个项目:在LangGraph中,Node和Edge分别代表业务流中的什么?长短期记忆在实现上有什么区别?短期记忆通常存在哪里?Agent是如何识别并选择正确工具的?是基于工具的名称还是功能描述?
5.讲一下向量检索和关键词检索各自的优缺点
6.为什么RAG比直接问大模型更能减少事实性错误?
7.如果原始文档被修改了,如何保证向量数据库里的索引同步更新?
8.什么是Query Rewrite?能解决用户提问中的什么问题?
9.Temperature参数调高和调低,分别会对模型的输出产生什么影响?
10.讲讲CoT的原理?为什么它能让模型处理复杂任务?
11.在Agent执行任务时,Thought、Action和Observation三者如何循环?
12.当对话长度超过模型上下文窗口时,处理方法有哪些?
13.模型在进行工具调用时,输出的是直接的结果,还是一个包含参数的 JSON 字符串?
14.系统提示词和用户提示词在Agent约束力上有什么区别?
15.讲一下什么是HNSW索引?为什么比暴力搜索快?
16.讨论了一下OpenClaw
17.在开发Agent应用时,你怎么判断一个任务该用7B的小模型还是70B的大模型?
18.如果你发现Agent总是重复执行同一个错误的工具调用,你从哪个环节修复?
全部评论

相关推荐

大愣子衰哥:老哥,是正式还是实习
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务