发点面经攒攒人品~1.论文拷打2.拷打实习3.拷打第一个项目:MinerU解析出的结果是Markdown,相比纯文本,Markdown的层级结构对检索有什么好处?在你的流程中,VLM是在检索阶段参与,还是只在最后生成答案时参与?Ragas评测中,如果Faithfulness得分低,说明模型出现了什么问题?4.拷打第二个项目:在LangGraph中,Node和Edge分别代表业务流中的什么?长短期记忆在实现上有什么区别?短期记忆通常存在哪里?Agent是如何识别并选择正确工具的?是基于工具的名称还是功能描述?5.讲一下向量检索和关键词检索各自的优缺点6.为什么RAG比直接问大模型更能减少事实性错误?7.如果原始文档被修改了,如何保证向量数据库里的索引同步更新?8.什么是Query Rewrite?能解决用户提问中的什么问题?9.Temperature参数调高和调低,分别会对模型的输出产生什么影响?10.讲讲CoT的原理?为什么它能让模型处理复杂任务?11.在Agent执行任务时,Thought、Action和Observation三者如何循环?12.当对话长度超过模型上下文窗口时,处理方法有哪些?13.模型在进行工具调用时,输出的是直接的结果,还是一个包含参数的 JSON 字符串?14.系统提示词和用户提示词在Agent约束力上有什么区别?15.讲一下什么是HNSW索引?为什么比暴力搜索快?16.讨论了一下OpenClaw17.在开发Agent应用时,你怎么判断一个任务该用7B的小模型还是70B的大模型?18.如果你发现Agent总是重复执行同一个错误的工具调用,你从哪个环节修复?