3.30美团ai应用一面

1.skills和tools是怎么区分的?

2.skills真正的优点是什么?能做到什么?

3.mcp的讲解?

mcp要定义接口的话,必须把参数那些都定义到上下文中,他是一个比较冗余的信息,会污染到上下文。正常的工具调用是不需要这些冗杂语义的,而skill会隔离这些东西在上下文里面会去隔离这些东西,不光是token消耗量。还有一个重点就是做到按需加载,渐进式加载的问题。

4.长期记忆是怎么做的?

用户的记忆属于实体记忆,实体记忆应该更偏向于关键词记忆,并非rag。

5.接触过融合检索吗?融合检索是什么?

6.混合检索的融合算法是什么样的?他的比重是什么样子的?有可能rag找回了top5,es召回了top5,最后只要五个,如何排序?

我讲解的是rerank逻辑,并非是融合。 融合检索是指把多元的检索混合在一个排序里面。然后混合到一个排序之后,再rerank的时候用相对应的模型。

rag里面分为两种,一种是直接向量,向量采用余弦相似度匹配之后,会有一个对应的分数返回给你,还可以结合用户的输入加上跳回来的东西,进行rerank,因为直接向量检索召回过来的向量是没有语义的,这个时候把用户的query拿到,然后这两个之间再去做一个rerank,这个rerank其实返回的就是你的向量和你的query之间的相关量,会根据相关量进行一个打分,再去做一个排序,这个叫做rerank。

融合排序是另一种排序,向量检索返回的是他的一个评分,bm25返回的是另一个评分,他们是两个评分体系,比方说向量检索排名第一,但是关键词检索可能这个文档排到第十,最终的权重应该是多少,他俩之间应该有一个比重关系,怎么去计算,最终的排名是什么样子的?怎么去融合这个权重?对于不同的业务还有不同的权重,其实设计是不一样的。

7.query改写?rag改写?

要理解他的关键意思,比方说当用户输入我上面的说的是什么,其中的上面就是需要改写的,这种被称为指代消解,这种指代必须要融合上下文,必须把上下文结合起来才能理解。比方说商品退货和商品退款是不是一个意思?他流程最终的走向不一定是一个sop,其实这些都是因为一个用户query他可能能有多个标准才能成为一个答案,所以才会有query改写,因为改写完之后他能有多个query去匹配问题,会到处召回出不同的答案,可能改写完会有三个query,然后再一起去召回,召回完之后再去做一个rerank。

8.理清,提槽

理清,之后才根据路由分类的意图,叫做意图分类,然后分到体内里面,然后每一类里面后面有不同的模型去承接,那个属于理清。

提槽属于另一个维度的东西,比方说解决一个退款,你得知道订单号,需要知道订单号就需要一个提槽,需要这个就需要去和用户进行交互,我需要知道订单号,然后就需要去和用户进行交互,然后提槽成功,你就可以获取对应的订单号,之后就会走到下一步,把信息填完往后进行。

9.rag幻觉是怎么解决的?为啥rag能解决幻觉问题?

10.比方说有个天气助手,他只有北京天气,没有上海的天气,在prompt里面应该怎么去描述这个工具而能减少幻觉的问题?如果用户问上海的天气,应该怎么去解决减少幻觉的问题?提示词怎么去限制大模型没有幻觉呢?

举例,给了一个skill,说明他是一个天气助手,告诉一个城市,告诉你对应的天气,另一个skill里面是,告诉你我是一个天气助手,我只能查北京的天气,哪个幻觉会更大一点?

如果我问上海的天气的时候,第一种是调用工具,因为没有写限制,然后可能返回的就是上海地区不支持查询,而对于后面的工具,根本就不会调用,不会调用工具,然后模型的回答就是未知的,如果上海的天气有训练了,可能就会回答对上海地区不支持查询,但如果模型随便回答,可能就会出现了幻觉。第一种情况的工具已经调用了,大概率是没有幻觉的,第二种是不会调用这个工具,但既然不会触发这个问题,他就会自己去回答。

11.讲解一下ReAct框架?还有plan-execute?分别在什么场景?

任务拆分适合plan-execute模式,然后每个子任务会去尝试用react模式去执行一个任务的循环,来达到最后的计划。

12.实习是搭在什么平台上的?coze?

13.对openclaw的理解?

14.反问:美团评判智能体的指标?

首先得有评测体系,一个是智能体的评测体系,一个是大模型的评测体系,然后判断评的是什么东西,是端到端的评测还是什么?

如果是端到端的话,就需要去评测工具调用的准确度,评测安全,就需要评测红线,熔断机制,一般评测是根据线上的数据,然后根据线上指标的分布,优化一些prompt,他在各个指标里面他的表现能达到什么效果,能不能达到上线的标准?

15.手撕三数之和

第一次面大厂,感觉确实有很多理解不到位,慢慢加油。

全部评论
mark
点赞 回复 分享
发布于 04-30 12:36 河南
同学拼多多【暑假实习/春招】机会考虑吗?链接见主页,团队氛围好,工作内容挑战性强,转正薪资待遇极具竞争力。可一对一帮查进度,解答过程问题。26春招:https://careers.pddglobalhr.com/campus/grad?t=GVpddkkjmz 27实习:https://careers.pddglobalhr.com/campus/intern?t=HypMxi4pJe
点赞 回复 分享
发布于 04-28 21:08 上海
mark
点赞 回复 分享
发布于 04-27 07:44 山东
佬oc了嘛
点赞 回复 分享
发布于 04-25 12:38 北京
Mark
点赞 回复 分享
发布于 04-10 17:44 河南
感谢楼主,mark一下
点赞 回复 分享
发布于 04-09 15:37 上海
谢谢楼主 很实用
点赞 回复 分享
发布于 04-09 06:35 美国
总结得很好 mark一下
点赞 回复 分享
发布于 04-09 04:38 美国
技能隔离太强了
点赞 回复 分享
发布于 04-08 13:26 北京
加油 一定能上岸
点赞 回复 分享
发布于 04-08 08:46 美国
加油 一定能上岸
点赞 回复 分享
发布于 04-08 05:31 美国
同选手 加油!
点赞 回复 分享
发布于 04-08 05:23 美国
总结得很好 mark一下
点赞 回复 分享
发布于 04-08 05:15 美国
mark
点赞 回复 分享
发布于 04-07 22:57 湖南
拼多多招27届实习生啦 https://careers.pddglobalhr.com/campus/intern/detail?t=dRvUVvcTiA
点赞 回复 分享
发布于 04-07 20:21 上海
技能隔离太强了
点赞 回复 分享
发布于 04-07 11:56 北京
技能隔离太强了
点赞 回复 分享
发布于 04-07 11:48 北京
mark
点赞 回复 分享
发布于 04-07 11:44 山东
mark
点赞 回复 分享
发布于 04-07 00:17 安徽
佬 考虑我司不 考虑的话 可以看我主页帖子
点赞 回复 分享
发布于 04-06 11:06 上海

相关推荐

04-09 15:35
门头沟学院 Java
一、团队与工作相关你最近这段实习,开发团队规模大概是怎样的?你在工作里会直接面对客户需求吗?二、DeepResearch 项目细节DeepResearch 项目中,你主要负责哪些模块?项目中为何设计 6 个 Agent?每个 Agent 分别负责什么职责?搜索环节具体如何实现?采用的是 Function Calling、MCP 还是 RAG 方案?联网搜索功能是怎么实现的?该模块是否由你主导开发?共享状态 ResearchState 包含哪些核心字段?区分哪些是全局共享内容,哪些是阶段性产物。工作流 Graph 中,节点之间是如何进行路由调度的?三、技术实现与工程能力你做的步骤级 SSE 推送,和普通 Token 流式输出有什么本质差异?若通信中途断连,系统如何实现恢复?Checkpoint 存储为什么选择 PostgreSQL JSONB,而不使用 Redis 或分表存储?RAG 系统中,chunk size 和 top_k 参数的实验是如何具体设计与开展的?测试数据集主要从哪些渠道获取?测试集的量级大概是多少?多模型选型中,为何选择 DeepSeek 和干问?具体的选型标准是什么?“成本优先” 的选型策略是由谁提出的?四、Agent 架构与策略OnCall 项目中,为何对话场景选用 ReAct 模式,运维场景选用 Plan-Execute-Replan 模式?MCP 具体暴露了哪些工具接口?MCP 调用失败,或模型错误调用工具时,系统是如何处理的?五、记忆与项目复盘多轮记忆体系中,短期记忆具体存储哪些内容?参与过的项目中,有没有你最想重构的部分?原因是什么?平时最常用的 AI Coding 工具是什么?
查看22道真题和解析
点赞 评论 收藏
分享
评论
27
153
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务