明略科技 Agent开发-二面
自我介绍
项目介绍
大模型夺命连环call
关键词检索的算法 有什么
rerank模型的架构
rerank为什么慢
长期记忆,短期记忆
长期记忆需要保存什么东西
长期记忆的压缩方案
知识库构建 PDF数据是怎么解析的。 -- 用ocr和 VL模型 有没有调研过一些开源的库之类的
OCR用的什么模型
PDF中的表格和图片是怎么处理的。 -转成markdowm
HTML是怎么解析的 有没有优化方案 BS4。 有调研过其他方案吗
为什么要先embbding再rerank 你先rerank不行吗
manus
了解过manus,你能给我讲讲manus的技术特点嘛
你怎么看出来manus是多智能体方案的
如何不用多智能体方案给1000个tools还能正常work
如果一个agent工具的某一个节点出现了问题 如何解决
大模型是怎么返回的做函数调用的
是谁去做fuctioncall
有了解过MCP嘛 MCP是什么
如何让大模型格式化输出一个消息 PE ---- Pydanic
为什么Pydanic 要比 PE 工程要好
有遇到过Json输出格式不对的情况无法解析的情况嘛 这种情况是怎么处理的
你是在哪里遇到过这种问题 有考虑过我什么会发生这种情况嘛
langchain如何去做长期记忆和短期记忆
如何构建一个工具去做memory的记忆,让大模型能够在长期对话中学习到,用户的使用习惯
了解过cursor是怎么做memory的管理的吗
服务端怎么向客户端通信有了解过吗。 SSE websocket
算法:
二分查找
二分查找的变种
把中间截断以后接到前面 需要保证O(log n )时间复杂度
反问
完善的AI产品的样子
简历和知识点的不足。 找一个地方深挖 而不是泛泛学习
需要找一个好实习 让你去学习到这些反馈和各种奇怪的问题
#秋招笔面试记录##聊聊我眼中的AI##牛客创作赏金赛#