字节 剪映 ai应用开发

攒人品!!! 大家都要拿到暑期实习的offer啊!!!

项目一:
1. 你这里的意图判断是怎么做的?直接交给模型做,还是这个用户的查询query做了一些其他处理。
2. 为什么要设计这三层记忆架构,是一个通用的设计还是参考了什么论文。
3. Agent 的评估是怎么做的
4. 有没有评估过你的记忆架构,在没参考openclaw之前和之后的指标有什么变化,成功率有对比吗?
5. 你之前向量检索加redis缓存是怎么做的? redis健和值是什么?
6. 新的记忆加到文件里 是直接append吗? 覆盖?还是改写?
7. 改的方式 模型改吗?模型调用editor去改文件是吗?
8. 你觉得 redis+milvus向量存储 和mysql+文件系统+向量检索,他们的优劣如何?优点缺点分别是什么。
9. 其实我比较感兴趣的是他们这两种方式的查询检索召回 效率的对比。
10. 对于每一个用户,在系统中怎么保存这些不同用户的文档?
11. 其实就是模型通过路径去读这些文件是吧,那如果两个人登了同一个账号,在同一时刻,这个文件会被两个不同的用户使用,在这个情况下,你们的系统如何处理?怎么解决这个问题?

项目二:
1. 你说你的文档准确率达到90%,具体做的改变是什么。
2. 那为什么医院的问答项目里,不采用同样的实现
3. 你说pdf表格密集,那假如用户就是问一个表格里,第二行是2025年,第三行是2024年,具体问2025年的值是多少,你的系统能做到吗?
4. skill是自己写的吗 ,互相之间可以联动吗?
5. 为什么不用skill-creator
6. 你的数据集是怎么收集的,然后是怎么评估的呢?打分是谁在打分?人在打分 ,还是模型裁判员去打分?如果有很好用的模型裁判员,为什么不用裁判员模型
7. 介绍一下KV cache
8. 讲一下transfromer架构。

算法题
1. 字符串数字相减
2. 字符串最长连续序列
全部评论
拼多多招27届实习生啦 https://careers.pddglobalhr.com/campus/intern/detail?t=dRvUVvcTiA
点赞 回复 分享
发布于 04-10 19:34 上海

相关推荐

04-10 02:40
门头沟学院 Java
给我面没招了,发点面经攒攒人品~1.项目拷打2.你在这个 RAG 系统优化里面,在多阶段 RAG 系统中采用了 BM25 和向量混合检索,然后这个是怎么去设计两者的结合逻辑的?然后混合策略的话具体是如何去提升检索效果的?3.RAG支持 PDF 扫描件和 OCR,然后还有表格结构化的提取,然后在这过程中有没有遇到什么技术难点?4.识别准确率怎么样?5.这个多智能体系统设计里面,然后它的这个 State 管理和Checkpoint分配机制的具体实现方式是什么?怎么去解决对话执行中的状态竞争问题呢?6.怎么样实现 State 全局管理?7.将Choice 接口封装为MCP工具的时候,怎么去设计一个标准化接口?然后遇到有没有遇到过一些兼容性的挑战?8.举了项目里的一个例子,问我出参入参是怎么去定义的?9.大模型在调用这个工具的时候,比如说有 MCP 之前,它的调用的处理流程是什么样子的?10.或者说 MCP 它有哪些缺点或者挑战呢?11.提供的这个 MCP 的结果它是流式的吗?12.这个多agent项目是主子agent的项目吗?13.其中一个功能,然后它的 token 就是一次会话 token 大概有多少?有没有超过上限?14.模型用的哪个?我答Qwen,问我Qwen具体哪个版本15.在子任务过程中啊,如果它的某个子任务失败,比如说数据获取为空,它的这个整个工作流是怎么去重试或者是降级处理的?16.在实现这个流式输出实现的时候,比如说后端用了 FastAPI 和 SSE 来实现中间结果的实时流式输出。然后在这个 Langchain 这种基于图的状态机框架中,是怎么捕获每个 node 的执行结果,然后推送到前端的?17.LangGraph 和Langchain 为什么选择了 LangGraph 没有选择简单的那个 Langchain 呢?18.Checkpoint 的持久化19.对话之后重新连接的话,是怎么能够恢复到之前的那个状态呢?20.对话持久化的话,是存储到哪里的?是存储到内存里面,还是存到硬盘上面去的?21.关于 RAG 的,向量数据库在选择建索引的时候是用了哪种向量数据库?为什么?22.这里面你提到了 RRF 重排序,然后有没有引入什么模型进行精排?
查看22道真题和解析
点赞 评论 收藏
分享
评论
1
7
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务