腾讯实习二面面经

二、Text2SQL 相关技术问题
1. 不同数据表量级下,Text2SQL 的技术选型差异是什么?
2. 为何要将数据表每一行数据向量化?使用的 Embedding 模型是什么?
3. 行级向量化与表元数据(Metadata)检索的优劣对比,为何不直接用 Metadata?
4. Text2SQL 业界常用方案、技术框架与难点你了解哪些?
三、RAG 相关技术问题
1. Jira Agent Rack 项目要解决什么问题?高频查询内容是什么?
2. 为何采用关键词+向量混合检索?各自适用场景是什么?
3. 结构化数据用固定分块的原因?什么场景不适合固定分块?
4. 长文档 RAG 如何分块?标点分块如何解决语义割裂问题?
5. RAG 中为何要加**重排(Rerank)**环节?你的项目是否使用?
6. 加重排后效果变差的原因是什么?
7. 是否做过Query 改写?解决什么问题?如何实现?
8. RAG 与小模型微调的适用场景分别是什么?
四、Agent 相关技术问题
1. 多 Agent 系统采用什么架构?任务如何编排?
2. OpenCloud、Perplexity 等 Agent 系统的核心是什么?
3. Agent 的短期/长期记忆如何设计、区分与协作?
4. Agent 系统相比直接用大模型的优势是什么?
5. 用户如何自定义 Agent 与 MCP?流程是什么?

整体上就是自己给自己挖坑,很多细节答不上来,面试了差不多50min,面试完感觉被抽干了,像是做了一次小丑,好不容易有次二面,被自己浪费了
全部评论
我也刚二面完,纯小丑了
点赞 回复 分享
发布于 04-08 11:54 上海
PDD急招人,岗位多,帮跟踪进度:https://careers.pddglobalhr.com/campus/intern?t=47LjBxZ34k
点赞 回复 分享
发布于 04-08 11:41 上海

相关推荐

04-17 14:44
门头沟学院 Java
RAG与知识库构建● RAG知识库中存入的向量数据来源于哪里?● 你的文本分块(Chunking)具体是怎么做的?● 深度追问: 如果让你重新设计一个RAG系统,你了解哪些文档分块的最佳实践(比如单一窗口切多大合适)?● 深度追问: 如果采用“大分块+小分块”的父子结构策略,几万字文档的大分块具体要怎么切出来?● 深度追问: 采用固定大小切分时,如何避免语义被割裂?Agent记忆管理(短期与长期记忆)● 短期记忆是如何实现的?● 深度追问: 当对话达到设定的5轮并进行了一次压缩后,如果后续对话继续增加(第6、7、8轮...),你的系统是如何再次处理和压缩这些上下文的?● 长期记忆是如何实现的?● 深度追问: 选择在什么时机进行长期记忆的持久化保存?● 深度追问: 如果用户在同一个Session中聊了完全不同的多个话题,你在压缩总结并存入向量库之前,会如何设计提示词(Prompt)?为什么必须要做这一步总结提炼?● 深度追问: 长期记忆成功保存后,后续的具体使用场景和机制是什么?存储在哪里?系统架构与工程化挑战● 从前端到后端,你是如何准确判断和捕获Session关闭的触发时机(特别是用户直接关闭浏览器页面的情况)的?● 在执行长期记忆的持久化时,如何保证数据库写入一定成功(例如遇到报错、需要重试时如何处理以防止记忆丢失)?● 你的项目集成了哪些MCP(Model Context Protocol)工具?ELK和Prometheus是如何协同工作的?● 你的Agent是只能被动响应用户的提问,还是能做到主动发现异常并给出提示/解决方案?● 场景题: 如果抛给你一条执行非常慢的SQL语句,你的Agent从头到尾的分析和处理链路是怎样的?AI编程工具的日常实践● 平时写代码在用什么IDE和AI模型?● 使用Cursor时,有什么最佳实践能让生成的代码更加准确?● 深度追问: 开发前的需求分析是你自己做,还是借助AI来做?● 深度追问: 在让Cursor最终修改代码前,生成的代码是以什么样的“中间态”交给你进行Review的?● 深度追问: 使用Cursor时,有没有自定义过相关的规则文件(如 .cursorrules)?
查看21道真题和解析
点赞 评论 收藏
分享
评论
2
10
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务