腾讯 AI应用开发 二面

#AI求职记录#依旧忘了录音, 记录下有印象的问题

Q: 项目中说到了从claude ADK迁移到Gemini API. 为什么.

Q: 如果有个无限长上下文的模型, 是否可以把所有信息都放到上下文?

A: 不能, 信息可能会有噪音, 影响模型判断.

Q: 场景: 一个有很多内容的需求文档, 是否可以把整个文档放到上下文中, 让模型直接实现?

A: 内容太多,模型的注意力可能兼顾不了, 需要分模块输入. (猜的)

Q: 如果分模块输入, agent是否会对整个需求没有认知,导致做出来的成果不符合预期?

A: 可以参考人的协作. 每个agent工作在独立的worktree上, 定义一个约束, 每个模块期望的效果, 接口等.

Q: 用过哪些code agent?

A: cursor, claude等

Q: 你觉得claude code和cursor分别适合什么样的任务?

A: 我觉得没啥区别. 效果都可以.主要用cursor因为便宜

Q: cursor用过什么skill觉得好用?

A: superpowers. 有brainstorming, git等 前者可以帮助理清需求, 后者是教git的最佳实践.可以每个任务对应一个worktree, 代码追溯更方便, 适合多agent协作.

补充: (skill creator. 这个没说,但是也挺好用的. 需要干重复的任务可以直接让cursor写个skill)

Q: 了解过spec-drivening 的code agent吗?

A: 用过kilo 的spec模式. 觉得机制有点重 需求文档+实现文档, 不如brainstorm + plan mode.

Q: 了解上下文压缩机制吗?

A: 看过gemini CLI的源码, 他的实现是保留最近30%对话, 压缩另外70%的内容.用LLM生成结构化摘要

Q: 为什么压缩前70%? 最开始的几轮对话明确需求不是很重要吗?

A: 生产摘要的提示词明确要求模型填写需求内容.

Q: 你觉得以后的软件工程会变成什么样?

A: 我觉得以后不用人不用写代码, 而是给agent 说明需求.并校验agent生成的代码.

补充: 这个问题我觉得答得不太好, 软件工程不只是写代码, 也包含测试, 部署, 维护等操作.

补充: 现在想想可以是AI 驱动的软件工程, 代码AI写, 测试AI自动测, 部署维护也是AI来做.

Q: 玩过Openclaw吗? 了解其的记忆机制吗?

A: 了解, 主要有两阶段: memory_search: 用RAG检索memory文件, 返回topN 相关的内容以及文件路径以及行数. agent可以选择调用memory_get:一个类似read的tool读取memory文件的内容.

Q: 如果检索返回了很多相关的内容,如何选择最相关的?

A: 向量相似度比较, 选择最相近的n个

Q: 了解embeding吗?

A: 好像是语义检索计算相似度的模型. 这个不太了解

Q: 用大模型来判断哪些内容最相关,是否可行?

A: 挺有意思的.

Q: 实际上没人这么做, 你觉得为什么?

A: 返回的内容可能很多, 超过模型最大上下文,模型判断不好.

补充: (可以加上速度, 成本的因素)

Q: OpenClaw有个pi-coding-agent, 与你的项目有什么区别?

A: 不太了解pi.

Q: 对候选人的期望:

A: 代码能力不要求,因为100% ai生成代码

A: 了解底层原理,需要有较强的学习能力, 对前沿的产品能快速复现.

Q: 反问环节:

Q: 你觉得agent开发最重要的是什么?

A: 评测机制.

补充: 无手撕.

 这次面试体感上感觉还可以, 但是仔细复盘发现有不少问题.主要是RAG的机制不熟,rerank不知道.还有对大模型的底层原理不了解.

 这次面的问题都比较开放, 所以我把我的回答也写了上去, 各位如果有不同意见的留言, 一块讨论.
全部评论
麻烦问下佬的项目是什么呀
点赞 回复 分享
发布于 03-25 15:51 陕西
从Claude ADK迁移到Gemini API,成本考虑是一方面,Gemini的响应速度和稳定性在某些场景下确实更好。面试官问这个说明在意你的技术选型思路。二面问题更偏架构和工程trade-off,准备得不错。我们团队也在做类似的AI应用落地,暑期还有位置:https://www.nowcoder.com/jobs/detail/440929?jobId=440929
点赞 回复 分享
发布于 03-24 10:43 浙江
这个是算法那边吗?怎么感觉有点像工程
点赞 回复 分享
发布于 03-23 18:26 江西

相关推荐

二、Text2SQL 相关技术问题1. 不同数据表量级下,Text2SQL 的技术选型差异是什么?2. 为何要将数据表每一行数据向量化?使用的 Embedding 模型是什么?3. 行级向量化与表元数据(Metadata)检索的优劣对比,为何不直接用 Metadata?4. Text2SQL 业界常用方案、技术框架与难点你了解哪些?三、RAG 相关技术问题1. Jira Agent Rack 项目要解决什么问题?高频查询内容是什么?2. 为何采用关键词+向量混合检索?各自适用场景是什么?3. 结构化数据用固定分块的原因?什么场景不适合固定分块?4. 长文档 RAG 如何分块?标点分块如何解决语义割裂问题?5. RAG 中为何要加**重排(Rerank)**环节?你的项目是否使用?6. 加重排后效果变差的原因是什么?7. 是否做过Query 改写?解决什么问题?如何实现?8. RAG 与小模型微调的适用场景分别是什么?四、Agent 相关技术问题1. 多 Agent 系统采用什么架构?任务如何编排?2. OpenCloud、Perplexity 等 Agent 系统的核心是什么?3. Agent 的短期/长期记忆如何设计、区分与协作?4. Agent 系统相比直接用大模型的优势是什么?5. 用户如何自定义 Agent 与 MCP?流程是什么?整体上就是自己给自己挖坑,很多细节答不上来,面试了差不多50min,面试完感觉被抽干了,像是做了一次小丑,好不容易有次二面,被自己浪费了
查看17道真题和解析
点赞 评论 收藏
分享
评论
11
60
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务