字节跳动Agent开发一面

抖音基础架构团队 一面 90min
1.自我介绍
问实习:
2.提示词模板是怎么构建的?
3.单Agent还是多Agent的?子Agent任务是什么?
4.分支覆盖率是怎么统计的?原理有没有了解过?代码插桩具体是怎么实现的?
5.对于代码解析有没有前置分析?有效性判断怎么实现的?未来让你来优化这些指标你会怎么设计?
6.有没有思考过哪些代码会让模型生成的代码准确度和覆盖率降低?这些用AST和LSP都生成不了单测的代码如何过滤?
7.mock是怎么实现的?
问项目:
8.多维度的查询改写是什么?改写的时候遇到需要用户参与补充信息时怎么设计?技术上怎么实现?
9.并行化意图识别是什么?为什么要并行化?如何实现的?
10.讲一下项目里召回的流程
11.对于上下文工程有什么经验吗?有没有做过to do list?为什么这样会让模型更聚焦,怎么实现的?
12.skills的原理有没有了解过?怎么实现的?
问八股:
13.LLM的底层原理有没有了解?输入给模型的是什么?
14.self attention怎么实现的有了解吗?为什么要分成QKV,怎么计算的?同一个token向量是一样的吗?
15.python有没有多线程?为什么要有GIL,有没有了解过?多线程的锁都有什么?lock和Rlock有什么区别?
16.信号量的底层是怎么实现的?
17.cpp编译链接流程有没有了解?编译分哪些步骤?
手撕:
18.岛屿最大面积
19.反问
#今天你投了哪些公司?# #AI求职记录#
全部评论
内容不错👍
2 回复 分享
发布于 03-18 08:25 北京
27届拼多多实习机会或看我主页 https://careers.pddglobalhr.com/campus/intern?t=4OmKPVeX9a
点赞 回复 分享
发布于 03-31 19:50 上海
问下分支覆盖
点赞 回复 分享
发布于 03-24 11:37 北京
接好运
点赞 回复 分享
发布于 03-23 21:54 上海
小登不懂,后端也能去agent吗?也想学这块儿,要怎么进行学习呢
点赞 回复 分享
发布于 03-19 02:13 北京
你之前做的啥项目啊,覆盖率插桩吗?感觉做的事情和我有点像
点赞 回复 分享
发布于 03-17 14:37 北京
大淘宝技术-行业运营技术,招暑期实习,AI Agent 开发/算法岗,感兴趣的朋友可以私聊我哦~
点赞 回复 分享
发布于 03-17 00:29 浙江
问下分支覆盖
点赞 回复 分享
发布于 03-16 14:21 北京
我了个豆
点赞 回复 分享
发布于 03-16 12:41 河南

相关推荐

04-09 18:05
门头沟学院 Java
一上来先是手撕,比较简答,大概做了5分钟。一、多模态 RAG 与检索评估多模态预处理中,图片在 RAG 系统里是如何向量化检索的?多模态预处理环节的技术难点是什么?如何杜绝跨场景召回相似步骤的问题,具体实现方式是什么?介绍评估精度和召回率所采用的框架,以及召回率的具体计算细节。该框架中精度和召回率的计算方式分别是什么,二者的核心区别是什么?能否只关注召回率而不关注精度,原因是什么?二、实习项目与意图识别介绍实习业务方向相关的意图识别模型的实现内容。意图识别模型具体能解决什么问题,结合实例说明模型效果提升的具体表现。实习项目中遇到的三个技术问题里,最难的是哪一个,具体难点是什么?实习项目的数据集是如何构造的?该实习项目的开发周期是多久,开发人员配置如何?三、代码生成项目与模型适配代码生成相关项目的开发目的是什么?该项目与相关经典框架解决的问题是否相同,核心区别是什么?相关经典框架为何不支持 Qwen 系列模型,具体问题是什么?如何让 Qwen 模型正常使用相关工具,具体实现方式是什么?思考模型与非思考模型的输出除标签外,还有哪些核心区别?如何解决 Qwen 思考模型产生错误工具调用、空工具调用的问题?项目中遇到的核心挑战是否与相关经典框架解决的问题一致?该项目是完全自研还是参考相关实现,具体做了哪些内容和思考?四、Agent 记忆体系(长 / 短期记忆)模型多轮对话的历史记录中,长期记忆和短期记忆由谁定义、如何区分?长期记忆和短期记忆的判断主体是谁,判断的指标是什么?长期记忆的维护需要哪些策略或算法,具体如何维护?长期记忆是否需要做处理,是直接保留对话内容还是总结后保存?长期记忆的总结工作由谁实现,总结的触发时机和算法是什么?结合发现的问题和采取的措施,继续介绍项目后续的开发内容和思路。模型调用搜索工具的优化实现效果如何,与未使用工具前的核心区别是什么?项目中状态机的能力具体是如何体现的?大模型如何感知状态机的当前状态?短期记忆的 5 轮对话指原始对话还是整理后的内容,短期记忆如何转化为长期记忆?触发短期记忆转化为长期记忆的条件是什么,如何结合短期记忆和已有长期记忆生长新的期记忆?长期记忆的淘汰算法是否为先进先出,该算法是否存在问题?针对长期记忆先进先出算法的潜在问题,是否有新的优化思路?长期记忆是否一定要淘汰,能否通过检索方式调取而非丢弃,该思路的可行性如何?长期记忆占用模型上下文窗口会导致输出窗口压缩,该问题的优化方向是什么?五、RAG 与代码助手落地项目中 RAG 的作用是什么,其调用时机是怎样的?该代码生成相关项目整体的技术难点是什么?现阶段各类大模型代码助手平台大规模落地使用的最大难点是什么,解决哪个核心问题才能实现规模化应用?如何解决大模型对大代码量项目理解不足、易出错的问题?代码助手在代码检索时,如何高效找到与问题相关的依赖并提供给大模型?现阶段为何少有框架做代码依赖相关的优化工作,核心原因是什么?若要解决代码依赖难以查找、模型无法理解整体代码库的问题,除构建图谱外还有哪些方法?六、模型训练与技术拓展介绍实习过程中做的模型后训练相关工作,具体实现方式是什么?基于 400 条回答不佳的真实数据,如何将其用于模型训练?仅靠 400 条数据难以训练出靠谱模型,如何将数据集扩展到 1 万条,具体的扩展过程是什么?介绍近期看过的技术相关文章,说明其核心内容和解决的问题。该技术框架与其他同类框架(如 Agent 相关框架)的核心区别是什么?介绍毕业论文的研究方向和核心内容。能否立即到岗实习,实习的可到岗时间是怎样的?
Agent面试会问什么?
点赞 评论 收藏
分享
评论
29
157
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务