快手 暑期实习 Agent算法一面凉经

攒人品中,祝大家都能拿到满意的Offer!
1.项目拷打
2. 把上一段实习经历展开讲一下,项目背景、遇到的问题、解决方法和效果提升
3. 实习项目一开始效果不好,主要体现在哪些方面?
4. 是否涉及工具调用,还是只是提示词构成的工作流?
5. 模型怎么去调用工具的?
6. 工具是谁做的怎么做的?
7. 模型发送调用请求是通过什么形式,怎么提取信息?
8. 项目中RAG的主要目的是什么?
9. RAG知识库内容为什么不通过SFT直接注入模型?
10. 数据来源如何清洗格式如何?
11. 意图识别的各意图能举几个例子吗?
12. 长时记忆和短时记忆的实现逻辑,以及这么做的原因是什么?
13. 项目中遇到的比较难的问题和解决思路是什么?
14. LoRA的原理和计算过程
15. LoRA具体怎么节省显存、减少参数量?
16. 为什么用RMS Norm而不用Layer Norm?
17. GRPO的原理
18. PPO最少需要几个模型?
19. GRPO最少需要几个模型,是哪两个?
20. 手撕 编辑距离
全部评论
考虑多多吗,核心部门,实习hc很多,转正概率多,有兴趣点我主页了解详情
点赞 回复 分享
发布于 03-16 20:41 上海

相关推荐

不愿透露姓名的神秘牛友
昨天 10:38
实力求职者:真的绷不住了,第一张霸总人设,第二张求生欲拉满
点赞 评论 收藏
分享
发一下问题给大家参考,攒攒人品!1*Agent与Workflow的区别是什么?在实际业务中,你会根据什么标准选择对应的方案2*设计一个企业级Agent架构,如何实现 BFF、Tool Server 与 Worker 的多组件拆分3*在企业级Agent中,怎么实现安全与隔离?权限管理、审计与日志追踪具体的落地方案是什么?4*说一下什么是MCP?它在Agent生态中解决了什么痛点?5*MCP 有哪些具体的分类?Transport 层是怎么工作的?如何开发一个 MCP Server?6*谈谈你对 Claude Code、Manus 这类 Agent 产品的理解,它们的架构逻辑与传统 Chat Agent 有什么差别?它工程部分的能力是怎么实现的?7*如何实现 Claude 的 Agent Research 方法论?Deepsearch 场景下需要配备哪些工具?基础设施与安全挑战在哪里?8*在多轮对话中,分别实现 Short-term memory、Long-term memory 与 Task memory怎么做?9*上下文机制的完整实现流程是怎样的?说一下它的写入策略、读取策略以及 Rerank 的做法是怎么样的。10*当上下文超过 Token 限制时,组合使用 Rolling Summary、State Extraction 与 RAG 这三段式策略?11*说一下Prefix Caching 和 KV Cache 的原理。为什么缓存的是 K 和 V 而不是 Q?不再计算前缀具体节省了哪部分算力?12*引入 Prefix Caching 后,Attention 的计算复杂度是怎么下降的?13*Few-shot在Agent评测中是为了提升能力还是降低方差?在评测Pipeline的哪个阶段注入?如何防止过拟合?14*对比一下Transformer中Self-attention与FFN的作用差异。15*为什么 Prefix Caching 只能优化 Attention 部分,而无法优化 FFN 部分?16*从 Softmax 的数学角度解释,为什么在计算过程中加上负无穷就能让注意力权重变为 0?17*什么是掩码?你分别说一下Causal Mask与 Padding Mask 的作用是什么。
查看17道真题和解析
点赞 评论 收藏
分享
评论
点赞
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务