淘天Agent一面

一、手撕和八股
1. 手撕岛屿数量,秒了
2. Transformer 中 Attention 的本质是什么?你能从数学角度简要解释一下吗?
3. 在 Agent 多轮对话任务中,你觉得 Attention 的局限性体现在哪些方面?
4. 简要介绍一下 SFT的核心流程,以及数据集的构建策略,SFT之后常见的 Post-Training 还有哪些?它们之间的目的有何区别?
5.  什么是 RAG,它是怎么提升生成质量的?与传统检索 + 模型生成的流程有何不同?你是如何评估一个RAG系统是否work的?
6. PPO 和 DPO 在大模型对齐中的主要区别是什么?DPO 训练通常有哪些注意事项?用过GRPO么?

二、、业务场景相关相关
假如一个 Agent 推理链路包含 3 个工具 + 高频请求,系统整体延迟较高,你会如何优化?
全部评论
这已经是应用算法了吧
点赞 回复 分享
发布于 10-25 18:21 上海

相关推荐

11-15 11:10
门头沟学院 Java
1.实习介绍,能实习的时间2.为什么选择做这个项目3.讲一下第一个项目的难点和亮点4.本地缓存怎么做的?数据要更新怎么办?5.Redis 是如何支持这种会话记忆的?存储结构是什么样子?会话的历史过期时间又是怎么设置的?6.用户反馈那个智能客户回复不准确,你会从哪几个维度去排查优化呢?7.对 AI这一块感觉咋样?你是怎么去学习的?8.班上同学实习出来实习的多吗?最近面试多吗?9.作为一个 RPC 框架它有哪些核心的模块?10.令牌桶的生成速率和桶容量是如何配置?11.项目限流的维度有哪些维度?12.设计的这个框架,在高并发场景下,你认为的性能瓶颈可能在于哪呀?如果说是要优化的话,你会怎么去优化?13.有去了解一些主流的 RPC框架吗?14.如果服务端提供的某个方法执行时间特别长,会对客户端造成什么影响?资源耗尽指的是什么资源?15.继续说一下怎么处理上面这种情况?16.降级是怎么降级的?17.Mysql常用的存储引擎18.Innodb 这种存储引擎它是怎么来帮助加速读写的?19.Innodb怎么去做这种缓存的?怎么更新的呢?20.Java 线程那个生命周期是什么样的?它各状态之间是怎么流转的?21.什么情况下会出现死锁?死锁会带来什么影响?22.怎么去排查死锁呢?怎么定位到是哪个线程出现的问题?23.SQL:Mid 力扣614 二级关注者24.算法题:Mid 力扣 122.买卖股票的最佳时机25.反问
查看24道真题和解析
点赞 评论 收藏
分享
评论
1
19
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务