秋招字节Agent算法二面面经
一、少量八股
1.介绍下self-attention,计算其时间复杂度。
2.为什么要用multi-head attention?
3.kv cache是什么?它为什么能极大地提升推理速度?
4.PPO的clip机制?在线强化学习和离线强化学习有什么区别?RLHF是哪一种?
5.为什么要用reference model?为了解决什么问题?
二、项目深挖
1.如何让多个agent协同工作的?举个具体的协同机制例子。
2.如果一个agent误判导致策略冲突,如何处理?
3.你们有没有用到类似AutoGen或LangChain的框架?为什么选这个框架?
4.你是怎么设计agent的记忆系统?
5.长期记忆如何存储?如果历史记录量非常大,怎么优化查询效率?
6.有没有做记忆衰退,避免旧数据干扰新任务?
7.你们这种模块堆叠的架构是怎么设计视觉问答模块和动作模块的协同逻辑的?
8.你简历里的人机协作流程,具体是什么意思?怎么设计人工干预与agent自动处理的平衡?
9.human feedback是怎么被agent消化吸收的?有没有用rl进行策略更新?
三、业务理解
1.有没有做过模型压缩?比如在车载端或低端设备上的推理加速?
2.如果量化后理解能力下降怎么办?怎么做精度补偿?
3.你怎么处理响应速度与推理精度之间的tradeoff?是先召回再精排,还是单次生成?
4.如果要做电商agent,你会选择哪些模态的信息作为输入?比如文本评论、图像、视频、购买记录?
5.有没有做过A/B测试?
1.介绍下self-attention,计算其时间复杂度。
2.为什么要用multi-head attention?
3.kv cache是什么?它为什么能极大地提升推理速度?
4.PPO的clip机制?在线强化学习和离线强化学习有什么区别?RLHF是哪一种?
5.为什么要用reference model?为了解决什么问题?
二、项目深挖
1.如何让多个agent协同工作的?举个具体的协同机制例子。
2.如果一个agent误判导致策略冲突,如何处理?
3.你们有没有用到类似AutoGen或LangChain的框架?为什么选这个框架?
4.你是怎么设计agent的记忆系统?
5.长期记忆如何存储?如果历史记录量非常大,怎么优化查询效率?
6.有没有做记忆衰退,避免旧数据干扰新任务?
7.你们这种模块堆叠的架构是怎么设计视觉问答模块和动作模块的协同逻辑的?
8.你简历里的人机协作流程,具体是什么意思?怎么设计人工干预与agent自动处理的平衡?
9.human feedback是怎么被agent消化吸收的?有没有用rl进行策略更新?
三、业务理解
1.有没有做过模型压缩?比如在车载端或低端设备上的推理加速?
2.如果量化后理解能力下降怎么办?怎么做精度补偿?
3.你怎么处理响应速度与推理精度之间的tradeoff?是先召回再精排,还是单次生成?
4.如果要做电商agent,你会选择哪些模态的信息作为输入?比如文本评论、图像、视频、购买记录?
5.有没有做过A/B测试?
全部评论
相关推荐
点赞 评论 收藏
分享
书海为家:#人脑vsAI#
尽管深度学习的最初灵感来源于人类的大脑,但二者的运作方式截然不同:深度学习所需要的数据量远比人脑所需要的多得多。可是一旦经过大数据训练,它在相同领域的表现将远远超过人类(尤其是在数字的量化学习,例如挑选某人最可能购买的产品,或从100万张脸中挑选最匹配的一张)——相对来说,人类在同一时间内只能把注意力放在少数几件事情上面,而深度学习算法却可以同时处理海量信息,并且发现在大量数据背后的模糊特征之间的关联,这些模糊特征不仅复杂而且微妙,人类往往无法理解,甚至可能不会注意到。
虽然深度学习拥有人类所缺乏的并行处理海量数据的“绝技”,但不具备人类在面对决策时独一无二的汲取过去的经验、使用抽象概念和常识的能力。
与人类相比,深度学习想要充分发挥作用,离不开海量的相关数据、单一领域的应用场景以及明确的目标函数,这三项缺一不可,如果缺少其中任何一项,深度学习将无用武之地。 点赞 评论 收藏
分享
查看14道真题和解析