字节大模型Agent算法二面
项目深挖
1.训练时显存占用高的瓶颈在哪?做了哪些显存优化?
2.如果重新做一次,你会在哪些环节提前做ablation?
3.在多Agent系统中,如何保证异步任务执行的稳定性和结果一致性?
4.如果Agent推理API需要低延迟响应,你会从哪些方面做系统级优化?
5.你做Prompt优化时,是如何判断优化后的Prompt在Agent推理链路中性能提升的?用什么指标来衡量?
6.你提到用DeepSpeed做SFT训练,请讲一下DeepSpeedZeROStage1-3的区别,以及什么时候用FSDP会更好?
7.在你的问答Agent项目中,数据集构造的自动化流程是怎么实现的?
8.你是如何利用多Agent协同来提高推理正确率的?调度策略如何实现?
9.介绍一下RAG的整体流程。在Agent落地场景中,RAG会遇到哪些延迟和正确率问题?你怎么优化召回链路?
八股
1.AdamW与Adam在权重衰减上的实现差异?
2.梯度累积等价于batch扩大的严格条件是什么?
3.PPO的核心目标函数是什么?每个符号的物理意义?
4.相比PPO,GRPO的"Group"体现在哪一步?
5.KL散度在RLHF阶段出现的位置、作用以及过大/过小分别会导致什么现象?
6.Multi-Agent场景里,Reflection模块与Memory模块的输入输出各自是什么?它们如何解耦又能互相增强?
1.训练时显存占用高的瓶颈在哪?做了哪些显存优化?
2.如果重新做一次,你会在哪些环节提前做ablation?
3.在多Agent系统中,如何保证异步任务执行的稳定性和结果一致性?
4.如果Agent推理API需要低延迟响应,你会从哪些方面做系统级优化?
5.你做Prompt优化时,是如何判断优化后的Prompt在Agent推理链路中性能提升的?用什么指标来衡量?
6.你提到用DeepSpeed做SFT训练,请讲一下DeepSpeedZeROStage1-3的区别,以及什么时候用FSDP会更好?
7.在你的问答Agent项目中,数据集构造的自动化流程是怎么实现的?
8.你是如何利用多Agent协同来提高推理正确率的?调度策略如何实现?
9.介绍一下RAG的整体流程。在Agent落地场景中,RAG会遇到哪些延迟和正确率问题?你怎么优化召回链路?
八股
1.AdamW与Adam在权重衰减上的实现差异?
2.梯度累积等价于batch扩大的严格条件是什么?
3.PPO的核心目标函数是什么?每个符号的物理意义?
4.相比PPO,GRPO的"Group"体现在哪一步?
5.KL散度在RLHF阶段出现的位置、作用以及过大/过小分别会导致什么现象?
6.Multi-Agent场景里,Reflection模块与Memory模块的输入输出各自是什么?它们如何解耦又能互相增强?
全部评论
感谢分享,祝好运
相关推荐
01-10 19:44
上海大学 Java
牛客57020934...:现在大厂就很迷,感觉要么就是算法+agent,要么就是开发+agent。。还是招和原来一样的岗位,只是都要求赋能agent了 点赞 评论 收藏
分享
查看11道真题和解析