大模型Agent算法一面实习-快手
攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.项目拷打
2.MoE模型微调显存计算
3.从数学角度解释为什么attention要除以根号下d_k?如果不开根号行不行
4.多模态大模型的架构一般有哪些
5.PPO有几个模型?
6.GRPO和PPO有什么区别?
7.拷打论文
1.项目拷打
2.MoE模型微调显存计算
3.从数学角度解释为什么attention要除以根号下d_k?如果不开根号行不行
4.多模态大模型的架构一般有哪些
5.PPO有几个模型?
6.GRPO和PPO有什么区别?
7.拷打论文
全部评论
有手撕代码吗大佬
相关推荐
03-30 20:18
东南大学 算法工程师 点赞 评论 收藏
分享
查看7道真题和解析