大模型Agent算法一面实习-快手

攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.项目拷打
2.MoE模型微调显存计算
3.从数学角度解释为什么attention要除以根号下d_k?如果不开根号行不行
4.多模态大模型的架构一般有哪些
5.PPO有几个模型?
6.GRPO和PPO有什么区别?
7.拷打论文
全部评论
有手撕代码吗大佬
点赞 回复 分享
发布于 03-30 12:58 安徽

相关推荐

评论
点赞
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务