荣耀大模型算法实习一面分享

发点面经攒攒人品~
1.数据构造策略 评价指标 验证方式
2.用的什么训练框架 怎么优化显存
3.八股:dp ddp tp等区别
4.介绍整体架构和细节
5.rl奖励函数设计方法
6.八股:grpo和ppo的区别

无手撕
全部评论

相关推荐

评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务