中国移动研究院,AI并行训练面经

  • LAMB优化器介绍
  • 增大bs,学习率如何调整,模型很大,bs不变呢?
  • 你知道的并行切分策略;
  • ZeRO介绍;
  • pp并行下每张卡的显存、计算量一样嘛,激活值呢?
  • DCU和华为AI加速卡区别、生态、通信库;
  • 千卡项目详细介绍一下;
  • 异步保存方面详细介绍;
  • DDP/DeepSpeed中的一些异步保存机制;
  • T5 和 GPT-2的差异;
  • transformer结构;
  • 残差连接的作用;
  • 3D并行相关;
  • 意向地
全部评论
请问什么时候通知的二面呢
点赞 回复 分享
发布于 2024-11-25 09:08 山东
友友面的是西安吗
点赞 回复 分享
发布于 2024-11-24 11:43 陕西

相关推荐

不愿透露姓名的神秘牛友
08-09 12:00
点赞 评论 收藏
分享
码农索隆:看出来了,好兄弟,确实想进大厂,我劝你要不然试试独角兽或者不错的中厂呢
点赞 评论 收藏
分享
评论
2
5
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务