当模型规模过大无法在单个GPU中完整加载时
当训练数据集过大需要分片处理时
当优化器计算资源不足时减少通信延迟
当推理过程需要实时响应时简化部署
这道题你会答吗?花几分钟告诉大家答案吧!
扫描二维码,关注牛客网
下载牛客APP,随时随地刷题