首页 > 试题广场 >

梯度检查点 (Gradient Checkpointing)

[不定项选择题]

梯度检查点 (Gradient Checkpointing) 与 ZeRO-Offload 的主要区别体现在

两者可叠加以进一步扩大可训练模型规模

前者通过丢弃中间激活再正向重算，减少显存；后者将部分参数 / 优化器状态搬到 CPU 或 NVMe

```
两者都会增加前向推理时延
```

前者仅影响前向计算图；后者改动优化器加载激活值的方式（例如 CPU）

查看正确选项

这道题你会答吗？花几分钟告诉大家答案吧！

提交观点

问题信息

来自：2025年秋招-华为-...

难度：

0条回答 5收藏 19浏览

热门推荐

相关试题

在机器学习中，以下哪些方法可以用于...

评论(0) 来自2025年秋招-华为-1...
在反向传播过程中，如果发现某个特定...

评论(0) 来自2025年秋招-华为-1...
设 A, P 均为 3 阶矩阵，P...

评论(0) 来自2025年秋招-华为-1...
某种电子设备的寿命…指数分布 f(...

评论(0) 来自2025年秋招-华为-1...
A 为 2 阶矩阵，B 为 2 阶...

评论(0) 来自2025年秋招-华为-1...

扫描二维码，关注牛客网
意见反馈
下载牛客APP，随时随地刷题

扫一扫，把题目装进口袋

求职之前，先上牛客: 扫描二维码，进入QQ群



扫描二维码，关注牛客公众号

公司地址：北京市朝阳区北苑路北美国际商务中心K1座一层-北京牛客科技有限公司
联系方式：010-60728802 投诉举报电话：010-57596212（朝阳人力社保局）
牛客科技© All rights reserved admin@nowcoder.com
京ICP备14055008号-4 增值电信业务经营许可证营业执照人力资源服务许可证
京公网安备 11010502036488号