今天 09:29 华为_系统工程师

发布于上海

关注

第 13 题：混合精度训练（Mixed Precision Training）

第 13 题：混合精度训练（Mixed Precision Training）

题目

解释混合精度训练（Mixed Precision Training）的原理和优势。

一、在做什么？

混合精度训练指在训练中部分使用 FP16（半精度），部分保留 FP32（全精度），在保证数值稳定性的前提下，用 FP16 加速计算、节省显存和带宽。

典型做法：前向和大部分反向用 FP16，权重和优化器状态用 FP32 维护，梯度在 FP32 下累加/更新后再转回 FP16 参与下一轮；对易溢出层（如 softmax、LayerNorm）保留 FP32 或做 loss scaling。

二、原理要点

FP16 计算：矩阵乘、卷积等在 Tensor Core 上以 FP16 执行，算力与带宽优于 FP32，从而加速、省显存。
FP32 主权重与优化器：权重副本和 Adam 的 momentum/variance 用 FP32 存，避免长期更新中的舍入误差累积。
Los：对 loss 乘一个常数（如 1024）再反向，使梯度放大到 FP16 可表示范围，减少下溢；梯度回传到 FP32 后再除回 scale，用于更新。

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

Ai Agent：面试300问文章被收录于专栏

《AI Agent 300 问》专为备战 AI Agent 相关岗位的求职者打造，适配校招、社招全场景，覆盖算法研发、产品、解决方案等全岗位。专栏汇总 300 道大厂高频面试真题，全维度覆盖提示工程、智能体规划推理、记忆机制、工具调用、多智能体协作、框架落地、行业应用等核心领域，拆解考点底层逻辑，分享一线实战经验，助你一站式通关高薪面试。

全部评论

推荐最新楼层

04-22 09:11

门头沟学院 Java

零面试邀约别躺平！春招空窗期要坚持

刷到太多牛友吐槽：投了上百份简历，零面试邀约，每天在焦虑里摆烂，不知道该做什么，眼睁睁看着春招快结束了，越来越慌。我太懂这种感受了。去年秋招，我投了80多份简历，只拿到2个面试邀约，全挂了。后来春招，我靠着空窗期的精准规划，投了60份简历，拿到了12个面试邀约，最后拿下了字节、阿里、美团3个offer。今天就把我亲测有效的方法全部分享出来，零面试邀约不可怕，可怕的是你在焦虑里躺平，白白浪费了弯道超车的机会。这6件事，每天花4小时就能做完，坚持1周，就能看到效果，面试邀约直接找上门。先搞懂：为什么你投了几百份简历，却零面试邀约？在说怎么做之前，先帮大家找到根源，90%的零面试，都是这3个原因导致...

没有面试的日子里，你在做...

点赞评论收藏

分享

04-22 16:27

天津理工大学硬件测试

想求职AI Agent？这个教程，带你从零亲手“造”一个

这个项目就是一份绝佳的“AI Agent开发实战教科书”。它完美地解决了初学者“不知从何下手”的痛点。https://github.com/czl9707/build-your-own-openclaw📊 项目概况速览Build Your Own OpenClaw 是一个手把手教你从零开始构建一个AI Agent（智能体）的教程项目。它通过18个循序渐进的步骤，带你一步步实现一个具备聊天、使用工具、记忆、多平台交互等功能的完整Agent。分析维度具体情况项目价值项目定位顶级教学项目，模仿“Build Your Own X”系列学习路径极其清晰，目标感强技术热门度较高（1.3k Stars），...

哪些AI项目值得做？

点赞评论收藏

分享

03-27 13:42

北京交通大学算法工程师

遇到一个民科乐子，最难绷的一集。

GoldenPota...：能做这个方向的人200一天是吧🤗

找AI工作可以去哪些公司...

点赞评论收藏

分享

04-21 20:49

字节跳动_全栈开发(实习员工)

北京合租的三千块钱一个月的房租长这样

好贵啊海淀这边

wu970：标准北漂配置，怎么看着装修风格有点像自如的😭

点赞评论收藏

分享

04-21 14:55

西安电子科技大学 Java

面了3家大厂的前端岗，我发现今年上岸的关键变了

上周我面了字节、阿里、美团的前端岗，都过了。血泪经验总结成一句话：今年面试，懂AI的比懂React的更抢手。字节那轮面试，面试官问了我一个问题："你平时怎么用AI辅助前端开发？"我当时心想，终于到我擅长的领域了。因为我最近一直在研究Cursor做React组件开发，用AI生成TypeScript类型定义，还做过一个基于AI的组件库文档生成工具。结果面试官追问："你用AI生成的组件有做过性能优化吗？怎么保证AI生成的代码没有XSS漏洞？"这两个问题直接把我问住了。AI生成代码是快，但它不懂业务场景，不懂安全边界，更不懂性能调优。这些"后处理&qu...

你怎么看待AI面试

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如果春招能重来，我会___ #

2095次浏览 19人参与

# mt对你说过最有启发的一句话 #

114771次浏览 866人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

26594次浏览 462人参与

# 你和你的mentor相处模式是__ #

4031次浏览 27人参与

# 你的mentor是什么样的人？ #

61338次浏览 793人参与

# 你会因为行情，降低找工作标准吗？ #

3048次浏览 25人参与

# 实习第一天，你在干什么 #

2639次浏览 17人参与

# 双非本科的出路是什么？ #

230502次浏览 1655人参与

# 你有哪些缓解焦虑的方法？ #

60685次浏览 914人参与

# 一觉醒来，秋招难度下降一万倍…… #

147658次浏览 786人参与

# 如何排解工作中的焦虑 #

319758次浏览 2732人参与

# 0offer互助地 #

774023次浏览 4761人参与

# 你是怎么和mt相处的？ #

103123次浏览 508人参与

# 你想吐槽公司的哪些规定 #

48954次浏览 245人参与

# 拼多多集团-PDD笔试 #

90680次浏览 602人参与

# 打工人的工作餐日常 #

97109次浏览 559人参与

# 我的成功项目解析 #

532382次浏览 8616人参与

# 25届秋招公司红黑榜 #

341398次浏览 1331人参与

# 0经验如何找实习？ #

89717次浏览 936人参与

# 当下环境，你会继续卷互联网，还是看其他行业机会 #

201691次浏览 1196人参与

# 你总挂在第__面？ #

15107次浏览 164人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务