算法打工人阿旺

11-10 23:04 中山大学算法工程师发布于山东

关注

大模型训练中的FP16和BF16的区别是什么

✅数值范围
FP16：指数位为5位，数值范围约为±6.1×10−5±6.1×10^{-5}±6.1×10−5到±65504±65504±65504，范围较小，易出现上溢（值超过655046550465504变为无穷大或NaN）或下溢（值小于6e−56e-56e−5被舍为0），导致训练不稳定。
BF16：指数位为8位，数值范围与FP32相同，约为±1.2×10−38±1.2×10^{-38}±1.2×10−38到±3.4×1038±3.4×10^{38}±3.4×1038，范围极大，几乎不会发生溢出，训练稳定性更高。
✅精度
FP16：尾数位为10位，能表示约3-4位小数，精度较高，适合对数值精度要求高的场景。
BF16：尾数位为7位，能表示约2-3位小数，精度略低，但在大模型训练中通常足够，且可通过混合精度训练弥补精度损失。
✅训练稳定性
FP16：需配合损失缩放（Loss Scaling）技术防止梯度下溢，训练流程较复杂。
BF16：无需复杂缩放策略，直接用于计算即可保证稳定性，简化训练流程。
✅硬件支持
FP16：支持广泛，NVIDIA Volta及后续架构GPU均支持。
BF16：较新，NVIDIA Ampere、Hopper架构（如A100、H100）及Google TPU等支持。
📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

全部评论

推荐最新楼层

11-14 10:28

上海得物信息集团有限公司_电商推荐产品经理(准入职员工)

得物内推，得物内推码

服装运营岗位~真实工作体验1.💰待遇 薪资是一天150，包晚饭，有双休，基本不加班，有茶水间小零食无限吃🍪，健身房、员工折扣店，晚上10点后打车免费，过节活动礼包🎁 2.👗工作 服装运营岗，主要技能需要会用Excel、vlookup 工作内容有点像对接商家的客服👩🏻‍💻并且帮助你的直属上级完成部分工作(不同岗位要求不一样。有的是需要会ps之类的） ⌚上班时间： 早10：00晚7：00or早9：30晚6：30 中午12：00-1：30 有的部门是2点 3.🏠租房 异地实习选择的是在附近租房，我是直接在🍠上找的姐妹续租，也可以在租房app上找，入职后有得物内部租房群 4.面试 投...

上海得物信息集团有限公司公司福利 1208人发布

点赞评论收藏

分享

11-15 17:39

门头沟学院测试开发

传音控股-测开-一面

📍面试公司：传音控股🕐面试时间：9.3投递->9.9笔试->10.24一面💻面试岗位：测试开发工程师-软件方向❓面试问题：1.自我介绍2.实习都做了什么，具体工作3.项目来源4.具体介绍AI自动化测试项目，项目聊了很长时间5.写过自动化工具吗？6.python内存管理7.python深拷贝、浅拷贝8.平时有什么爱好9.看什么书10.参加过什么比赛11.是队长吗？中间遇到什么有挑战的问题，如何解决12.生活中有什么困难、压力，如何调节13.开发过什么web工具吗？14.会java吗15.反问🙌面试感想：体验不错，整体面试下来比较流畅，一开始是投的软件测试，后来看官网HR给转推...

查看14道真题和解析

点赞评论收藏

分享

10-13 18:10

已编辑

东南大学 C++

。收拾收拾心情下一家吧————————————————10.12更新上面不知道怎么的，每次在手机上编辑都会只有最后一行才会显示。原本不想写凉经的，太伤感情了，但过了一天想了想，凉经的拿起来好好整理，就像象棋一样，你进步最快的时候不是你赢棋的时候，而是在输棋的时候。那废话不多说，就做个复盘吧。一面：1，经典自我介绍2，项目盘问，没啥好说的，感觉问的不是很多3，八股问的比较奇怪，他会深挖性地问一些，比如，我知道MMU，那你知不知道QMMU（记得是这个，总之就是MMU前面加一个字母）4，知不知道slab内存分配器->这个我清楚5，知不知道排序算法，排序算法一般怎么用6，写一道力扣的，最长回文子串反问：1，工作内容2，工作强度3，关于友商的问题->后面这个问题问HR去了，和中兴有关，数通这个行业和友商相关的不要提，这个行业和别的行业不同，别的行业干同一行的都是竞争关系，数通这个行业的不同企业的关系比较微妙。特别细节的问题我确实不知道，但一面没挂我。接下来是我被挂的二面，先说说我挂在哪里，技术性问题我应该没啥问题，主要是一些解决问题思路上的回答，一方面是这方面我准备的不多，另一方面是这个面试写的是“专业面试二面”，但是感觉问的问题都是一些主管面/综合面才会问的问题，就是不问技术问方法论。我以前形成的思维定式就是专业面会就是会，不会就直说不会，但事实上如果问到方法论性质的问题的话得扯一下皮，不能按照上面这个模式。刚到位置上就看到面试官叹了一口气，有一些不详的预感。我是下午1点45左右面的。1，经典自我介绍2，你是怎么完成这个项目的，分成几个步骤。我大致说了一下。你有没有觉得你的步骤里面缺了一些什么，（这里已经在引导我往他想的那个方向走了），比如你一个人的能力永远是不够的,,,我们平时会有一些组内的会议来沟通我们的所思所想。。。。3，你在项目中遇到的最困难的地方在什么方面4，说一下你知道的TCP/IP协议网络模型中的网络层有关的协议......5，接着4问，你觉得现在的socket有什么样的缺点，有什么样的优化方向？6，中间手撕了一道很简单的快慢指针的问题。大概是在链表的倒数第N个位置插入一个节点。————————————————————————————————————10.13晚更新补充一下一面说的一些奇怪的概念：1，提到了RPC2，提到了fu（第四声）拷贝，我当时说我只知道零拷贝，知道mmap，然后他说mmap是其中的一种方式，然后他问我知不知道DPDK，我说不知道，他说这个是一个高性能的拷贝方式3，MMU这个前面加了一个什么字母我这里没记，别问我了4，后面还提到了LTU，VFIO，孩子真的不会。

走呀走：华子二面可能会有场景题的，是有些开放性的问题了

点赞评论收藏

分享

10-10 14:40

香港城市大学 Java

27届日常实习简历求拷打

准备跑路了，实习太水了，只能写一个黑客松的项目，但感觉也很玩具，文档也没得偷，这个简历现在投后端日常有机会吗

Ccyk_03：补药来大陆虐我们啊

简历中的项目经历要怎么写

点赞评论收藏

分享

11-12 11:35

TP-LINK_通信算法工程师(准入职员工)

歌尔股份内推，歌尔股份内推码

一面主管面全程没超过30分钟，主要问题如下：1.自我介绍2.GPA/排名/校内职务/四六级3.让我英文自我介绍，但我没准备，一时语塞4.自认为学的最好的一门课（会追问具体内容）5.实习项目方案从发现到落地的整个过程概述6.一些常规、简单的专业知识（大概问了5、6个点）7.简历中涉及到的量化数字来源8.沟通能力询问（举例说明）9.对base的看法10.家庭情况等歌尔股份26届歌尔之翼校园招聘全球启动【关于歌尔】歌尔2008年在深交所上市，是全球布局的科技创新型企业，主要从事声光电精密零组件及精密结构件、智能整机、高端装备的研发、制造和销售。连续多年获得中国电子元器件企业百强研发实力榜第一名。【正...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 职场中那些令人叹为观止的八卦 #

7039次浏览 94人参与

# 秋招吐槽大会 #

34763次浏览 318人参与

# 百度秋招 #

43551次浏览 358人参与

# 我的职场社死时刻 #

6681次浏览 83人参与

# 你找工作想离家近 or 离家远？ #

5815次浏览 91人参与

# 月薪多少能在一线城市生存 #

90347次浏览 616人参与

# 腾讯音乐秋招 #

420679次浏览 4729人参与

# 那些年，我收到的‘奇葩’回复 #

3699次浏览 40人参与

# 你秋招最后悔的选择 #

5980次浏览 56人参与

# 哪些公司开始补录了 #

5865次浏览 83人参与

# 秋招你经历过哪些无语的事 #

4256次浏览 54人参与

# XX请雇我工作 #

5294次浏览 65人参与

# 中科曙光工作体验 #

4839次浏览 23人参与

# 如何拒绝/反向PUA #

81967次浏览 367人参与

# 你父母给过你哪些不靠谱的职场建议？ #

6419次浏览 89人参与

# 职场中对你有帮助的书 #

22942次浏览 213人参与

# 假如你的老板掉河里，你的工作能为他做什么 #

39355次浏览 401人参与

# 虾皮开奖 #

50146次浏览 243人参与

# 京东工作体验 #

21556次浏览 121人参与

# 你觉得机械有必要实习吗 #

66320次浏览 481人参与

# 你最满意的offer薪资是哪家公司？ #

51753次浏览 261人参与

# 交通银行工作体验 #

20564次浏览 68人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务