今天 09:31 华为_系统工程师

发布于上海

关注

第 17 题：模型量化（Quantization）及 INT8 / INT4

第 17 题：模型量化（Quantization）及 INT8 / INT4

题目

什么是模型量化（Quantization）？INT8 和 INT4 量化的实现方式有何不同？

一、什么是模型量化？

量化指把模型权重（和可选地激活）从 FP32/FP16 映射到低比特整数（如 INT8、INT4），从而减少显存占用、提高推理吞吐与能效，在可接受的精度损失下部署大模型。

二、INT8 量化常见实现

对称量化： $q = \mathrm{round}(x / s)$ ， $s$ 为 scale（通常由 tensor 的 abs max 或分位数定）；反量化 $x \approx s \cdot q$ 。权重量化常用 per-tensor 或 per-channel scale。
激活：可与权重同用 INT8，或保留 FP16 激活、仅权重量化（W8A16）。
校准：用少量数据跑一遍前向，统计激活范围，再定 scale，减少分布偏移带来的误差。
实现：PyTorch torch.quantization、ONNX 量化、TensorRT INT8 等；GPU 上 INT8 矩阵乘有硬件支持。

三、INT4 量化常见实现

更激进：4 bit 仅 16 个桶，对分布敏感，需更精细的 scale/zeropoint 或分组。
分组量化（Group Quantization）：按组（如每 32 或 64 个权重量一组）共享 scale（和可选 zeropoint），组内用 4 bit 表示，平衡精度与压缩比。

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

Ai Agent：面试300问文章被收录于专栏

《AI Agent 300 问》专为备战 AI Agent 相关岗位的求职者打造，适配校招、社招全场景，覆盖算法研发、产品、解决方案等全岗位。专栏汇总 300 道大厂高频面试真题，全维度覆盖提示工程、智能体规划推理、记忆机制、工具调用、多智能体协作、框架落地、行业应用等核心领域，拆解考点底层逻辑，分享一线实战经验，助你一站式通关高薪面试。

全部评论

推荐最新楼层

04-25 15:41

复旦大学 Java

最近在做Agent面试，我发现了很多共性的问题...

大家好，大家好我是@程序员花海，最近两周密集面试了不少Agent方向的候选人，从应届生到有三年、五年经验的同学都有，面下来最大的感受是——简历看着都差不多，一问项目就露馅。说几个反复出现的名场面，可能你也在经历：场景一：简历千篇一律十个候选人，八个项目写的都是基于LangChain搭建智能问答系统这种风格。问技术选型为什么用LangChain而不是直接用官方API，答不上来。问系统如果上线要承载1000人同时用，哪里会先崩，基本没想过。场景二：项目经不起推敲简历上写着实现了RAG检索增强生成，一问细节，比如文档怎么解析的？切片窗口多大、重叠多少？向量库用的什么索引策略？检索召回率怎么评估的？多...

Agent面试会问什么？

点赞评论收藏

分享

04-25 09:12

蚌埠坦克学院嵌入式软件开发

我总会挂在HR面

我发现自己总是卡在 HR 面，问题往往不在技术，而在薪资沟通。我一开始习惯直接报一个偏高的期望，但没有解释为什么值这个价，在 HR 看来就只是“要价高”，自然容易被筛掉。所以后面我会适当说低一点。

你总挂在第__面？

点赞评论收藏

分享

04-22 23:22

西安交通大学算法工程师

求大佬简历指点

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如果春招能重来，我会___ #

2095次浏览 19人参与

# mt对你说过最有启发的一句话 #

114771次浏览 866人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

26594次浏览 462人参与

# 你和你的mentor相处模式是__ #

4031次浏览 27人参与

# 你的mentor是什么样的人？ #

61338次浏览 793人参与

# 你会因为行情，降低找工作标准吗？ #

3048次浏览 25人参与

# 实习第一天，你在干什么 #

2639次浏览 17人参与

# 双非本科的出路是什么？ #

230502次浏览 1655人参与

# 你有哪些缓解焦虑的方法？ #

60685次浏览 914人参与

# 一觉醒来，秋招难度下降一万倍…… #

147658次浏览 786人参与

# 如何排解工作中的焦虑 #

319758次浏览 2732人参与

# 0offer互助地 #

774023次浏览 4761人参与

# 你是怎么和mt相处的？ #

103123次浏览 508人参与

# 你想吐槽公司的哪些规定 #

48954次浏览 245人参与

# 拼多多集团-PDD笔试 #

90680次浏览 602人参与

# 打工人的工作餐日常 #

97109次浏览 559人参与

# 我的成功项目解析 #

532382次浏览 8616人参与

# 25届秋招公司红黑榜 #

341398次浏览 1331人参与

# 0经验如何找实习？ #

89717次浏览 936人参与

# 当下环境，你会继续卷互联网，还是看其他行业机会 #

201691次浏览 1196人参与

# 你总挂在第__面？ #

15107次浏览 164人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务