06-22 15:32 已编辑杭州超限数动科技有限公司_大模型数据安全部_研发专家

发布于浙江

关注

大模型长文本救星！PagedAttention 如何让 10 万字计算量暴跌 300 倍？

咱们今天聊点大模型里的“长文本加速神器”——PagedAttention（分页注意力）。它就像你读一本超厚的书时，发明的“快速翻页找重点”技巧，专门解决大模型处理长文本时的“卡壳”问题。

一、PagedAttention的背景：大模型的“长文本焦虑”

你有没有试过，用大模型（比如GPT-3、LLaMA）处理一段几千字的文章？比如让你总结一本小说的剧情，或者分析一篇学术论文。这时候，模型可能会“卡成PPT”——半天出不来结果，甚至直接“罢工”。

问题根源：传统注意力机制（比如Transformer的自注意力）在处理长文本时，计算量会爆炸式增长。具体来说，自注意力需要计算每个词和其他所有词的“关联度”（注意力权重），计算量是序列长度的平方（O(n²)）。比如，处理1万字的文本，计算量是1亿次；处理10万字的文本，直接变成100亿次——这相当于让一个人1秒钟数100亿颗星星，根本不可能！

二、PagedAttention的原理：长文本的“分组速算”

PagedAttention的核心思路是：把长文本“切块”（分页），只计算相邻块之间的关联度，而不是和所有词“互相检查”。

举个生活化的例子：

假设你要读一本1000页的书，传统注意力像“全班同学互相检查作业”——每个同学（词）都要和全班其他同学（词）比较，找出“谁的内容和自己最相关”。这显然太费时间！

而PagedAttention像“分组合作学习”：

把书切成多个“页块”（比如每100页为一页）；
每个页块只和自己所在的“小组”（前后几个页块）比较，找出“小组内最相关的部分”；
最后把各小组的结果“拼”起来，得到整体的注意力权重。

关键操作：

分页：把长序列（比如10000个词）分成多个“页”（Page），每个页包含固定数量的词（比如100个词）。
局部计算：每个页内的词只和“相邻页”（前一页、当前页、后一页）的词计算注意力，忽略其他页的词。
动态调整：如果某个页的内容特别重要（比如包含关键词），可以扩大它的“影响范围”（比如和前后两页比较），确保不漏掉关键信息。

三、PagedAttention的性能优势：快、省、强

PagedAttention的“分页速算”到底有多厉害？用三个词总结：快、省、强！

1. 快：计算量从“天文数字”变“小目标”

传统注意力的计算量是O(n²)（n是序列长度），而PagedAttention通过分页把计算量降到O(n√n)（n乘以根号n）。比如，处理10万字的文本：

传统注意力：需要100亿次计算（10万²）；
PagedAttention：只需要约10万×300≈3000万次计算（根号10万≈300）——计算量直接降了300倍！

实际效果：模型处理长文本的速度能提升几十倍，训练和推理时间大幅缩短。

2. 省：内存占用“断崖式下降”

传统注意力需要存储所有词的注意力权重（一个n×n的矩阵），内存占用是O(n²)。而PagedAttention只存储每个页内的注意力权重（每个页是k×k的矩阵，k是页的大小），内存占用降到O(nk)（n是总词数，k是页大小）。

例子：处理10万字的文本，页大小设为100：

传统注意力：需要存储100亿个权重（10万×10万）；
PagedAttention：只需要存储1000个页×100×100=1亿个权重——内存占用直接降了100倍！

实际效果：模型能处理更长的文本（比如从1万字扩展到10万字），甚至支持“超长上下文”（比如100万字的故事）。

3. 强：长文本理解“不掉链子”

PagedAttention不仅快和省，还能精准抓住长文本中的关键信息。通过分页和局部计算，模型能更聚焦于“当前上下文”，避免被无关的“远距离词”干扰。

例子：

你让模型总结一篇10万字的小说，传统注意力可能被开头或结尾的无关情节“带偏”；而PagedAttention会重点关注“当前页”附近的情节（比如主角最近的行动），总结更准确！

四、PagedAttention的“小秘密”：为什么能这么牛？

PagedAttention的底层逻辑其实很简单：人类的注意力本来就是“局部的”——我们读书时，很少会突然跳到第100页去找线索，而是更关注当前页和前后几页的内容。PagedAttention模仿了人类的这种“局部注意力”习惯，让模型更“聪明”地分配计算资源。

总结：PagedAttention是大模型的“长文本加速器”

简单说，PagedAttention就是大模型处理长文本的“快速翻页找重点”技巧。它通过分页、局部计算，把传统注意力的“天文计算量”降到“小目标”，让大模型能轻松处理几万、几十万字的文本，甚至在聊天、翻译、摘要等场景中“又快又准”。

下次你用大模型处理长文档时，它要是突然“秒回”高质量结果——说不定背后就有PagedAttention在偷偷“高效速算”呢!

----------------------------------内容到这里就结束啦啦-------------------------------------------------------

更多大模型入门文章,欢迎关注订阅专栏<<大模型小白拆解站>>

要是觉得“文章有用”，顺手点个赞？

就当给我这“码字打工人”充个电～

下次更努力挖好料，绝不鸽！✨

（点赞按钮在这儿👇）

大模型小白拆解站文章被收录于专栏

想和大模型零障碍对话？这里是你的入门急救站！从大模型到底是啥到训练时都在干啥，用大白话拆解技术原理；从参数是个啥到微调怎么玩，用生活案例讲透核心概念。拒绝枯燥公式，只有能听懂的干货和冷到爆的梗;帮你从大模型小白变身入门小能手，轻松get前沿AI知识！

全部评论

推荐最新楼层

10-16 10:14

库洛游戏_HR(准入职员工)

库洛游戏内推，库洛游戏内推码

笔面游戏产品运营：1. 请先做个简单的自我介绍？重点介绍一下自己的相关经历，尤其是与游戏相关的经历。📝2. 你最近5年的职业规划是什么，能否详细的谈一下，如何与该岗位发展契合？🚀3. 你应聘这个岗位的优势是什么？劣势是什么？（各说三点）结合应届生身份谈谈。💪4. 为什么选择应聘我们公司？从公司特色和自身对游戏运营的向往讲讲。❤️5. 能不能谈谈对我们公司产品和所在行业的了解？着重说说鸣潮相关。🎯6. 你期望的薪酬是多少? 结合应届生身份和岗位要求谈谈你的期望依据。💰7. 大学期间最喜欢哪一门专业课程？为什么喜欢这一门？对该岗位有何助力？📚8. 用三个词，总结一下这几年自己大学的经历...

点赞评论收藏

分享

10-17 15:17

蚌埠坦克学院嵌入式软件开发

嵌入式实习在精不在多

在大学或研究生阶段，许多学习嵌入式的同学都会面临一个共同的疑问：“我要不要多找几个实习单位积累经验？”有人认为多实习几家企业能“开眼界、积人脉”，有人则主张选择一个有深度的实习机会，把技术真正沉下去。但对于嵌入式开发而言，答案其实很明确——实习贵在精，不在多。全网最全面的嵌入式八股文专栏：https://www.nowcoder.com/creation/manager/columnDetail/mPZ4kk一、嵌入式实习的核心价值是什么嵌入式岗位的核心是“动手能力 + 系统理解力”。这不是短时间能凭借“见得多”就掌握的，而是要在一个完整项目的开发周期中，真正经历：硬件电路调试与原理理解；驱动...

实习在多还是在精

点赞评论收藏

分享

09-09 16:12

已编辑

成都理工大学 Java

学Java的这辈子有了

future0210：学java就是好啊，啥都能转

点赞评论收藏

分享

09-18 16:00

哈尔滨学院教师

这个情况是不是挂了啊，帮我看看呗，各位大神

Aurora23：属于挂一半，暂时进池子了，隔一段时间没有其他组捞的话就彻底结束了

点赞评论收藏

分享

昨天 22:38

已编辑

门头沟学院 Java

别瞎纠结 offer去不去！

判断offer值不值得接，我觉得不用搞复杂理论，乱七八糟的，就从“钱够不够花”“活有没有价值”“未来有奔头没”“生活能不能兼顾”这几个实在方向研究一下，把这些点捋清楚，看你最看重哪个就把哪个放在前面，优先级高一些，基本就不会选错。1.看薪资：不只看月薪，得算“实际能落袋多少”实际到手多少钱薪资肯定要往高了争取，但别被表面数字忽悠，得把“明的暗的”都算明白。算“全年总收入”：除了基本工资，一定要问清年终奖（是“保底1个月”还是“正常能拿3-4个月”）、有没有绩效奖、签字费（入职给一笔钱，但可能要求干满1-2年）、可能有股票（大厂常用，得问清楚几年兑现完）。比如A厂月薪22k，年终奖1个月；B厂月...

从哪些方向判断这个off...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你的mentor是什么样的人？ #

7508次浏览 64人参与

# 投递几十家公司，到现在0offer，大家都一样吗 #

266482次浏览 1859人参与

# 平安产险科技校招 #

2512次浏览 0人参与

# 怎么给家人解释你的工作？ #

3867次浏览 41人参与

# 26届秋招公司红黑榜 #

18643次浏览 65人参与

# 帮我看看，领导说这话什么意思？ #

9517次浏览 49人参与

# 智慧芽求职进展汇总 #

30187次浏览 127人参与

# 你觉得面试是靠实力还是靠运气 #

23537次浏览 279人参与

# 校招泡的最久的公司是哪家？ #

7180次浏览 42人参与

# 牛客树洞，我想对你说 #

2389次浏览 49人参与

# 求职低谷期你是怎么度过的 #

7379次浏览 144人参与

# 实习必须要去大厂吗？ #

148092次浏览 1550人参与

# 度小满求职进展汇总 #

11014次浏览 58人参与

# 你觉得mentor喜欢什么样的实习生 #

13171次浏览 346人参与

# 你觉得多少薪资算SSP？ #

113011次浏览 416人参与

# 没有家庭托举的我是怎么找工作的 #

15476次浏览 187人参与

# 你遇到过哪些神仙同事 #

117483次浏览 750人参与

# 同bg的你秋招战况如何？ #

159085次浏览 927人参与

# 从哪些方向判断这个offer值不值得去？ #

8336次浏览 104人参与

# 职场新人体验 #

100978次浏览 666人参与

# 职场破防瞬间 #

343548次浏览 2819人参与

# 面试紧张时你会有什么表现？ #

2229次浏览 23人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务