今天 09:31 华为_系统工程师

发布于上海

关注

第 18 题：Group Query Attention（GQA）与 Multi-Query Att

第 18 题：Group Query Attention（GQA）与 Multi-Query Attention（MQA）

题目

解释 Group Query Attention（GQA）和 Multi-Query Attention（MQA）的设计动机。

一、标准多头注意力中的 K、V

在标准 Multi-Head Attention 中，每个头有独立的 $W^K, W^V$ ，因此每个头有自己的一组 K、V。解码时 KV Cache 要存 num_heads × seq_len × head_dim，显存随头数线性增长。

二、Multi-Query Attention（MQA）

做法：所有头共享同一组 K、V；即只有一份 $W^K, W^V$ ，所有 query 头都对着同一份 K、V 做注意力。
动机：大幅减少 KV Cache 的显存（从 num_heads 份变为 1 份），加快解码、提高吞吐。
代价：所有头看到相同的 key/value 表示，表达能力下降，尤其在需要头间多样性时可能影响效果。

三、Group Query Attention（GQA）

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

Ai Agent：面试300问文章被收录于专栏

《AI Agent 300 问》专为备战 AI Agent 相关岗位的求职者打造，适配校招、社招全场景，覆盖算法研发、产品、解决方案等全岗位。专栏汇总 300 道大厂高频面试真题，全维度覆盖提示工程、智能体规划推理、记忆机制、工具调用、多智能体协作、框架落地、行业应用等核心领域，拆解考点底层逻辑，分享一线实战经验，助你一站式通关高薪面试。

全部评论

推荐最新楼层

04-21 22:01

门头沟学院 Java

至今0offer，无感原因可能有很多吧，当初风风火火下了牛客，看了帖子跟着学习，跟着投递看别人天天有面挺羡慕的，可能学历不够可能能力不足可能运气不好总之很多面试也收不到，有收到的也都挂了厉害的人很多，牛客上的大家都很厉害继续沉淀了，牛客帖子看的有点浮躁了

在平静中度过当下：网上都是找不到工作的发的多，身边拿了大厂of的都不发面筋，有的是比较低调有的是懒得发，某些比较善良的会分享一下经验

春招至今，你收到几个面试...

点赞评论收藏

分享

04-03 15:43

已编辑

门头沟学院 Java

有没有360Web服务端Hr面完的同学？引流

点赞评论收藏

分享

昨天 15:11

已编辑

华东师范大学算法工程师

银四结束，面不动了

暑期实习从2月开始投，面了两个月，流程该挂的都挂完了，腾讯字节一共号称是1.7w个hc，不知道都发给谁了，估计今年秋招要难顶。Timeline米哈游、美团、蚂蚁、微软等公司直接简历挂穿，没进面。携程：3.3 投递、测评3.12 笔试3.18 一面3.25 二面4.13 ai面（hr面）4.14 英语测评4.23 offer（已拒）腾讯：2.6 测评2.28 wxg一面3.5 wxg二面（挂）3.11 teg一面3.21 teg二面（取消）3.31 teg一面4.10 teg二面（挂）4.21 wxg一面4.24 wxg二面（挂）字节：1.28 aml约面（取消）3.17 火山一面（挂）4.8 aml一面（挂）4.20 抖音data一面（挂）阿里：3.23 投递、测评3.28 笔试3.31 淘天一面4.8 钉钉一面4.9 淘天二面4.10 阿里控股一面4.12 钉钉二面（取消）4.15 淘天hr面4.16 淘天offer（已接）4.21 高德一面（取消）4.22 淘宝闪购一面（取消）面试最大的感触是，现在撞上ai转型，一堆老业务急着转向，新业务非常不成熟，研究型的组bar非常高根本进不去，业务侧挂着算法的岗位干的都是工程活，面试却又要问算法，另外agent的落地也远没有那么广，绝大多数还是那套写死的系统调一下llm api或者做做rag，其余少部分真的在搭agent的，基本不能在线上服务用什么很智能的模型，现阶段成本太高，进去大概率就是给垃圾模型从工程方面兜底，除了业务场景的应用和数据经验以外，技术方面很难有什么提升。算法岗做不了基模的还是去搜广推好，之前判断失误了完全没投，秋招不知道还进不进得去。

绿糖滑稽：携程这什么雷霆流程时长

我的求职进度条

点赞评论收藏

分享

04-14 13:06

伊犁职业技术学院前端工程师

四月三号投的 360 到现在没消息

没收到笔试邀请 官网显示如下 是被挂了 还是泡池子了

点赞评论收藏

分享

04-23 10:48

南昌大学 golang

腾讯测评是不是会挂人

测评完就显示结束了完蛋了

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如果春招能重来，我会___ #

3417次浏览 33人参与

# 想做Agent可以做哪些岗位？ #

1530次浏览 20人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

42138次浏览 494人参与

# 这个offer值得去吗？ #

1342次浏览 19人参与

# 面试官拷打AI项目都会问什么？ #

1247次浏览 52人参与

# 除了线上，还能去哪些地方投简历 #

2484次浏览 29人参与

# 你觉得最好用的AI编程工具是_ #

653次浏览 21人参与

# mt对你说过最有启发的一句话 #

114992次浏览 869人参与

# 你会因为行情，降低找工作标准吗？ #

5883次浏览 72人参与

# 如何排解工作中的焦虑 #

323486次浏览 2778人参与

# 工作两年想退休了 #

272099次浏览 2057人参与

# 银行笔面经互助 #

195630次浏览 1323人参与

# 双非本科的出路是什么？ #

230600次浏览 1657人参与

# 你的第一家实习公司是什么档次？ #

73235次浏览 342人参与

# 你和你的mentor相处模式是__ #

5126次浏览 40人参与

# 你的mentor是什么样的人？ #

61470次浏览 794人参与

# 科大讯飞求职进展汇总 #

384131次浏览 3069人参与

# 实习第一天，你在干什么 #

3127次浏览 21人参与

# 哪些公司在招寒假实习？ #

95330次浏览 768人参与

# 秋招投递记录 #

416893次浏览 3281人参与

# 如果公司降薪，你会跳槽吗？ #

160736次浏览 950人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务