今天 09:31 华为_系统工程师

发布于上海

关注

第 18 题：Group Query Attention（GQA）与 Multi-Query Att

第 18 题：Group Query Attention（GQA）与 Multi-Query Attention（MQA）

题目

解释 Group Query Attention（GQA）和 Multi-Query Attention（MQA）的设计动机。

一、标准多头注意力中的 K、V

在标准 Multi-Head Attention 中，每个头有独立的 $W^K, W^V$ ，因此每个头有自己的一组 K、V。解码时 KV Cache 要存 num_heads × seq_len × head_dim，显存随头数线性增长。

二、Multi-Query Attention（MQA）

做法：所有头共享同一组 K、V；即只有一份 $W^K, W^V$ ，所有 query 头都对着同一份 K、V 做注意力。
动机：大幅减少 KV Cache 的显存（从 num_heads 份变为 1 份），加快解码、提高吞吐。
代价：所有头看到相同的 key/value 表示，表达能力下降，尤其在需要头间多样性时可能影响效果。

三、Group Query Attention（GQA）

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

Ai Agent：面试300问文章被收录于专栏

《AI Agent 300 问》专为备战 AI Agent 相关岗位的求职者打造，适配校招、社招全场景，覆盖算法研发、产品、解决方案等全岗位。专栏汇总 300 道大厂高频面试真题，全维度覆盖提示工程、智能体规划推理、记忆机制、工具调用、多智能体协作、框架落地、行业应用等核心领域，拆解考点底层逻辑，分享一线实战经验，助你一站式通关高薪面试。

全部评论

推荐最新楼层

04-21 22:01

门头沟学院 Java

至今0offer，无感原因可能有很多吧，当初风风火火下了牛客，看了帖子跟着学习，跟着投递看别人天天有面挺羡慕的，可能学历不够可能能力不足可能运气不好总之很多面试也收不到，有收到的也都挂了厉害的人很多，牛客上的大家都很厉害继续沉淀了，牛客帖子看的有点浮躁了

在平静中度过当下：网上都是找不到工作的发的多，身边拿了大厂of的都不发面筋，有的是比较低调有的是懒得发，某些比较善良的会分享一下经验

春招至今，你收到几个面试...

点赞评论收藏

分享

昨天 15:11

已编辑

华东师范大学算法工程师

银四结束，面不动了

暑期实习从2月开始投，面了两个月，流程该挂的都挂完了，腾讯字节一共号称是1.7w个hc，不知道都发给谁了，估计今年秋招要难顶。Timeline米哈游、美团、蚂蚁、微软等公司直接简历挂穿，没进面。携程：3.3 投递、测评3.12 笔试3.18 一面3.25 二面4.13 ai面（hr面）4.14 英语测评4.23 offer（已拒）腾讯：2.6 测评2.28 wxg一面3.5 wxg二面（挂）3.11 teg一面3.21 teg二面（取消）3.31 teg一面4.10 teg二面（挂）4.21 wxg一面4.24 wxg二面（挂）字节：1.28 aml约面（取消）3.17 火山一面（挂）4.8 aml一面（挂）4.20 抖音data一面（挂）阿里：3.23 投递、测评3.28 笔试3.31 淘天一面4.8 钉钉一面4.9 淘天二面4.10 阿里控股一面4.12 钉钉二面（取消）4.15 淘天hr面4.16 淘天offer（已接）4.21 高德一面（取消）4.22 淘宝闪购一面（取消）面试最大的感触是，现在撞上ai转型，一堆老业务急着转向，新业务非常不成熟，研究型的组bar非常高根本进不去，业务侧挂着算法的岗位干的都是工程活，面试却又要问算法，另外agent的落地也远没有那么广，绝大多数还是那套写死的系统调一下llm api或者做做rag，其余少部分真的在搭agent的，基本不能在线上服务用什么很智能的模型，现阶段成本太高，进去大概率就是给垃圾模型从工程方面兜底，除了业务场景的应用和数据经验以外，技术方面很难有什么提升。算法岗做不了基模的还是去搜广推好，之前判断失误了完全没投，秋招不知道还进不进得去。

绿糖滑稽：携程这什么雷霆流程时长

我的求职进度条

点赞评论收藏

分享

04-23 10:48

南昌大学 golang

腾讯测评是不是会挂人

测评完就显示结束了完蛋了

点赞评论收藏

分享

不愿透露姓名的神秘牛友

04-21 20:42

当然可以去

大厂没消息，就去小厂，及时止损。而且，只要不签三方，小厂要求必须实习几个月都只是说说而已，最多不给开实习证明，你要是突然有了大厂offer直接跑路就行，根本没影响

不知道怎么取名字_：这确实是大实话，有更好的机会，直接走

找不到大厂实习可以去小厂...

点赞评论收藏

分享

04-21 15:54

浙江大学后端工程师

从三月推进流程到了现在，三轮技术+hr，没想到最终挂在了hr面上，因为了解过该岗位目前还没有除了我以外的候选人，所以以为较稳了，没想到今天就收到hr挂的通知，呜呜呜，还为此推掉了美团的面试。感觉被分手了一样，我在畅想未来，了解到字节是go这两天还去学习了go语言，他已经决定分开了，难过

牛客90813234...：hr一般不挂吧，大概是被横向掉了，面完之后还需要放一块做一个水平对比的，放宽心，我半个月前offer审批都挂过，换个部门继续投，然后现在也是正式录用

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如果春招能重来，我会___ #

2896次浏览 23人参与

# 面试官拷打AI项目都会问什么？ #

887次浏览 24人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

26942次浏览 476人参与

# 除了线上，还能去哪些地方投简历 #

1890次浏览 22人参与

# 你觉得最好用的AI编程工具是_ #

525次浏览 18人参与

# 你会因为行情，降低找工作标准吗？ #

4052次浏览 30人参与

# mt对你说过最有启发的一句话 #

114904次浏览 867人参与

# 你的mentor是什么样的人？ #

61420次浏览 794人参与

# 如何排解工作中的焦虑 #

321577次浏览 2756人参与

# 你和你的mentor相处模式是__ #

4732次浏览 34人参与

# 实习第一天，你在干什么 #

2913次浏览 20人参与

# 双非本科的出路是什么？ #

230571次浏览 1655人参与

# 技术岗笔试题求解 #

116047次浏览 1122人参与

# 机械校招之路总结 #

125321次浏览 2106人参与

# 你有哪些缓解焦虑的方法？ #

60704次浏览 914人参与

# 宣讲会你有哪些意向不到的收获 #

25119次浏览 80人参与

# 听到哪句话就代表面试稳了or挂了？ #

266067次浏览 1722人参与

# 你收到了团子的OC了吗 #

1603391次浏览 11858人参与

# 选offer应该考虑哪些因素 #

168985次浏览 1050人参与

# 一觉醒来，秋招难度下降一万倍…… #

147716次浏览 786人参与

# 0offer互助地 #

774973次浏览 4766人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务