03-29 23:59 门头沟学院机器学习发布于浙江

关注

LLM面试题：MHA,MQA,GQA的区别

Q：你知道MHA,MQA,GQA的区别吗?详细解释一下。

难度:⭐⭐⭐

岗位:通用(开发岗也需了解)

公司:字节、阿里(真题)

标准答案:

这三者都是 Attention 机制的变体,核心区别在于 K/V 的头数设计。

1. MHA (Multi-Head Attention) - 标准多头注意力

每个头都有独立的 Q/K/V
参数量:heads × d_k × d_model × 3 (Q/K/V各一份)
显存占用:最大(推理时需要缓存所有 K/V)

2. MQA (Multi-Query Attention) - 多查询注意力

所有头共享同一组 K/V,每个头只有独立的 Q
参数量:heads × d_k × d_model (Q) + d_k × d_model × 2 (共享K/V)
显存占用:最小(KV Cache 只需存储一份)
优点:推理速度快(KV Cache 小),适合推理部署
缺点:精度可能略有下降

3. GQA (Grouped-Query Attention) - 分组查询注意力

折中方案:将heads分成G组,每组共享K/V
例如:8个head,分成2组,每组4个head共享一套K/V
参数量:介于 MHA 和 MQA 之间
精度 vs 速度的平衡点

对比表格:

类型	K/V头数	Q头数	KV Cache	精度	速度	代表模型
MHA	H	H	最大	最高	慢	BERT、GPT-3
MQA	1	H	最小	略降	最快	PaLM、Falcon
GQA	G (1<G<H)	H	中等	平衡	平衡	LLaMA-2、Mistral

算法岗深入理解:

MQA 为什么能work?理论上信息瓶颈在K/V,但实验表明共享K/V影响不大
GQA 如何选择分组数 G?通常设为 H/4 或 H/8,兼顾精度和效率

开发岗实际应用:

推理场景优先选 MQA/GQA(减少显存,加速推理)
训练场景可以用 MHA(精度优先)
LLaMA-2 70B使用 GQA,8个head分成2组

面试技巧:

画图说明三者区别(K/V头数)
提及 KV Cache 对推理的影响
举例说明哪些模型用了哪种方案

#AI求职记录#

全部评论

推荐最新楼层

03-29 23:12

门头沟学院 Web前端

选择

我觉得选择更重要，因为可能遇到这个岗位非常急招，可能你面试成绩不是很理想，可能下一秒就给你OC了，然后要求了一周内入职的这种，所以有时候还是要看运气，但是努力也是重要，只是有的人可能努力都最后连面试的门槛都没有（说的是我了）。

工作中，努力重要还是选择...

点赞评论收藏

03-25 18:56

浙江大学算法工程师

小米 C++ 软件开发一面面经

小米一面整体节奏很快，面试官技术功底扎实，问题层层递进，不会只停在概念层面，基本每道题都会追问"为什么"或者"你在项目里怎么用的"。整个面试大概 60 分钟，前半段是基础八股，后半段直接上手撕代码，压力不小但氛围还算友好。建议提前把 C++ 内存模型、并发、STL 底层这几块吃透，代码题要写得干净，边界条件别漏。1. 自我介绍略（根据个人情况准备，建议控制在 2 分钟内，突出项目亮点和技术栈）2. 进程和线程的区别？进程间通信有哪些方式？线程间通信呢？进程是资源分配的基本单位，线程是 CPU 调度的基本单位。同一进程内的线程共享堆、全局变量、文件描述符，...

C++八股文全集

点赞评论收藏

03-29 23:13

苏州大学嵌入式软件开发

ai面会问哪些问题

ai面会先问嵌入式基础比如C语言指针、内存管理、FreeRTOS任务调度，还有STM32或Linux驱动开发的细节，这部分是考察基本功。接着会切入AI相关：比如端侧AI模型部署、量化压缩的方法，还有如何优化模型在嵌入式硬件上的推理速度，甚至会让你手写一段模型前处理的代码。项目面则会深挖你做过的AIoT项目，比如怎么把一个轻量模型放到单片机上，遇到了哪些硬件资源限制，又是怎么解决的。整体来看，这类面试既考嵌入式底层能力，也考AI落地的实践经验。

查看11道真题和解析

点赞评论收藏

03-27 15:20

东北大学嵌入式工程师

C++/嵌入式开发-面经大纲

正在备战 C++/嵌入式开发 面试的伙伴看过来！这份面经大纲不是 “标准答案合集”，而是我结合多场面试实战、梳理出的高频考点清单 —— 与其说是 “经验总结”，不如说是一次 “考点扫盲 + 思路抛砖”。从 C/C++ 基础到 Linux 驱动开发，从网络协议到 ARM 架构，再到自旋锁、无锁队列等源码级解读，13 个模块覆盖底层开发面试的核心场景。希望能帮大家理清复习方向，也期待各位大佬在评论区补充更多实战干货，一起搞定面试、拿下心仪 offer！一、C/C++ 常见考点二、操作系统三、计算机网络四、通信协议五、Linux 应用开发六、Linux 驱动开发七、Qt 开发八、Shell九、Mak...

C++/嵌入式开发秋招...

点赞评论收藏

03-04 21:40

门头沟学院嵌入式软件开发

联芸科技，嵌入式驱动一面

前天投的，今晚一面，问一问实习，项目，c语言几个关键字，如何给指定比特位置位，就没了。面试官人挺好的，但是基本没问什么技术相关的，23m结束，估计kpi了😋😋

点赞评论收藏

招聘动态

百度

2027届暑期实习

招商银行数字金融训练营

火热报名中

米哈游2026校园招聘

应届生春招&全年实习生专项

新华三

2026届春季校园招聘

联想

27届暑期实习

奥克斯集团

2026春季校园招聘

厦门银行

2026届春季校园招聘

联想

26届补录

携程集团

2026年春季校园招聘

27届校招宝典

全站热榜

创作者周榜

正在热议

# 开放七大实习专项，百度暑期实习值得冲吗 #

22243次浏览 436人参与

# 大厂实习和小厂实习最大的区别是什么？ #

12249次浏览 83人参与

# 你都用vibe coding做过什么？ #

2003次浏览 61人参与

# 如果人生可以debug你会改哪一行? #

# Vibe Coding 会干掉初级岗位吗？ #

# 面试被问到不会的问题，你怎么应对？ #

# 选完offer后，你后悔学本专业吗 #