昨天 23:48 华为_系统工程师

发布于重庆

关注

第 1 题：Transformer 中的 Self-Attention 机制与计算复杂度

题目

解释 Transformer 架构中的 Self-Attention 机制，并说明其计算复杂度。

一、Self-Attention 在做什么？为什么重要？

Self-Attention（自注意力） 是 Transformer 的核心：让序列中每个位置都能“看到”其他所有位置，并根据相关性对信息做加权聚合。换句话说：每个 token 的表示，由整段序列里所有 token 共同决定，权重由“谁和谁更相关”来定。

为什么重要？

长距离依赖：RNN 要一步步传，距离远时梯度易消失；Self-Attention 一步就能让任意两个位置交互，适合长文档、长对话。
并行：所有位置的注意力可以同时算，训练比 RNN 快得多。
对顺序不敏感：打乱 token 顺序， $QK^\top$ 和 $AV$ 的结果不变，所以必须配合位置编码，否则模型不知道“谁在前谁在后”。

面试里常追问：“和 RNN/CNN 比有什么不同？”——RNN 是顺序、局部传递；CNN 是局部窗口；Self-Attention 是全局、一次看全序列，且可并行。

二、计算流程（三步，必须能推）

设输入 $X \in \mathbb{R}^{n \times d}$ ： $n$ 为序列长度， $d$ 为特征维度。

1. 得到 Q、K、V

三个线性变换：

Q = X W^Q,\quad K = X W^K,\quad V = X W^V

$W^Q, W^K, W^V \in \mathbb{R}^{d \times d_k}$ 。做多头时通常 $d_k = d/h$ （ $h$ 为头数）。

Query：当前位置“在找什么”。
Key：每个位置“有什么可被注意的”。
Value：真正被聚合的语义/信息。

相似度用 $Q$ 和 $K$ 算（点积），聚合用算出来的权重对 $V$ 加权求和。这样就把“找谁”和“取什么”分开，比直接用 $X$ 做点积更灵活。

2. 注意力分数与权重

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

Ai Agent：面试300问文章被收录于专栏

《AI Agent 300 问》专为备战 AI Agent 相关岗位的求职者打造，适配校招、社招全场景，覆盖算法研发、产品、解决方案等全岗位。专栏汇总 300 道大厂高频面试真题，全维度覆盖提示工程、智能体规划推理、记忆机制、工具调用、多智能体协作、框架落地、行业应用等核心领域，拆解考点底层逻辑，分享一线实战经验，助你一站式通关高薪面试。

全部评论

推荐最新楼层

04-23 23:28

广东工业大学 C++

之前没有实习，下周就要去第一段实习了，开发流程啥的都不清楚，怕自己上手太慢了怎么办， 。 。 。 

AI主理牛：多看文档，不懂就问AI

点赞评论收藏

分享

04-17 22:24

中南大学测试开发

蚂蚁集团测开面经

4.17 蚂蚁测开面经自我介绍智力题1：5l杯子与3l杯子，如何接4l水智力题2：8枚硬币一枚假，假的比真的轻，用天平最少称几次能找到假的英语朗读：给一段英语材料，朗读编程题：给你[1,2,3,4]4个数，请将能组成的所有不含重复数字的三位数输出由于没有实习经历，面试官对简历的项目随便提了两个问题反问全程不到半小时就结束了

查看5道真题和解析

点赞评论收藏

分享

04-19 15:18

第一拖拉机制造厂拖拉机学院 C++

hr会聊什么了？hr会问你你是否会有offer了 这个时候不要太老实 要说自己有 这是你的筹码 不然他会压价的 hr会问你的家庭条件 这决定你是否会加班愿意当牛马 hr会问你有么有女朋友看你稳定不稳定

查看3道真题和解析

点赞评论收藏

分享

03-29 16:40

中央美术学院附属中等美术学校 Java

做的有点累，感觉不是超级难对ACM选手肯定爆杀，鼠鼠拼尽力做出前两道，后两道不会一个图，一个dp大概是，只拿了0.25一共A了2.25/4。每次做这种题都有一种无力感。。。。做的就不想做了

暴龙战士求offer：4/4小白选手

蜀黍面试记录

点赞评论收藏

分享

04-22 08:14

河海大学科研人员

蚂蚁的aicoding笔试成绩同一岗位保留18个月。请问这里同一岗位是具体某一个岗位还是说开发岗和算法岗这种类别岗位？谢谢

点赞评论收藏

分享

评论

点赞

收藏

招聘动态

“联宝杯”

2026 大学生创新大赛

上海人工智能实验室

2026年春季校园招聘

AI网申助手

网申字段一键填写

阿里巴巴集团

2027届实习生校园招聘

招商银行数字金融训练营

火热报名中

联想

27届暑期实习

厦门银行

2026届春季校园招聘

联想

26届补录

27届校招宝典

滴滴

2027届秋招储备实习生招聘

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你和你的mentor相处模式是__ #

3403次浏览 21人参与

# 如果公司降薪，你会跳槽吗？ #

160205次浏览 938人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

26073次浏览 322人参与

# 实习第一天，你在干什么 #

2270次浏览 14人参与

# 华为工作体验 #

322139次浏览 1409人参与

# 你会因为行情，降低找工作标准吗？ #

2512次浏览 19人参与

# 非技术2024笔面经 #

501959次浏览 5038人参与

# 机械人与华为的爱恨情仇 #

158506次浏览 1055人参与

# 0offer互助地 #

773252次浏览 4758人参与

# 你是怎么和mt相处的？ #

103047次浏览 507人参与

# 联想求职进展汇总 #

356424次浏览 2262人参与

# 运营人求职交流聚集地 #

247269次浏览 1124人参与

# 实习/项目/竞赛奖项，哪个对找工作更重要？ #

113570次浏览 1196人参与

# 我的成功项目解析 #

532041次浏览 8614人参与

# 打工人的工作餐日常 #

97036次浏览 558人参与

# 26年哪些行业会变好/更差 #

66209次浏览 534人参与

# 蚂蚁求职进展汇总 #

170994次浏览 1291人参与

# 今年秋招还有金九银十吗 #

82777次浏览 514人参与

# 工作两年想退休了 #

271662次浏览 2048人参与

# 你总挂在第__面？ #

14809次浏览 163人参与

# 简历上如何体现你的“AI”能力？ #

20273次浏览 405人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务