04-27 23:48 华为_系统工程师

发布于重庆

关注

第 1 题：Transformer 中的 Self-Attention 机制与计算复杂度

题目

解释 Transformer 架构中的 Self-Attention 机制，并说明其计算复杂度。

一、Self-Attention 在做什么？为什么重要？

Self-Attention（自注意力） 是 Transformer 的核心：让序列中每个位置都能“看到”其他所有位置，并根据相关性对信息做加权聚合。换句话说：每个 token 的表示，由整段序列里所有 token 共同决定，权重由“谁和谁更相关”来定。

为什么重要？

长距离依赖：RNN 要一步步传，距离远时梯度易消失；Self-Attention 一步就能让任意两个位置交互，适合长文档、长对话。
并行：所有位置的注意力可以同时算，训练比 RNN 快得多。
对顺序不敏感：打乱 token 顺序， $QK^\top$ 和 $AV$ 的结果不变，所以必须配合位置编码，否则模型不知道“谁在前谁在后”。

面试里常追问：“和 RNN/CNN 比有什么不同？”——RNN 是顺序、局部传递；CNN 是局部窗口；Self-Attention 是全局、一次看全序列，且可并行。

二、计算流程（三步，必须能推）

设输入 $X \in \mathbb{R}^{n \times d}$ ： $n$ 为序列长度， $d$ 为特征维度。

1. 得到 Q、K、V

三个线性变换：

Q = X W^Q,\quad K = X W^K,\quad V = X W^V

$W^Q, W^K, W^V \in \mathbb{R}^{d \times d_k}$ 。做多头时通常 $d_k = d/h$ （ $h$ 为头数）。

Query：当前位置“在找什么”。
Key：每个位置“有什么可被注意的”。
Value：真正被聚合的语义/信息。

相似度用 $Q$ 和 $K$ 算（点积），聚合用算出来的权重对 $V$ 加权求和。这样就把“找谁”和“取什么”分开，比直接用 $X$ 做点积更灵活。

2. 注意力分数与权重

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

Ai Agent：面试300问文章被收录于专栏

《AI Agent 300 问》专为备战 AI Agent 相关岗位的求职者打造，适配校招、社招全场景，覆盖算法研发、产品、解决方案等全岗位。专栏汇总 300 道大厂高频面试真题，全维度覆盖提示工程、智能体规划推理、记忆机制、工具调用、多智能体协作、框架落地、行业应用等核心领域，拆解考点底层逻辑，分享一线实战经验，助你一站式通关高薪面试。

全部评论

推荐最新楼层

昨天 17:31

香港大学数据分析师

腾讯CDG广告录用评估求助

暑期实习从hr面转录用评估已经三周了，伯乐码offer流程中一周多了，请问这正常吗？问了ld应该没有被横向，还没有在网上看到这个部门算法的offer，是要等到一起发吗？

点赞评论收藏

分享

04-17 22:24

中南大学测试开发

蚂蚁集团测开面经

4.17 蚂蚁测开面经自我介绍智力题1：5l杯子与3l杯子，如何接4l水智力题2：8枚硬币一枚假，假的比真的轻，用天平最少称几次能找到假的英语朗读：给一段英语材料，朗读编程题：给你[1,2,3,4]4个数，请将能组成的所有不含重复数字的三位数输出由于没有实习经历，面试官对简历的项目随便提了两个问题反问全程不到半小时就结束了

查看5道真题和解析

点赞评论收藏

分享

04-19 15:18

第一拖拉机制造厂拖拉机学院 C++

hr会聊什么了？hr会问你你是否会有offer了 这个时候不要太老实 要说自己有 这是你的筹码 不然他会压价的 hr会问你的家庭条件 这决定你是否会加班愿意当牛马 hr会问你有么有女朋友看你稳定不稳定

查看3道真题和解析

点赞评论收藏

分享

03-29 16:40

中央美术学院附属中等美术学校 Java

做的有点累，感觉不是超级难对ACM选手肯定爆杀，鼠鼠拼尽力做出前两道，后两道不会一个图，一个dp大概是，只拿了0.25一共A了2.25/4。每次做这种题都有一种无力感。。。。做的就不想做了

暴龙战士求offer：4/4小白选手

蜀黍面试记录

点赞评论收藏

分享

04-26 20:54

中南大学 Python

我只能说，能够A出3题的人都是很牛逼的

B1ng：a了1.64，太难了，第二题暴力解只a了60%，后面的超时了

拼多多集团-PDD笔试

点赞评论收藏

分享

评论

点赞

收藏

招聘动态

“联宝杯”

2026 大学生创新大赛

上海人工智能实验室

2026年春季校园招聘

AI网申助手

网申字段一键填写

阿里巴巴集团

2027届实习生校园招聘

招商银行数字金融训练营

火热报名中

联想

27届暑期实习

厦门银行

2026届春季校园招聘

联想

26届补录

27届校招宝典

滴滴

2027届秋招储备实习生招聘

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如果春招能重来，我会___ #

3687次浏览 40人参与

# 想做Agent可以做哪些岗位？ #

1772次浏览 23人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

42340次浏览 496人参与

# 这个offer值得去吗？ #

1473次浏览 22人参与

# 面试官拷打AI项目都会问什么？ #

1494次浏览 80人参与

# 除了线上，还能去哪些地方投简历 #

2753次浏览 30人参与

# 你觉得最好用的AI编程工具是_ #

714次浏览 23人参与

# mt对你说过最有启发的一句话 #

115026次浏览 870人参与

# 你会因为行情，降低找工作标准吗？ #

6589次浏览 74人参与

# 如何排解工作中的焦虑 #

324387次浏览 2789人参与

# 工作两年想退休了 #

272140次浏览 2057人参与

# 银行笔面经互助 #

195665次浏览 1324人参与

# 双非本科的出路是什么？ #

230629次浏览 1657人参与

# 你的第一家实习公司是什么档次？ #

73269次浏览 342人参与

# 你和你的mentor相处模式是__ #

5334次浏览 43人参与

# 你的mentor是什么样的人？ #

61507次浏览 795人参与

# 科大讯飞求职进展汇总 #

384174次浏览 3069人参与

# 实习第一天，你在干什么 #

3233次浏览 22人参与

# 哪些公司在招寒假实习？ #

95353次浏览 768人参与

# 秋招投递记录 #

416940次浏览 3283人参与

# 如果公司降薪，你会跳槽吗？ #

160783次浏览 950人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务