04-27 23:49 华为_系统工程师

发布于重庆

关注

第 2 题：位置编码——绝对与相对

题目

什么是位置编码？对比绝对位置编码和相对位置编码的优缺点。

一、为什么必须有位置编码？

Self-Attention 对输入做的是集合运算：打乱 token 顺序， $QK^\top$ 和 $AV$ 的结果完全不变。所以 Transformer 本身无法区分“谁在前、谁在后”，必须显式注入位置信息，否则“我吃苹果”和“苹果吃我”在模型眼里可以一样。这就是**位置编码（Positional Encoding）**要解决的问题。

两种思路：

绝对位置编码：给每个位置 $t$ 一个向量 $\mathbf{p}_t$ ，和 token 嵌入相加（或拼接）后再进 Attention，回答“这是第几个位置”。
相对位置编码：不在输入上加向量，而是在 Attention 的分数或 Value 里编码“位置 $i$ 和 $j$ 相差多少”（ $i-j$ ），回答“这两个 token 相距多远”。

面试常问：“为什么 Transformer 需要位置编码？”——因为 Self-Attention 是置换不变的，没有位置信息就丢失了顺序。

二、绝对位置编码

1. 正弦/余弦（Sinusoidal）——原始 Transformer

对维度 $2k$ 与 $2k+1$ 用不同频率的正弦和余弦：

PE_{(t,2k)} = \sin(t / 10000^{2k/d}), \quad PE_{(t,2k+1)} = \cos(t / 10000^{2k/d})

优点：不增加参数、可外推（训练时没见过更长序列也能插值）、不同维度不同周期，能表示多种尺度。
缺点：和词向量简单相加可能干扰语义；外推远超过训练长度时效果会变差。

2. 可学习绝对位置（Learned）

把位置 $t=0,1,\ldots,T_{max}$ 当 id，查 embedding 表得到 $\mathbf{p}_t$ ，再加到 token 上。BERT 等 Encoder 常用。

优点：完全数据驱动，在训练长度内通常比正弦更贴合数据。
缺点：长度固定，不能外推； $T_{max}$ 越大参数量越大。

3. 绝对位置编码的共性问题

实现简单（加或拼到输入即可），但更关注“第几个位置”，而不是“两个 token 相距多远”。
很多任务（语法、指代、局部依赖）更依赖相对距离；绝对位置的外推也普遍不如相对位置（尤其可学习型）。

三、相对位置编码

核心思想：不编码“位置是多少”，而编，即的函数。

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

Ai Agent：面试300问文章被收录于专栏

《AI Agent 300 问》专为备战 AI Agent 相关岗位的求职者打造，适配校招、社招全场景，覆盖算法研发、产品、解决方案等全岗位。专栏汇总 300 道大厂高频面试真题，全维度覆盖提示工程、智能体规划推理、记忆机制、工具调用、多智能体协作、框架落地、行业应用等核心领域，拆解考点底层逻辑，分享一线实战经验，助你一站式通关高薪面试。

全部评论

推荐最新楼层

昨天 10:41

已编辑

华中科技大学 Java

字节实习前一周被导师卡实习

字节实习前一周被导师通知全部人不允许实习可以毁约字节吗会不会对秋招有影响

我的求职进度条

点赞评论收藏

分享

04-17 09:40

安徽工业大学 IT技术支持

# 2026大学生就业真相：1270万人抢567万个岗，学历和专业决定生死

用真实数据拆解当代大学生就业的结构性矛盾 一、整体就业大盘：总量压力空前，优质岗位严重不足 2026届全国普通高校毕业生规模再创新高，叠加往届未就业、海归及职场回流人群，就业市场供需失衡进一步加剧：   📊 毕业生总数：1270万人（同比+48万，连续8年破千万）   👥 全年求职总人数：1500万人+   💼 有效校招岗位：约567万个   ⚖️ 整体供需比：≈2:1（平均2人竞争1个岗位）   ✍️ 直接签约率（不含升学）：约55%   ⏳ 慢就业/暂缓就业：30%~45%（以考研、考公、待业为主）   📉 16-24岁青年失业率：16.5%~17.3%（仍处高位徘徊）   二、学...

我的求职进度条

点赞评论收藏

分享

04-20 21:01

青岛科技大学嵌入式软件工程师

双非研究生控制工程就业方向咨询

各位大佬们，现在研0，方向有点迷茫，老师研二会放实习，目前打算走嵌入式软件，先学stm32+rtos  研二的时候再学linux，大家有什么建议嘛，感觉单片机方向基本没有硕士在走唉，网上本科多一点，linux又有点怕双非学历卡住

双非有机会进大厂吗

点赞评论收藏

分享

昨天 11:55

呼吸性粉尘检测仪，2032年全球市场销售额将达到10.57亿美元

呼吸性粉尘检测仪：让粉尘暴露评估摆脱重量滞后的实时监测工具呼吸性粉尘检测仪更多被当作一种即开即测的实时监测设备存在，不需要复杂的前置准备或实验室分析环境，只要完成开机预热与零点校准，就能在矿山、隧道、工地、车间或城市环境中等现场对工人呼吸带高度的可吸入粉尘浓度进行连续、动态的测量与记录。相比传统滤膜称重法，其核心价值并不在于实验室级别的绝对精度，而在于实时响应、即时读数、便携穿戴化和操作门槛的显著降低，使其自然融入职业卫生监督、岗位暴露评估、个体防护装备效果验证及扬尘污染溯源等对时效性要求严格的专业场景，成为当前职业健康监测与现场快速检测领域最具实用性的实时粉尘检测设备之一。根据QYResea...

点赞评论收藏

分享

昨天 10:14

门头沟学院 Java

28日常要初筛多久

投了一大堆的日常，全都在初筛😢😢😡😡😡😡

点赞评论收藏

分享

评论

点赞

收藏

招聘动态

华泰证券星战营

AI专项人才储备计划

“联宝杯”

2026 大学生创新大赛

上海人工智能实验室

2026年春季校园招聘

AI网申助手

网申字段一键填写

阿里巴巴集团

2027届实习生校园招聘

招商银行数字金融训练营

火热报名中

联想

27届暑期实习

厦门银行

2026届春季校园招聘

联想

26届补录

27届校招宝典

全站热榜

更多

招银网络春招开奖了！

热聊中

创作者周榜

更多

正在热议

更多

# 这个offer值得去吗？ #

2985次浏览 59人参与

# 你实习是赚钱了还是亏钱了？ #

118552次浏览 649人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

43307次浏览 497人参与

# 你会因为行情，降低找工作标准吗？ #

12150次浏览 131人参与

# 机械人晒出你的简历 #

191345次浏览 1101人参与

# 如果春招能重来，我会___ #

5362次浏览 66人参与

# 刚入职的你踩过哪些坑 #

60034次浏览 416人参与

# 实习想申请秋招offer，能不能argue薪资 #

255187次浏览 1323人参与

# 招银网络求职进展汇总 #

249899次浏览 1120人参与

# 腾讯云智研发工作体验 #

43070次浏览 174人参与

# 面试官拷打AI项目都会问什么？ #

2320次浏览 123人参与

# 想做Agent可以做哪些岗位？ #

2858次浏览 34人参与

# 除了线上，还能去哪些地方投简历 #

3950次浏览 43人参与

# 求职你最看重什么？ #

166342次浏览 907人参与

# 你觉得最好用的AI编程工具是_ #

1102次浏览 29人参与

# 暑假倒计时，你都干了些啥？ #

58918次浏览 314人参与

# 实习第一天，你在干什么 #

4518次浏览 36人参与

# 如何排解工作中的焦虑 #

329491次浏览 2828人参与

# 你和你的mentor相处模式是__ #

6348次浏览 50人参与

# 第一次面试 #

1135622次浏览 13934人参与

# 如何一边实习一边秋招 #

2234512次浏览 19215人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务