07-02 09:08 杭州超限数动科技有限公司_大模型数据安全部_研发专家

发布于浙江

关注

掩码Softmax解析：给张量"戴面具"的魔法

想象你有一叠3D彩票券（X），每张彩票有不同数量的有效号码（valid_lens），而Softmax就像给这些号码按概率分配奖金。但有些号码是无效的（比如彩票刮花了），我们得让它们不参与抽奖！

1. 什么是掩码Softmax？

普通Softmax：对所有数字按概率分配（比如 [1,2,3] → [0.09, 0.24, 0.67]）。

掩码Softmax：先给无效数字打马赛克（换成 -1e6），再分配概率，让它们概率≈0！

2. 输入张量的形状变化（3D彩票券）

假设输入 X 是一个 3D张量，形状是 [batch_size, num_rows, num_cols]：

• batch_size：有多少叠彩票（比如 2 个人各买一叠）。

• num_rows：每叠彩票有多少行（比如每叠 3 行）。

• num_cols：每行有多少个号码（比如每行 4 个号码）。

示例：

X = torch.randn(2, 3, 4)  # 2叠彩票，每叠3行，每行4个号码
valid_lens = torch.tensor([2, 3])  # 第1叠每行有效2个号码，第2叠每行有效3个号码

3. 掩码的"魔法步骤"

步骤 1：处理 `valid_lens`（统一成1D向量）

valid_lens 可以是两种形状：

1D向量（比如 [2, 3]）：表示每叠彩票的所有行有效长度相同（第1叠每行有效2个号码，第2叠每行有效3个号码）。
2D向量（比如 [[2,2,2], [3,3,3]]）：表示每叠彩票的每行有效长度可能不同（第1叠每行有效2个号码，第2叠每行有效3个号码）。

if valid_lens.dim() == 1:  # 如果是1D向量
    valid_lens = torch.repeat_interleave(valid_lens, shape[1])  # 复制成 [2,2,2,3,3,3]
else:  # 如果是2D向量
    valid_lens = valid_lens.reshape(-1)  # 展平成 [2,2,2,3,3,3]

结果：valid_lens 变成 1D向量，长度 = batch_size * num_rows（比如 6 个数字）。

步骤 2：给无效号码"打马赛克"（替换成 `-1e6`）

把 X 先展平成 [batch_size * num_rows, num_cols]（比如 6 行 × 4 列），然后用 sequence_mask 在最后一列（dim=-1）上：

如果号码有效 → 保留原值。
如果号码无效 → 替换成 -1e6（Softmax 后 ≈ 0）。

代码操作：

X = d2l.sequence_mask(X.reshape(-1, shape[-1]), valid_lens, value=-1e6)

效果：原本x的某些号码被替换为-1e6

[[1, 2, 3, 4],  
 [5, 6, 7, 8],  
 ...]  
→  
[[1, 2, -1e6, -1e6],  # 第1行只保留前2个号码  
 [5, 6, 7, -1e6],     # 第2行只保留前3个号码  
 ...]

步骤 3：对打过马赛克的张量做Softmax

现在 X 已经是展平的形状 [batch_size * num_rows, num_cols]，直接对最后一列（dim=-1）做Softmax：

softmax_result = nn.functional.softmax(X, dim=-1)

结果： • 无效号码（-1e6）对应的Softmax概率 ≈ 0。 • 有效号码的概率正常分配（总和=1）。最后再把 softmax_result 还原成原始形状 [batch_size, num_rows, num_cols]：

return softmax_result.reshape(shape)

4. 总结

valid_lens 统一成1D：repeat_interleave 或 reshape，让所有彩票行的有效长度变一维数组。
打马赛克：无效号码 → -1e6（Softmax后≈0）。
Softmax抽奖：只对有效号码分配概率。
还原形状：变回原来的3D彩票堆！

幽默比喻：

valid_lens = 彩票店的规则表（告诉每叠彩票哪些号码有效）。
-1e6= 给无效号码泼墨水（让Softmax看不见它们）。
Softmax = 公平分配奖金（无效号码拿不到钱！）。

这样，你的掩码Softmax就能正确处理带"刮痕"的彩票啦！

大模型小白拆解站文章被收录于专栏

想和大模型零障碍对话？这里是你的入门急救站！从大模型到底是啥到训练时都在干啥，用大白话拆解技术原理；从参数是个啥到微调怎么玩，用生活案例讲透核心概念。拒绝枯燥公式，只有能听懂的干货和冷到爆的梗;帮你从大模型小白变身入门小能手，轻松get前沿AI知识！

全部评论

推荐最新楼层

07-02 16:58

长春工业大学 Java

真的吗？我在牛客上看到有说kpi的

机械打工仔：有说的你怀疑一下就行了，直接问也太实诚了

点赞评论收藏

06-28 00:12

中山大学后端

商品中心—15.库存分桶扣减的技术文档

大纲1.库存分桶扣减和扩容时涉及的数据表2.下单时商品库存扣减3.库存分桶扣减后异步更新DB4.取消订单时回退商品库存5.查询商品库存6.库存扣减分桶轮询以及随机备用分桶7.基于Tair中分桶数据实现库存扣减8.分桶库存扣减完毕后扣减明细异步落库9.分桶扣减完库存后异步触发回源扩容10.库存分桶回源扩容的Double Check11.库存分桶扩容量计算算法实现12.库存分桶扩容完成以及分桶下线触发13.库存分桶下线以及剩余存量归还中心桶14.库存下线触发剩余库存总量预警机制1.库存分桶扣减和扩容时涉及的数据表(1)库存分桶配置表(2)库存扣减明细表(1)库存分桶配置表 CREATE TABLE...

后端技术栈的基础修养

点赞评论收藏

06-06 20:16

Java

6.6陌陌笔试

20道多选2道编程题多选涉及数据库，linux指令，并发编程等编程题一个是排序，按价值倒序排序，相同按id升序排序；另一个是拓扑排序题

投递挚文集团等公司8个岗位

点赞评论收藏

06-06 18:31

中国民用航空飞行学院 Java

陌陌笔试

这玩意是海笔吗，当天投，当天发笔试链接

投递挚文集团等公司8个岗位

点赞评论收藏

07-01 11:52

河北工业大学 Java

鹅的安全策略岗怎么样

👋个人背景：双非本，末211硕，一直想做java开发，结果被鹅厂捞到安全策略岗。已拿offer，不知道发展前景怎么样，薪资怎么样。是继续找开发，还是有鹅选鹅。👏offer：鹅厂安全策略岗。

投递腾讯等公司8个岗位

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 现代汽车前瞻技术研发急速编程挑战赛 #

掩码Softmax解析：给张量"戴面具"的魔法

1. 什么是掩码Softmax？

2. 输入张量的形状变化（3D彩票券）​

3. 掩码的"魔法步骤"

步骤 1：处理 valid_lens（统一成1D向量）

步骤 2：给无效号码"打马赛克"（替换成 -1e6）​

步骤 3：对打过马赛克的张量做Softmax

4. 总结

全站热榜

创作者周榜

2. 输入张量的形状变化（3D彩票券）

步骤 1：处理 `valid_lens`（统一成1D向量）

步骤 2：给无效号码"打马赛克"（替换成 `-1e6`）