首页 > 试题广场 >

在Transformer的多头注意力机制中,假设模型维度为d

[单选题]
在Transformer的多头注意力机制中,假设模型维度为d_model=1024,使用16个注意力头,每个头的维度d_k为多少?
  • 32
  • 64
  • 128
  • 256

这道题你会答吗?花几分钟告诉大家答案吧!