首页
题库
面试
求职
学习
竞赛
More+
所有博客
搜索面经/职位/试题/公司
搜索
我要招人
去企业版
登录 / 注册
首页
>
试题广场
>
序列输入长度 s=256,隐藏维度 d=1024,注意力头数
[单选题]
序列输入长度 s=256,隐藏维度 d=1024,注意力头数 h=16。多头注意力中 Q/K/V 三个投影矩阵的总参数量是( )。
3*s*d*h
d*d*h
3*d*d*h
3*d*d
查看答案及解析
添加笔记
求解答(0)
邀请回答
收藏(1)
分享
纠错
0个回答
添加回答
这道题你会答吗?花几分钟告诉大家答案吧!
提交观点
问题信息
来自:
2025年秋招-华为-...
难度:
0条回答
1收藏
21浏览
热门推荐
相关试题
关于线性回归,哪项表述正确?
评论
(0)
来自
2025年秋招-华为-1...
三状态马尔可夫链的转移矩阵为 [[...
评论
(0)
来自
2025年秋招-华为-1...
以下哪些算法属于无监督学习。
评论
(0)
来自
2025年秋招-华为-1...
在高斯混合模型(GMM)中,EM ...
评论
(0)
来自
2025年秋招-华为-1...
在随机森林中,下列哪些方法可以提升...
评论
(0)
来自
2025年秋招-华为-1...
扫描二维码,关注牛客网
意见反馈
下载牛客APP,随时随地刷题