首页
题库
面试
求职
学习
竞赛
More+
所有博客
搜索面经/职位/试题/公司
搜索
我要招人
去企业版
登录 / 注册
首页
>
试题广场
>
某 12 层 Transformer,hidden size
[单选题]
某 12 层 Transformer,hidden size=768,MLP 扩展比=4,则每层 MLP 参数量约为
18.88 M
9.44 M
4.72 M
2.36 M
查看答案及解析
添加笔记
求解答(0)
邀请回答
收藏(4)
分享
纠错
0个回答
添加回答
这道题你会答吗?花几分钟告诉大家答案吧!
提交观点
问题信息
难度:
0条回答
4收藏
11浏览
热门推荐
相关试题
下面关于 Kotlin 中异常处理...
Kotlin
评论
(1)
请选择下面可以应用隐马尔科夫(HM...
机器学习
评论
(1)
在聚类任务中,DBSCAN算法常用...
数据挖掘
评论
(1)
关于Go语言的defer机制,以下...
Go
评论
(1)
在以下代码中:func main(...
Go
评论
(1)
扫描二维码,关注牛客网
意见反馈
下载牛客APP,随时随地刷题