在刷代码的沸羊羊很认...:因为transformer输入的序列长度不固定,bn是算每一个特征的均值和方差,序列长度不一样,计算的时候有的地方有值有的地方没有,不好计算。ln是对每一个样本单独计算,即使每个样本长度不一样也不影响计算
0 点赞 评论 收藏
分享
2024-04-03 15:08
门头沟学院 算法工程师 牛客24761078...:我感觉pcg不缺人了,面我也是,看我主用c++说他们组用的go,可以帮我转给同事,咱俩就别互相浪费时间了😅。真牛,你不要c++捞我干啥

0 点赞 评论 收藏
分享
创作者周榜
更多
关注他的用户也关注了: