只训练模型的最后几层
通过低秩矩阵分解来减少可训练参数
冻结所有参数,只添加新的层
使用更大的学习率训练全部参数
这道题你会答吗?花几分钟告诉大家答案吧!
扫描二维码,关注牛客网
下载牛客APP,随时随地刷题