首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
首页 /
SFT微调
#
SFT微调
#
4972次浏览
10人互动
收藏话题
分享
此刻你想和大家分享什么
热门
最新
2023-07-16 22:36
阿里巴巴_算法工程师
人工智能大语言模型微调技术:SFT 监督微调、LoRA 微调
人工智能大语言模型微调技术:SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法 1.SFT 监督微调 1.1 SFT 监督微调基本概念 SFT(Supervised Fine-Tuning)监督微调是指在源数据集上预训练一个神经网络模型,即源模型。然后创建一个新的神经网络模型,即目标模型。目标模型复制了源模型上除了输出层外的所有模型设计及其参数。这些模型参数包含了源数据集上学习到的知识,且这些知识同样适用于目标数据集。源模型的输出层与源数据集的标签紧密相关,因此在目标模型中不予采用。微调时,为目标模型添加一个输出大小为目标数据集类别个数的输出层,...
AI前沿技术
点赞
评论
收藏
分享
提到的真题
返回内容
玩命加载中
创作者周榜
更多
热议话题
更多
1
...
写给毕业5年后的自己
0
2
...
海信求职进展汇总
0
1
...
华泰证券Fintech星战营
3
...
职场捅娄子大赛
0
4
...
HR问:你期望的薪资是多少?如何回答
0
5
...
华为求职进展汇总
0
6
...
如果今天是你的last day,你会怎么度过?
0
7
...
当下环境,你会继续卷互联网,还是看其他行业机会
0
8
...
好好告别我的学生时代
0
9
...
晒晒我司的端午福利
0
10
...
实习/项目/竞赛奖项,哪个对找工作更重要?
0
牛客网
牛客企业服务