首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
首页 /
LoRA微调
#
LoRA微调
#
4768次浏览
10人互动
收藏话题
分享
此刻你想和大家分享什么
热门
最新
2023-07-16 22:36
阿里巴巴_算法工程师
人工智能大语言模型微调技术:SFT 监督微调、LoRA 微调
人工智能大语言模型微调技术:SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法 1.SFT 监督微调 1.1 SFT 监督微调基本概念 SFT(Supervised Fine-Tuning)监督微调是指在源数据集上预训练一个神经网络模型,即源模型。然后创建一个新的神经网络模型,即目标模型。目标模型复制了源模型上除了输出层外的所有模型设计及其参数。这些模型参数包含了源数据集上学习到的知识,且这些知识同样适用于目标数据集。源模型的输出层与源数据集的标签紧密相关,因此在目标模型中不予采用。微调时,为目标模型添加一个输出大小为目标数据集类别个数的输出层,...
AI前沿技术
点赞
评论
收藏
分享
提到的真题
返回内容
玩命加载中
创作者周榜
更多
热议话题
更多
1
...
考研对你找工作产生了哪些影响?
0
2
...
找实习你看重大厂光环还是业务方向
0
3
...
聊聊这家公司值得去吗
0
4
...
摸鱼被leader发现了怎么办
0
5
...
职场捅娄子大赛
0
6
...
大家实习每天都在干啥
0
7
...
实习想申请秋招offer,能不能argue薪资
0
8
...
我是XXX,请攻击我最薄弱的地方
0
9
...
打杂的实习你会去吗?
0
10
...
kpi面有什么特征
0
牛客网
牛客网在线编程
牛客网题解
牛客企业服务