首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
不困子
四川外国语大学 运营
发布于福建
关注
已关注
取消关注
@汀丶人工智能:
大语言模型的预训练[4]:指示学习详解以及和prompt工程
大语言模型的预训练[4]:指示学习Instruction Learning:Entailment-oriented、PLM oriented、human-oriented以及和Prompt Learning,In-content Learning区别1.指示学习的定义Instruction Learning 让模型对题目 / 描述式的指令进行学习。针对每个任务,单独生成指示,通过在若干个 full-shot 任务上进行微调,然后在具体的任务上进行评估泛化能力,其中预训练模型参数是可更新的。指示学习和提示学习的目的都是去挖掘语言模型本身具备的知识。不同的是 Prompt 是激发语言模型的补全能力,例如根据上半句生成下半句,或是完形填空等。Instruct 是激发语言模型的理解能力,它通过给出更明显的指令,让模型去做出正确的行动。通过下面的例子来理解这两个不同的学习方式:提示学习:老师讲解的通俗易懂,学生很喜欢,这门课太____了。指示学习:这句话的情感是非常正向的:老师讲解的通俗易懂,学生很喜欢。选项:A = 好;B = 一般;C = 差。对于任务指令学习,目标是通过遵循指令来驱动系统在给定输入的情况下达到输出。因此,数据集由三个项目组成:输入 (X):一个实例的输入;它可以是单个文本片段(例如,情感分类)或一组文本片段(例如,文本蕴涵、问题回答等)。输出(Y):一个实例的输出;在分类问题中,它可以是一个或多个预定义的标签;在文本生成任务中,它可以是任何开放式文本。模板 (T):一个文本模板,试图单独表达任务意义或充当 X 和 Y 之间的桥梁。T 可能还不是一种组件结构。三种不同类别的文本说明,如图所示:Entailment-oriented:将原始输入作为前提,将每个预定义的标签转换为假设(即指令)。PLM oriented:使用模板将原始任务输入构建成完形填空题。human-oriented:利用足够的任务信息作为指导,例如定义和可选的小样本演示等2. 指示学习的指令种类2.1 任务指令将这些指令概括为执行 T,X 和 Y 的不同组合的三类(ENTAILMENT-ORIENTED、 PLM-ORIENTED 和 HUMAN-ORIENTED)2.1.1 I=T+Y:Entailment-oriented Instruction处理分类任务的一个传统方案是将目标标签转换为索引,并让模型决定输入属于哪个索引。这种范式侧重于对输入语义进行编码,同时丢失标签语义。为了让系统识别新标签而不依赖于大量标记的示例,为每个标签建立一个假设——然后,推导标签的真值被转换为确定假设的真值。这种方法内置在指令 I 中,指令(I)结合模板 (Y) 和标签 (Y) 来解释每个目标标签(Y)。由于这种范式自然满足文本蕴涵(TE,其中任务输入和指令可以分别被视为前提和假设)的格式,因此这类指令被称为“面向蕴涵的指令”。优点有以下四个方面:保留了标签语义,使得输入编码和输出编码在输入输出关系建模中得到同等重视;产生了一个统一的推理过程文本蕴涵来处理各种 NLP 问题;创造了利用现有 TE 数据集的间接监督的机会,因此预训练的 TE 模型有望在没有特定任务微调的情况下处理这些目标任务;将原始的封闭集标签分类问题扩展为具有很少甚至零标签特定示例的开放域开放形式标签的识别问题。因此,它被广泛应用于各种少样本 / 零样本分类任务,如主题分类、情感分类、实体类型和实体关系。2.1.2 I=T+X:PLM-oriented InstructionPrompt 是 PLM-oriented instructions 的代表,通常是一个简短的话语,前面加上任务输入(前缀提示),或者一个完形填空题模板(完形填空)基本上是为从预训练的 LM (PLM) 查询中间响应而设计的。由于提示输入符合 PLM 的预训练目标(例如,完形填空式输入满足屏蔽语言建模目标(Kenton 和 Toutanova,2019)),因此有助于摆脱对传统监督微调的依赖大大减轻了人工标注的成本。因此,快速学习在许多先前的少量 / 零样本 NLP 任务中取得了令人印象深刻的结果。尽管提示技术具有出色的性能,但在实际应用中,面向 PLM 的指令仍然存在两个明显的问题:不是用户友好的。由于提示是为服务 PLM 设计的,因此鼓励使用 “模型的语言”(例如,模型首选的不连贯的词或内部嵌入)设计提示。然而,这种面向 PLM 的指令很难理解,并且经常违反人类的直觉。同时,提示的性能在很大程度上取决于费力的提示工程(Bach 等人,2022 年),而大多数最终用户都不是 PLM 专家,通常缺乏足够的知识来调整有效的提示。应用限制。提示通常简短而简单,而许多任务不能仅仅通过简短的提示来有效地制定,这使得提示难以处理现实世界 NLP 任务的不同格式。2.1.3 Human-oriented Instruction面向人的指令基本上是指用于在人工标注平台上进行众包工作的指令(例如,Amazon MTurk 指令)。与面向 PLM 的指令不同,面向人的指令通常是一些人类可读的、描述性的、段落式的任务特定的文本信息,包括任务标题、类别、定义、应避免的事情等。因此,Human-oriented Instruction 说明更加用户友好,可以理想地应用于几乎任何复杂的 NLP 任务。面向人的指令类似于面向 PLM 的指令,它也利用模板将原始输入(红色)转换为完形填空题。然而,任务模板本身包含信息任务语义,即正式的任务定义。同时,还提供了 few-shot 备选任务演示.2.2 如何建模指令Semantic Parser-based(基于语义解析器):在机器学习的早期阶段,为了帮助系统理解自然语言指令,大量工作采用语义解析将指令转换为形式语言(逻辑公式),以便于系统执行。Prompting Template-based(基于提示模板):对于基于神经网络的系统可以直接将自然语言指令编码到模型的嵌入中,而无需语义解析器的帮助。基于提示模板的方法的本质是使用模板将任务输入转换为提示格式(即完形填空)。Prefix Instruction-based(基于前缀指令):与基于前缀指令的方法主要用于为 human-oriented 的指令建模,其中提供了足够的特定于任务的信息。HyperNetwork-based:使用基于前缀指令的建模策略有两个明显的问题。首先,它将任务级指令与每个实例级输入连接起来,重复过程显着减慢了处理 / 推理速度,冗长的输入也增加了计算成本的负担。其次,它可能会影响优化,因为模型无法明确区分任务输入 x 和前缀指令 I,因此模型可以简单地学习完成任务并忽略指令。为了解决上述问题,使用超网络对任务指令进行编码。使用基于超网络的方法的本质是:分别对任务指令 I 和任务输入 x 进行编码。将指令转换为特定于任务的模型参数。2.3 优点指令通常包含比单独标记的示例更抽象和更全面的目标任务知识。随着任务指令的可用性,可以快速构建系统来处理新任务,尤其是在特定于任务的标注稀缺的情况,举例说明,例如,一个小孩可以通过从指导和一些例子中学习来很好地解决一个新的数学任务。指示学习的优点是它经过多任务的微调后,也能够在其他任务上做 zero-shot,而提示学习都是针对一个任务的。泛化能力不如指示学习。3.与其他大语言模型技术对比3.1.Instruction Learning 与 Prompt Learning相同之处: 核心一样,就是去发掘语言模型本身具备的知识不同之处:不同点就在于,Prompt 是去激发语言模型的补全能力,比如给出上半句生成下半句、或者做完形填空,都还是像在做 language model 任务;而 Instruction Learning 则是激发语言模型的理解能力,通过给出更明显的指令 / 指示,让模型去理解并做出正确的 action。比如 NLI / 分类任务Prompt 在没精调的模型上也能有一定效果,而 Instruction Learning 则必须对模型精调,让模型知道这种指令模式;Prompt Learning 都是针对一个任务的,比如做个情感分析任务的 prompt tuning,精调完的模型只能用于情感分析任务,而经过 Instruction Learning 多任务精调后,可以用于其他任务的 zero-shot!3.2.In-content Learning 和 Instruction LearningIn-context Learning :给出范例,让机器回答其它问题;以 GPT3 为代表,将检索后的每个文档(标题 + 提炼后的语句)作为一个样本输入到 GPT3 里,最后写 “标题:xxx \n 内容:_______”,让模型去补全。**Instruction Learning:**给出题目的叙述,让机器进行回答;以 ChatGPT 为代表,将检索后的信息输入给 ChatGPT 并后面补上一句 “请根据以上内容,回答问题 xxx”。4.关键知识点Instruction Learning建模指令有:基于语义解析器、基于提示模板、基于前缀指令Instruction Learning任务指令类型有:Entailment-oriented Instruction、PLM-oriented Instruction 、Human-oriented Instruction通过Instruction Learning给【题目叙述】回答问题以及In-context Learning给【范例】回答问题可以让语言模型变成一个通才。指示学习的优点是它经过多任务的微调后,也能够在其他任务上做zero-shot,而提示学习都是针对一个任务的,泛化能力不如指示学习。指示学习和提示学习的相同之处是:核心一样,就是去发掘语言模型本身具备的知识。更多优质内容请关注:汀丶人工智能;会提供一些相关的资源和优质文章,免费获取阅读。
点赞 0
评论 0
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
昨天 22:37
门头沟学院 Java
AI把实习生冲烂了
总结一下近期找实习的感受吧,鼠鼠是过年前吧实习给辞职了。过完年,到现在还在找实习中。个人感觉AI对底层程序员或者实习生的冲击很大,很多公司都不要那么多人手了,例如以前计划招5个人,现在只要2 3个人就能覆盖日常的开发任务。属实是把我们的实习坑位给填满了。总结其实大家不必要听风就是雨,取代程序员是不可能的,因为永远有业务这个东西存在,也需要有个人来背黑锅等等问题。只能说是会淘汰掉不会用AI的人,所以加油吧码农们,我们都是最棒的,能找到好工作的
今年找实习到底有多难?
点赞
评论
收藏
分享
昨天 18:13
西南交通大学 Java
腾讯后台开发一面
首先上来做了一道手撕,力扣原题最小路径和,其实我还以为会考树Java中的接口和抽象类有什么区别在Java中循环拼接字符串,可能要拼接几万次,使用什么类型去拼接比较合适?String、StringBuilder、StringBuffer?Java里面如何实现线程安全的synchornized可以去修饰遍历吗Java中哪些注解可以实现依赖注入Java里的HashMap如何扩容的,扩容机制是怎样的什么情况下会进行扩容Mybatis中如何防止SQL注入的微服务的熔断和降级有了解过吗(没有,我引导限流去了)了解过哪些限流方法Kafka如何保持高流量,高可用如果说MySQL里出现慢查询,如何进行优化我简历...
点赞
评论
收藏
分享
03-08 18:54
天津理工大学 Java
27届学生,这样的简历能够找到暑期实习吗?请问有什么建议吗
听劝,我这个简历该怎么改...
点赞
评论
收藏
分享
昨天 13:55
湖北师范大学 Java
output二面
1. 我看你写的博客,感觉有些挺新颖的,博客大概是怎么写的呢2. 目前使用最多的ai编程工具3. 平时怎么使用ai工具进行开发的4. 有没有使用过claude code5. 有没有做过ai相关的一些功能6. skills和tools和mcp之间的区别7. 如果我们自己实现一个工具服务,让ai调用,你会选择哪种方式实现(skills或者mcp或者tools)8. opencode你除了用来编写代码,有没有试过其他用途9. 现在这个ai编程工具开发和传统网页问答ai进行开发的区别,有啥好处10. 交流分享一下自己平时学习过程中觉得比较好的代码或者方案以及思路反问:对于ai学习方面的建议#牛客AI配...
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
快手Java后端一面
5127
2
...
字节后端日常实习二面
4524
3
...
腾讯前端暑期提前批一、二、三面面经
4377
4
...
滴滴一面面经
4037
5
...
6个AI实操技巧,帮你在简历+面试中拉开差距
3541
6
...
腾讯暑期一面
3354
7
...
美团产品笔试何意为....
2818
8
...
阿里云一面
2719
9
...
字节一面、二面(横向挂)
2539
10
...
实习学不到东西的真相
2373
创作者周榜
更多
正在热议
更多
#
你感受到金三银四了嘛?
#
70294次浏览
611人参与
#
美团笔试
#
695556次浏览
4624人参与
#
虽然0面试,但今天___,夸夸自己
#
8729次浏览
172人参与
#
米哈游笔试
#
551255次浏览
1088人参与
#
春招 / 实习投递,你最焦虑的一件事
#
52804次浏览
1024人参与
#
vivo笔试
#
13006次浏览
122人参与
#
27届实习投递记录
#
847次浏览
22人参与
#
AI岗位暴涨12倍,你会转AI赛道吗?
#
4585次浏览
90人参与
#
今天你投了哪些公司?
#
144072次浏览
2595人参与
#
金三银四,你的春招进行到哪个阶段了?
#
18638次浏览
254人参与
#
运营每日一题
#
127436次浏览
900人参与
#
美团秋招笔试
#
194670次浏览
1065人参与
#
小米编程考试
#
31291次浏览
151人参与
#
字节7000实习来了,你投了吗?
#
4327次浏览
20人参与
#
刚工作的你,踩过哪些坑?
#
6038次浏览
136人参与
#
AI项目实战
#
6530次浏览
307人参与
#
小米笔试
#
139062次浏览
994人参与
#
找工作,你都让AI帮你做什么?
#
6742次浏览
214人参与
#
软件开发春招备战日记
#
93005次浏览
611人参与
#
vivo求职进展汇总
#
277834次浏览
1558人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务