今天 09:33 已编辑华为_系统工程师

发布于上海

关注

第 9 题：上下文学习（In-Context Learning）及其可能机制

第 9 题：上下文学习（In-Context Learning）及其可能机制

题目

什么是上下文学习（In-Context Learning）？其背后的可能机制是什么？

一、什么是上下文学习？

上下文学习（In-Context Learning, ICL） 指不更新模型参数，只在输入（prompt）里放若干输入-输出示例，模型就能根据这些示例对新查询给出符合任务格式的预测。也就是“在上下文中通过示例学习”，而不是通过梯度更新参数。

典型格式：

[示例1：输入1 → 输出1] [示例2：输入2 → 输出2] ... [查询：输入?] → 模型生成 输出?

例如少样本情感分类：给几条“评论 → 正面/负面”，再给一条新评论，模型直接生成“正面”或“负面”。关键：模型权重没变，只是前向时“看到”了示例，就表现得像学会了这个任务。

为什么重要？ 这是 GPT-3 等大模型的核心能力之一，也是“大模型不用微调就能做很多任务”的重要来源；面试几乎必考。

二、与微调的本质区别

微调：用标注数据算损失、反传、更新参数；学到的内容存在权重里。
ICL：不更新参数；仅靠当前前向时 prompt 里的示例和查询，通过注意力、表示等机制，在“当次推理”中表现出任务适应。
所以 ICL 的“学习”发生在的表示与注意力动态里，而不是存储在参数中。这也是为什么换一批示例或换任务，模型可以立刻“切换”行为，而

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

Ai Agent：面试300问文章被收录于专栏

《AI Agent 300 问》专为备战 AI Agent 相关岗位的求职者打造，适配校招、社招全场景，覆盖算法研发、产品、解决方案等全岗位。专栏汇总 300 道大厂高频面试真题，全维度覆盖提示工程、智能体规划推理、记忆机制、工具调用、多智能体协作、框架落地、行业应用等核心领域，拆解考点底层逻辑，分享一线实战经验，助你一站式通关高薪面试。

全部评论

推荐最新楼层

04-26 10:22

南开大学 Java

27届后端转测开

目前投递了一些后端暑期实习岗位，但是都在一面就挂了，自己学的确实不怎么好，大学四年也没怎么好好学习计算机这些内容，感觉都只是会一点皮毛，问了面试官一般就是说感觉学的太浅了，或者就是说练手项目没有经验那种，所以想转测开去投实习，之后想知道测开都需要在java开发的基础上在学一些什么呢？如果最终也没找到是实习，想在秋招的时候直接投侧开，能去一些中大厂么？bg的话是9本海外一年水硕。

点赞评论收藏

分享

04-22 15:50

长沙理工大学 C++

双非本211硕，华为OD干安卓1年半转正无望想跳槽，该继续安卓、转后端还是冲全栈？

网友提问：yt大佬你好，我是24届毕业生，双非本211硕。当年毕业选择了出生地的电信市公司，但由于种种原因离职了，现在在华为od干安卓开发。现在一年半了。目前薪资上勉强看的过去，基本月薪是18k，总包税前是差不多30万的样子。准备年中再和leader谈一波涨薪，然后准备跳槽。跳槽的原因很简单就是工资还是相对正编来说太低了。毕竟od不是长久之地，od的涨薪确实是太慢了，没有什么未来，转华为正式员工这两年由于人太多，机会约等于0。导致上限锁死在d5，上限太低。不过od一般来说确实不会被裁，相对正编要稳定点，毕竟是性价比很高的工具人。组里有蛮多比领导呆的久的od老人的。和很多人一样都是我也是被从ja...

点赞评论收藏

分享

03-07 20:50

中国科学技术大学 Java

今年字节实习来了波大的

刚刷到字节跳动官方发的消息，确实被这波阵仗吓了一跳。在大家还在纠结今年行情是不是又“寒冬”的时候，字节直接甩出了史上规模最大的转正实习计划——ByteIntern。咱们直接看几个最硬的数，别被花里胡哨的宣传词绕晕了。首先是“量大”。全球招7000多人是什么概念？这几乎是把很多中型互联网公司的总人数都给招进来了。最关键的是，这次的资源分配非常精准：研发岗给了4800多个Offer，占比直接超过六成。说白了，字节今年还是要死磕技术，尤其是产品和AI领域，这对于咱们写代码的同学来说，绝对是今年最厚的一块肥肉。其次是大家最关心的“转正率”。官方直接白纸黑字写了：整体转正率超过50%。这意味着只要你进去了，不划水、正常干，每两个人里就有一个能直接拿校招Offer。对于2027届（2026年9月到2027年8月毕业）的同学来说，这不仅是实习，这简直就是通往大厂的快捷通道。不过，我也得泼盆冷水。坑位多，不代表门槛低。字节的实习面试出了名的爱考算法和工程实操，尤其是今年重点倾斜AI方向，如果你简历里有和AI相关的项目，优势还是有的。而且，转正率50%也意味着剩下那50%的人是陪跑的，进去之后的考核压力肯定不小。一句话总结： 27届的兄弟们，别犹豫了。今年字节这是铁了心要抢提前批的人才，现在投递就是占坑。与其等到明年秋招去千军万马挤独木桥，不如现在进去先占个工位，把转正名额攥在手里。

喵_coding：别逗了 50%转正率仔细想想就是转正与不转正

字节7000实习来了，你...

点赞评论收藏

分享

04-24 10:32

北京邮电大学 Java

阿里云基础平台研发一面

自我介绍实习是否遇到过大量连接建立导致服务端压力很高的线上问题，你们是短连接还是 TCP 长连接A 系统 QPS 2k，单机需要承受多少 QPSC 系统 详细说一下稳定性治理的整个过程；主从同步的时间是多少Checkpoint 回溯机制是如何做的如果做核心数据流，如何解决 Checkpoint 回溯导致重复消费的问题；如果用事务提交两个点之间的数据，可能带来什么问题项目使用 Canal 监听 Binlog 实现最终一致性，是如何做的RabbitMQ 一定能保证消息不重复，不漏发，以及一定能消费到吗Canal 重复向 MQ 发送数据，如何解决八股缓存雪崩、击穿、穿透分别是什么MySQL 有哪几种...

查看24道真题和解析

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如果春招能重来，我会___ #

2095次浏览 19人参与

# mt对你说过最有启发的一句话 #

114771次浏览 866人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

26594次浏览 462人参与

# 你和你的mentor相处模式是__ #

4031次浏览 27人参与

# 你的mentor是什么样的人？ #

61338次浏览 793人参与

# 你会因为行情，降低找工作标准吗？ #

3048次浏览 25人参与

# 实习第一天，你在干什么 #

2639次浏览 17人参与

# 双非本科的出路是什么？ #

230502次浏览 1655人参与

# 你有哪些缓解焦虑的方法？ #

60685次浏览 914人参与

# 一觉醒来，秋招难度下降一万倍…… #

147658次浏览 786人参与

# 如何排解工作中的焦虑 #

319758次浏览 2732人参与

# 0offer互助地 #

774023次浏览 4761人参与

# 你是怎么和mt相处的？ #

103123次浏览 508人参与

# 你想吐槽公司的哪些规定 #

48954次浏览 245人参与

# 拼多多集团-PDD笔试 #

90680次浏览 602人参与

# 打工人的工作餐日常 #

97109次浏览 559人参与

# 我的成功项目解析 #

532382次浏览 8616人参与

# 25届秋招公司红黑榜 #

341398次浏览 1331人参与

# 0经验如何找实习？ #

89717次浏览 936人参与

# 当下环境，你会继续卷互联网，还是看其他行业机会 #

201691次浏览 1196人参与

# 你总挂在第__面？ #

15107次浏览 164人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务