04-28 09:30 华为_系统工程师

发布于上海

关注

第 15 题：LoRA（Low-Rank Adaptation）的数学原理

第 15 题：LoRA（Low-Rank Adaptation）的数学原理

题目

解释 LoRA（Low-Rank Adaptation）微调的数学原理。

一、动机

全量微调大模型要更新全部参数，显存与算力成本高。LoRA 假设预训练权重在适应新任务时，有效更新是低秩的，因此只学习一个低秩增量，与原权重相加得到适应后的权重，从而大幅减少可训练参数与显存。

二、数学形式

设某层线性变换为 $\mathbf{h} = W \mathbf{x}$ ， $W \in \mathbb{R}^{d \times k}$ 。LoRA 不直接改 $W$ ，而是增加低秩分解的增量：

W' = W + \Delta W = W + A B

其中 $A \in \mathbb{R}^{d \times r}$ ， $B \in \mathbb{R}^{r \times k}$ ， $r \ll \min(d,k)$ 为秩。前向时：

\mathbf{h} = W\mathbf{x} + (AB)\mathbf{x} = W\mathbf{x} + A(B\mathbf{x})

训练：只训练 $A$ 、 $B$ ， $W$ 冻结；参数量从 $d \times k$ 变为 $r(d+k)$ 。
推理：可把 $W' = W + AB$ 算好存成一张矩阵，等价于单层线性，无额外延迟；或保留 $W + AB$ 分开算以省显存（只存一份 $W$ 多份 $A,B$ ）。

三、设计要点

初始化：通常 $A$ 用高斯小随机， $B$ 用零初始化，使训练初态 $\Delta W = 0$ ，不破坏预训练表示。

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

Ai Agent：面试300问文章被收录于专栏

《AI Agent 300 问》专为备战 AI Agent 相关岗位的求职者打造，适配校招、社招全场景，覆盖算法研发、产品、解决方案等全岗位。专栏汇总 300 道大厂高频面试真题，全维度覆盖提示工程、智能体规划推理、记忆机制、工具调用、多智能体协作、框架落地、行业应用等核心领域，拆解考点底层逻辑，分享一线实战经验，助你一站式通关高薪面试。

全部评论

推荐最新楼层

哈哈哈，你是老六

门头沟学院大数据开发工程师

可以的，写的很好呢

点赞回复分享

发布于 05-06 23:30 北京

05-19 18:24

科锐国际_招聘专员

非科班转行｜华为OD Python上岸全过程

211本｜零计算机基础转行，全程顺利拿下华为OD Python岗✨全程机考+资格面+两轮技术面+两次主管面，完整流程复盘给大家！一、机考（老系统）刷题量：力扣50 + CSDN50抽到三道原题：用户定期入网复评、最左侧冗余覆盖子串、贪吃蛇考场有点紧张，简单题翻车，难题反而做出来了最后总分240✅真心建议大家：别轻视简单题！考试一定要留足时间啃难题，提分很香！二、资格面纯摸底，不刁难▪自我介绍▪离职原因、转行原因▪意向城市选择▪上家加班情况、工作节奏主打一个如实沟通，基本都能过！三、技术一面（40min）八股偏基础，难度友好▪自我介绍+项目讲解▪项目难点、项目优化思路▪深拷贝&浅拷贝区别...

查看21道真题和解析

点赞评论收藏

分享

05-19 19:23

门头沟学院前端工程师

AI 为什么总喜欢写防御性代码？

AI 生成代码时，经常会写出一种看起来很谨慎的风格：到处判断空值、到处给默认值、到处包 try/catch，读取环境变量时还特别喜欢加 trim() 和 fallback。比如下面这种代码很常见： const port = Number(process.env.PORT?.trim() || 3000); const apiKey = process.env.API_KEY?.trim() || ""; const timeout = Number(process.env.TIMEOUT || 5000); try { // do something } catch (er...

我与AI的日常

点赞评论收藏

分享

04-08 19:03

南阳理工学院 Java

考研还是就业啊

现在大二学了两年java，在准备八股，准备找暑期实习。家里人听别人说考研，现在也劝我考研了，不过我是不太想考研的，因为想快点就业挣钱。但是软件工程考研，学历就高了一点点，找工作帮助会有很大吗。而且考研应该也要考专硕吧，研究生那些我不很了解。

点赞评论收藏

分享

05-13 18:28

门头沟学院自动化

是我说错话了吗？

本人是学院本，最近都说AI比较火热，于是本人的室友花了1.3w报了个AI培训班，我就说了个感觉这钱花的没啥必要，室友就生气了。。。。这难道不是AI培训班割韭菜吗。。。

牛客51653591...：也许下次说话可以不用太直白，换个表达方式如分享给室友一些免费资源平台

点赞评论收藏

分享

昨天 09:30

武汉大学 C++

阿里 + CVTE 两场嵌入式面经，挂了但题全记下来了

先说一下我是谁——双非本，正在秋招，已经面了一堆。这两场算有点料的，一场阿里一场CVTE，一个京杭系一个广州系，风格差得离谱。复盘一下，给后面要面的兄弟省点劲。两场都没拿offer（笑），但题是真题，坑是真坑。—阿里那场一个多小时，节奏跟小厂完全不一样。小厂喜欢问"你做过什么"，阿里上来就抠你"你说的这个东西，本质是什么"。第一题就摔了。问进程和线程的区别。我下意识背了句"进程是资源分配的基本单位，线程是CPU调度的基本单位"——面试官停了两秒：用自己的话讲。我才反应过来——这种书面定义脱口而出，等于自杀。后面他让我从内存角度讲，从隔...

查看25道真题和解析

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 实习生的蛐蛐区 #

982174次浏览 4922人参与

# 父母对你找工作是助力还是阻力？ #

49578次浏览 423人参与

# 27届实习投递记录 #

153335次浏览 1593人参与

# 你上一次给父母打电话是什么时候 #

45242次浏览 280人参与

# 万物皆可发面经 #

1140次浏览 21人参与

# 找工作时的取与舍 #

139284次浏览 927人参与

# 从mentor身上学到了__ #

66065次浏览 909人参与

# 我和mentor的爱恨情仇 #

119907次浏览 1006人参与

# 你觉得mentor喜欢什么样的实习生 #

62349次浏览 1047人参与

# 你的mentor是什么样的人？ #

65021次浏览 806人参与

# 实习，不懂就问 #

222758次浏览 1728人参与

# 多益网络工作体验 #

74367次浏览 316人参与

# 多益网络求职进展汇总 #

109206次浏览 409人参与

# 一起聊华为 #

221869次浏览 973人参与

# 求职中的尴尬瞬间 #

42569次浏览 127人参与

# 薪资一样，你会选择去大厂还是小公司 #

35831次浏览 133人参与

# 实习的内耗时刻 #

243118次浏览 1670人参与

# 发工资后，你做的第一件事是什么 #

107948次浏览 348人参与

# 第一次找实习，我建议__ #

88308次浏览 880人参与

# 牛友投递互助，不漏校招机会 #

495848次浏览 5371人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务