今天 09:30 华为_系统工程师

发布于上海

关注

第 15 题：LoRA（Low-Rank Adaptation）的数学原理

第 15 题：LoRA（Low-Rank Adaptation）的数学原理

题目

解释 LoRA（Low-Rank Adaptation）微调的数学原理。

一、动机

全量微调大模型要更新全部参数，显存与算力成本高。LoRA 假设预训练权重在适应新任务时，有效更新是低秩的，因此只学习一个低秩增量，与原权重相加得到适应后的权重，从而大幅减少可训练参数与显存。

二、数学形式

设某层线性变换为 $\mathbf{h} = W \mathbf{x}$ ， $W \in \mathbb{R}^{d \times k}$ 。LoRA 不直接改 $W$ ，而是增加低秩分解的增量：

W' = W + \Delta W = W + A B

其中 $A \in \mathbb{R}^{d \times r}$ ， $B \in \mathbb{R}^{r \times k}$ ， $r \ll \min(d,k)$ 为秩。前向时：

\mathbf{h} = W\mathbf{x} + (AB)\mathbf{x} = W\mathbf{x} + A(B\mathbf{x})

训练：只训练 $A$ 、 $B$ ， $W$ 冻结；参数量从 $d \times k$ 变为 $r(d+k)$ 。
推理：可把 $W' = W + AB$ 算好存成一张矩阵，等价于单层线性，无额外延迟；或保留 $W + AB$ 分开算以省显存（只存一份 $W$ 多份 $A,B$ ）。

三、设计要点

初始化：通常 $A$ 用高斯小随机， $B$ 用零初始化，使训练初态 $\Delta W = 0$ ，不破坏预训练表示。

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

Ai Agent：面试300问文章被收录于专栏

《AI Agent 300 问》专为备战 AI Agent 相关岗位的求职者打造，适配校招、社招全场景，覆盖算法研发、产品、解决方案等全岗位。专栏汇总 300 道大厂高频面试真题，全维度覆盖提示工程、智能体规划推理、记忆机制、工具调用、多智能体协作、框架落地、行业应用等核心领域，拆解考点底层逻辑，分享一线实战经验，助你一站式通关高薪面试。

全部评论

推荐最新楼层

04-19 00:15

九江学院 Java

难道现在已经是agent的天下了吗

27届双非学院本，想在暑假找一个实习，看到现在的简历大部分都是agent的了，像我这种还没学的还能找到实习吗

爪哇沉淀ing：是29爷的天下不是学院本的天下跟agent关系不大

点赞评论收藏

分享

今天 09:32

华为_系统工程师

第 20 题：SwiGLU 激活函数相比 ReLU / GELU 的优势

第 20 题：SwiGLU 激活函数相比 ReLU / GELU 的优势 题目 解释 SwiGLU 激活函数相比 ReLU 和 GELU 的优势。 一、ReLU 与 GELU 简述  ReLU：；简单、稀疏，但死神经元、非零处恒为 1 的梯度。 GELU：（与正态 CDF 相关）；平滑、在负半轴非零，被 BERT、GPT-2 等采用。  二、门控与 GLU 族 GLU（Gated Linear Unit） 形式：，即一路做门控（sigmoid），一路做线性变换，再逐元素乘。门控可让模型学会“选通”信息，提升表达能力。 SwiGLU：把门控的 sigmoid 换成 Swish（即 ，又称 SiL...

Ai Agent：面试3...

点赞评论收藏

分享

今天 09:00

华北水利水电大学自动化

可以分享一下面经吗  各位佬   好不容易拿到的面试

点赞评论收藏

分享

04-03 08:58

蚌埠坦克学院嵌入式软件开发

汇川联合动力二面面经技术问题比较少

1. 自我介绍。答：（建议1-2分钟，涵盖：学校专业、核心项目经历、技术方向、为什么选择汇川。重点突出与岗位的匹配度，不要照着简历念。）2. 你觉得自己和其他候选人相比，最大的竞争优势是什么？答：可以从以下角度切入：技术深度：比如在某个具体方向（电机控制、RTOS、CAN通信）有实际项目积累学习能力：能快速上手新技术，举一个具体例子说明工程习惯：代码规范、文档意识、调试方法论避免空话，一定要结合具体经历支撑，比如"我在XX项目中独立完成了XX模块，解决了XX问题"3. 你在团队协作中遇到过意见分歧吗？你是怎么处理的？答：建议用STAR法则回答：Situation：描述当时的...

查看15道真题和解析

点赞评论收藏

分享

昨天 15:11

已编辑

华东师范大学算法工程师

银四结束，面不动了

暑期实习从2月开始投，面了两个月，流程该挂的都挂完了，腾讯字节一共号称是1.7w个hc，不知道都发给谁了，估计今年秋招要难顶。Timeline米哈游、美团、蚂蚁、微软等公司直接简历挂穿，没进面。携程：3.3 投递、测评3.12 笔试3.18 一面3.25 二面4.13 ai面（hr面）4.14 英语测评4.23 offer（已拒）腾讯：2.6 测评2.28 wxg一面3.5 wxg二面（挂）3.11 teg一面3.21 teg二面（取消）3.31 teg一面4.10 teg二面（挂）4.21 wxg一面4.24 wxg二面（挂）字节：1.28 aml约面（取消）3.17 火山一面（挂）4.8 aml一面（挂）4.20 抖音data一面（挂）阿里：3.23 投递、测评3.28 笔试3.31 淘天一面4.8 钉钉一面4.9 淘天二面4.10 阿里控股一面4.12 钉钉二面（取消）4.15 淘天hr面4.16 淘天offer（已接）4.21 高德一面（取消）4.22 淘宝闪购一面（取消）面试最大的感触是，现在撞上ai转型，一堆老业务急着转向，新业务非常不成熟，研究型的组bar非常高根本进不去，业务侧挂着算法的岗位干的都是工程活，面试却又要问算法，另外agent的落地也远没有那么广，绝大多数还是那套写死的系统调一下llm api或者做做rag，其余少部分真的在搭agent的，基本不能在线上服务用什么很智能的模型，现阶段成本太高，进去大概率就是给垃圾模型从工程方面兜底，除了业务场景的应用和数据经验以外，技术方面很难有什么提升。算法岗做不了基模的还是去搜广推好，之前判断失误了完全没投，秋招不知道还进不进得去。

绿糖滑稽：携程这什么雷霆流程时长

我的求职进度条

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如果春招能重来，我会___ #

3417次浏览 33人参与

# 想做Agent可以做哪些岗位？ #

1530次浏览 20人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

42138次浏览 494人参与

# 这个offer值得去吗？ #

1342次浏览 19人参与

# 面试官拷打AI项目都会问什么？ #

1247次浏览 52人参与

# 除了线上，还能去哪些地方投简历 #

2484次浏览 29人参与

# 你觉得最好用的AI编程工具是_ #

653次浏览 21人参与

# mt对你说过最有启发的一句话 #

114992次浏览 869人参与

# 你会因为行情，降低找工作标准吗？ #

5883次浏览 72人参与

# 如何排解工作中的焦虑 #

323486次浏览 2778人参与

# 工作两年想退休了 #

272099次浏览 2057人参与

# 银行笔面经互助 #

195630次浏览 1323人参与

# 双非本科的出路是什么？ #

230600次浏览 1657人参与

# 你的第一家实习公司是什么档次？ #

73235次浏览 342人参与

# 你和你的mentor相处模式是__ #

5126次浏览 40人参与

# 你的mentor是什么样的人？ #

61470次浏览 794人参与

# 科大讯飞求职进展汇总 #

384131次浏览 3069人参与

# 实习第一天，你在干什么 #

3127次浏览 21人参与

# 哪些公司在招寒假实习？ #

95330次浏览 768人参与

# 秋招投递记录 #

416893次浏览 3281人参与

# 如果公司降薪，你会跳槽吗？ #

160736次浏览 950人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务