02-24 14:21 山东大学嵌入式软件工程师发布于山东

关注

面试官：为什么99%的项目，其实都不适合做微调

2023年，开源模型刚刚多起来的时候，上手AI做的最多的事情就是微调，那会儿我有一张3090，就足够微调GLM2-7B或者Llama2-8B的模型了，网上还有很多的教程，教你怎么找数据集、怎么构建数据集，怎么微调大模型。

仿佛只要学会了微调，我就一脚踏进了大模型工程师的门槛。

包括到现在，很多客户一开始就说：“我们要微调一个自己的模型，网上都这样说的。”然后14B也好，32B也好，拉一堆行业数据往里塞，觉得这样才算构建核心壁垒。

但连续了解几个项目之后，我现在的结论很清晰：对大多数做AI应用的团队来说，微调就是个坑。甚至面试的时候也会出现这个问题：为什么不建议微调？

到现在网上还有很多新发的教程，一张卡或者一台Mac mini部署14B模型，认为成本低、易控制、可试错。结果三个现实问题，让我们迅速清醒。

---

第一，真正消耗资源的不是训练，而是评估。

很多人觉得最贵的是那张卡。其实不然。真正昂贵的，是你如何验证模型“确实提升了”。在A问题表现不错，换到B问题就失灵了；今天刚调顺，明天数据一更新又开始波动。于是进入循环：调参、测试、改数据、再调参。

这个循环几乎没有边界，评估与维护的综合成本，可能是训练成本的数倍，甚至十倍。这会儿可能就会意识到，微调不是一次性投入，而是一种持续消耗的技术负担。

---

第二个问题更讨厌：底座模型一升级，你几个月的成果可能瞬间缩水。

你花时间精细优化的效果，厂商发布一个新版本，零样本能力直接超过你的成果。还记得我上面说的，GLM2吗，现在GLM5都发了，当时不管你拿多强的数据集微调的，现在都不一定打得过新版，这就是当前阶段的常态。底座模型的进化速度，远快于多数团队的优化节奏。

问题不在你不努力，而在于你用线性投入，对抗指数级跃迁。平台级模型每次迭代，都是算力、数据与算法的整体升级；应用团队，很难同步这种速度。

---

第三个问题：你在用应用层资源，对抗平台层能力。

当模型厂商一次升级投入是几十亿级时，一个小团队想靠参数微调构建护城河，本质是错位竞争。你调整的那部分参数，很可能在下一次版本发布时被覆盖。

而越来越多实践表明，很多场景根本无需改动参数。决定效果的，往往不是模型“是否被调过”，而是“输入是否足够好”：

模型效果≈底座能力×输入质量

如果把精力放在优化上下文结构、任务拆解方式、知识召回机制和反馈闭环，而不是修改参数，往往能获得更稳定、更可迁移、也更可升级的提升。

比如让系统自动沉淀经验，让模型在任务结束后进行反思与结构化总结；比如把行业知识整理为可检索、可复用的知识单元；比如优化上下文组织与行动路径。这些都是工程层面的增强，而不是参数层面的博弈。

---

踩过这些坑之后，我们的策略变得简单。

第一，把重点放在数据资产本身，而不是急着动模型。行业数据确实重要，但激活它的方式不一定是微调。通过结构化整理、知识抽象，再结合检索增强，把最相关的信息在合适的时机提供给模型，往往就能覆盖大部分垂直需求。

实际落地后发现，七八成的垂直场景，用“RAG+Prompt”就已经足够。效果稳定，而且模型升级后自动受益，无需重来。

第二，真正下功夫的是“上下文工程”。如今大模型的上下文窗口越来越大，竞争焦点正从“参数能力”转向“组织能力”。数据如何清洗、召回、压缩、排序，动作链路如何设计，这些决定了最终输出。结构化上下文加清晰任务设计，在很多场景下并不逊色于微调，而且更灵活。

第三，是心态问题。模型仍在快速进化，每天都有一个新的sota模型出现，与其在波动期做重资产投入，不如先把数据底座与业务闭环打牢。利用每一次模型升级带来的能力提升，让系统具备迁移性。等模型趋于稳定、微调框架标准化、成本结构更透明，再考虑深度定制，也不迟。

当然，微调并非毫无价值。

端侧小模型、资源受限设备、轻量分类任务，或者追求最后几个百分点准确率时，精调依然有意义。

但那是少数场景，而不是默认路径。现在这个阶段更合理的策略是：不要自己造船，而是借船远航。这就是现在Agent时代的特点，模型交给厂商，你真正的壁垒，在数据底座、场景理解、上下文工程能力，以及持续迭代的业务闭环。

与其花钱改模型，不如花精力改你喂给模型的内容。

对绝大多数团队来说，这才是更现实、也更稳健的选择。

#AI求职实录#

AI面试题目精讲文章被收录于专栏

AI 面试题目精讲专栏：一题一讲、一讲一通透，系统提升 AI 面试应答能力与竞争力

全部评论

推荐最新楼层

Data_Seven

杭州电子科技大学大数据开发工程师

沾点喜气，offer拿到手！

点赞回复分享

发布于 03-01 22:07 四川

勇敢的火龙果在开会

河南工学院光传输工程师

有点长@牛可乐，总结一下

点赞回复分享

发布于 02-27 10:45 河南

頭痛0有人总窃取我的智慧

昆明理工大学银行管培生

不要自己造船，而是借船远航，通透啊我去

点赞回复分享

发布于 02-27 10:45 云南

卷王上岸

北京工业大学用户运营

上下文工程才是新八股！学就完了

点赞回复分享

发布于 02-27 10:44 北京

SolsticeScribe

浙江大学光传输工程师

底座技术一升级，调了三天全白干哈哈😭

点赞回复分享

发布于 02-27 10:44 浙江

疯狂求捞月

门头沟学院 Java

确实自己动手才知道其实，别老听那些营销号逼逼

点赞回复分享

发布于 02-27 10:44 北京

幻影未来

武汉大学供应链其他

微调？感觉很多人脚本都没有跑通

点赞回复分享

发布于 02-27 10:43 湖北

路在脚底下

山东大学算法工程师

真是收教了

点赞回复分享

发布于 02-24 22:11 山东

03-30 16:03

北京大学算法工程师

企业微信支持CLI开源

1.企业微信CLI3月29日，企业微信 CLI 开源项目上架 Github 社区，开放企业微信消息、日程、文档、智能表、会议、待办、通讯录等核心产品能力，支持主流 AI Agent调用。下载地址：GitHub2.CLI可使用的能力3.如何安装使用CLI3.1 前提环境要求：Node.js（npm/npx）创建并获取长连接方式机器人的 Bot ID 和 Secret3.2 安装安装 CLInpm install -g @wecom/cli安装 CLI SKILL（必需）npx skills add WeComTeam/wecom-cli -y -g3.3 快速开始配置企业微信机器人凭证（交互式，...

点赞评论收藏

03-12 14:39

门头沟学院前端工程师

前端开发可以转产品运营吗

bg:双非本科，计算机本人现在是一名即将毕业的大四学生，有过两段互联网中厂前端开发经历，但是一直对代码兴趣不大，现在想找一份产品运营的工作，想请教一下可行吗曾有过互联网➕比赛，数学建模，挑战杯比赛经验但是看网上说运营比较挑垂直经验，可是真的觉得运营这个岗位很有意思，比每天写代码更适合我的性格😂，不过感觉这样子的话之前的实习经验就没有用了，想换赛道春招投递一下试试，想听听大家的意见😘，感谢感谢！！！

非技术求职现状

点赞评论收藏

03-13 11:58

上海电力大学数据产品

家人们25届0offer求助想找运营，一投一个已送达/已读不回，要么就是教培/外包，咋办啊

点赞评论收藏

03-18 17:45

上海交通大学产品经理

这个实习值得去吗？

蹲蹲韶音科技的IT产品实习生，请问这家公司工作氛围怎么样？这个岗位可以去吗

点赞评论收藏

03-27 10:31

已编辑

点赞评论收藏

招聘动态

OPPO

2027届寻梦实习招聘

蚂蚁集团

2026春季校园招聘

阿里巴巴集团

2027届实习生校园招聘

正浩创新EcoFlow

2026届春季校园招聘

AI网申助手

网申字段一键填写

招商银行数字金融训练营

火热报名中

新华三

2026届春季校园招聘

联想

27届暑期实习

厦门银行

2026届春季校园招聘

联想

26届补录

全站热榜

创作者周榜

正在热议

# 给工作过的公司写一条大众点评，你会怎么写？ #

11694次浏览 137人参与

# 通信/硬件的薪资开多少，才值得去？ #

76582次浏览 407人参与

# 我是XXX，请攻击我最薄弱的地方 #

72946次浏览 492人参与

# 春招已经启动啦硬件uu开始投了吗？ #

124181次浏览 771人参与

# 你觉得专业和学校哪个对薪资影响最大 #

104397次浏览 619人参与