双非本+非科班目前正在做AI工程

传统岗位转AI工程岗最怕的是掉进“补基础”的无底洞:先学C语言、再学操作系统、再学计算机网络,学完一年后发现自己一行AI代码仍不会写。我的策略是——以终为始,让AI做我的带教老师。

最开始两个星期,我只干了一件事儿:把Cursor装好,找一个能跑通的LangChain Demo项目,一行一行让AI给我解释。注意,不是自己去啃Python教程,而是打开一个真实的RAG聊天应用代码,选中一段,按 Command+K,输入:“用通俗的语言给产品经理解释这段代码在干什么”。

听不懂的地方继续追问,直到能看图说话一样地把整个链路画出来:用户问了什么→怎么把文字变向量→怎么去向量库检索→怎么拼成Prompt→大模型怎么回答。有了这张链路图,我对“AI工程师在干什么”就有了骨架认知。这比什么教程都管用。

下面是我真实走过的路线,不是什么“XX天精通”,但每一步都帮我活到了下一步。

第一阶段:让AI当翻译官,熟悉Python和基本玩法

  • 资源:用Cursor直接实战,不需要系统学Python语法。
  • 任务:跑通LangChain官方“Build a Chatbot”教程,把英文文档喂给向量数据库Chroma,实现基本问答。
  • 产出:一个命令行的小问答机器人,数据是自己项目的帮助文档。
  • 如果你需要一本随时查的书:《Python编程 从入门到实践》前半本就够了,别读完。

第二阶段:混入模型的世界,搞懂“训练”和“推理”

  • 我没去推数学公式,而是用吴恩达和李宏毅的课做认知建构。
  • 必看:吴恩达《AI For Everyone》→帮你建立“什么能用AI做”的产品判断力;李宏毅2023机器学习课程的前6讲,讲到Transformer就停。
  • 关键动作:每看一个概念,就去HuggingFace找一个对应的模型,点开Model Card,看输入输出样例。这样“注意力机制”、“微调”这些词就不再虚了。
  • 这阶段我写了一个文档:把公司现有的10个客服场景,逐一标注“可以用大模型直接完成的”“需要微调的” “必须靠规则兜底的”。这就把我产品经理的分析能力用上了。

第三阶段:在脏活里长出工程能力

  • 我开始复刻公司那个被搁置的智能客服V2。白天上班画原型,晚上写代码。用了三个开源工具搭了整套闭环:FastAPI做后端接口LangChain做链逻辑和工具调用Dify做前端测试界面。
  • 遇到的最大坑:知识库切片。最开始按默认500字符切,检索出来的结果全是断章取义。后来我读了产品文档的结构,自己写了一个按“标题-段落”层级切分的预处理脚本。这活儿光靠研发去猜业务结构,远不如我们这些写文档的产品经理干得快。
  • 在这个项目里,我第一次体会到什么叫“产品懂技术,至少能砍掉一半无效沟通”。因为前后端都是我自己,上下文切换成本几乎为零。

第四阶段:准备面试,用产品逻辑降维打击

  • 我没有海投八股文。我把做智能客服的过程写成了一篇“技术+产品”双视角的项目复盘:为什么要做这个模块,技术选型怎么折衷,如何评估检索准确率,上线后怎么用Bad Case驱动优化。
  • 面试内部转岗时,总监问了一个问题:“你最大的短板是什么?”我回答:“我没有大规模分布式训练的经验,但我比任何工程师都更清楚,这个部门的AI功能在什么场景下会真的被用起来。而且我能三小时内搭出一个可用的原型。”后来他跟我说,正是这个回答让他觉得没有招错人。

很多朋友可能跟我当初一样,觉得写代码是另一个次元的事。现在门槛真的低太多了,如果你偶尔闪过“我自己能不能把它做出来”的念头,别想那么多,今晚回去把 Cursor 装上,跑个 Hello World 试试。那种自己把一个想法变成能跑的东西的感觉,真的很爽。

全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务