大模型转行记录(一)

自从22年11月chat gpt上线以来,这一轮的技术浪潮便变得不可收拾。我记得那年9月份先是在技术圈内讨论,然后迅速地,全社会在讨论,各个科技巨头、金融机构、政府部门快速跟进。

软件开发行业过去与现状

我19年决定转码的时候,互联网的情况可比现在好得多。那时候我了解到的情况(因为信息差,19年我了解到实际情况应该是17年左右的情况)是相当好的。国内985厉害的能年薪80万,双非学得好的年薪有的也能40万。美国那边还可以抽h1b,并且可以在各个大厂之间跳来跳去。那时候学计算机软件开发的学长眼睛里都带光。

但是总所周知地,这几年软件开发一直在走下坡路,这些年关于互联网程序员的负面消息越来越多,先是零散的消息,后面有时候会有大规模的裁员降薪消息,以至于这种裁员降薪逐渐成为了一种常态。新来的从业者的学历能力要求越来越高,19年左右大专生还能入局,去阿里腾讯还能通过先干外包转正,后面这条路就被卡死了。到了现在哪怕是985211的科班,也不一定能找到大厂好的岗位。另外,企业越来越不愿意去培养新人,我了解到的几年前入局的前辈,他们公司普遍给他们的宽容心更大,给他们的培训时间会更长。但是据我现在了解到的情况来看,因为企业并没有那么缺人,所以大量的公司想直接要熟练工,而不乐意培养新员工。

今年我的几个师兄拿到的offer普遍是35-40万的水平,虽然这个价还是挺不错的,但是相较于我了解到四五年前电子科大硕士的应届待遇来说还是差了很多。当年做软件开发,拿到70万都正常,拼多多当年真能给你开近百万的年薪。

前年我在杭州上班的时候,跟同行聊天,当时有个老哥最喜欢跟我聊他在阿里的叔叔告诉他如何年薪两百万的路径,我当时把他讲的故事都当成了金科玉律。比方说,专科可以进阿里外包,然后一年后成为阿里员工。本科一路实习技术好进阿里,工作三年后能管五六人的小团队,等团队发展到十几人的时候就能年薪两百万了。那个老哥说的话也没有说错,这确实是10年前后阿里上升期的真实写照,成就了大量人的造富神话。可惜的是,这样的造富神话并不是常态。今年我再去见那个老哥,他说他们公司业绩不好,产品线已经在被裁的边缘了,而且这不是他个人的问题,而是行业的趋势。在大势面前,个人努力的作用微乎其微。

软件开发未来几年还有继续往下走的趋势,我认为最终这个细分领域的待遇最终会跌倒工科专业的标准值。毕竟入行的人太多太多,现在我们学校校内论坛上动不动就是转java开发,目测电子科大清水河畔论坛里接近一半的帖子,面对就业困境的时候都会选择转软件开发。不敢想象接下来从业者还会增加到什么数量。

前些年入局的人哪怕是低学历低能力也能在浪潮之中爬到不错的位置,他们吃到了行业红利。在行业的发展中逐渐建立起护城河,再通过管理的手段持续获利。试问十五年前学java入行的大专生和现在入局的985211应届生谁的技术能力强,但是十五年前入局的人现在在行业内做到了什么样的位置?不少已经是中层管理了,现在入行哪怕技术能力优秀,也很难复制当年别人的上升路径。因此人需要有大势的观念。

大模型人工智能产业前景与现状

这一波的大模型人工智能浪潮毫无疑问是引发全社会关注的,最近的人工智能有多重要,各界有多重视我就不强调了,相信稍微关注新闻的人都有注意到。不仅各个国家政府高度重视,而且最近金融圈也动作频频,相关企业市值股价连连高升,大模型研究人员的待遇也开得非常高。种种迹象表明,这是一轮新的浪潮,这是一场新的变革。

我觉得目前的情况是,大家对于人工智能这一块的探索是一个挖矿的过程。我记得我很早的时候就听说很多人在研究人工智能,但是研究了很多年,经历了好几次的低谷,依然没有出现大的突破。就像人类挖了三十年的矿,却一直没有挖到金子,哪怕一些企业和高校已经布局了很多挖掘机在矿场里面挖挖挖。

但是转折到来了,一个叫 OpenAI的公司突然一锤子凿到了金矿,于是整个矿场的人都沸腾起来,所有的人都知道那里有金矿了。原先就在那里提前布局的人肯定是收获最大的:微软、OpenAI、英伟达等,还有一些原先就在从事大模型研究的。但是当时还没凿出金矿,所有人都没有意识到能在这里挖出金子。

以金矿(大模型技术)为原点,所有人距离原点的远近是不同的,只有挖到金矿之前就在搞大模型的少数人是纯粹的“科班”,这些人包括:AI还处于相对冷门阶段时就在埋头默默做大模型的科研和应用的高校硕博、企业研发专家,而其他的所有人都不在金矿原点上,其他所有的人离金矿都有距离。换句话来说,除了极少数的大模型“科班”,其他的人都几乎是“零基础”,只是大家的技术相关性、人脉、信息等跟“原点”尚有距离罢了。

比方说深度学习强化学习距离大模型原点一公里,软件技术距离原点三公里,其他信息技术距离原点十公里,非IT技术距离原点100公里。离原点越近,转行大模型的难度就越低。

大家距离原点距离不一样,但是可以肯定的一点是,原点上是几乎没有人的,突然多出来很多岗位和机会现在是所有人都在向原点跑。我们可以趁行业发展之初去原点抢夺这块蛋糕。(前提是如果这是值得的)

个人情况

电子科大25届硕士,电子信息专业,之前有过一段短暂的华为工作C++软件开发的工作经历,对企业的情况有一定的了解。之前只是稍微接触过机器学习,但是接触不过,也没有相关论文。

我觉得我一大优势是我收集信息和动态决策能力比较强,能根据不断收集到的信息迅速判断并及时改变策略和行动。

22年,我当时在考研初试结束后(我二战)立马开始找工作,在拿到第一份offer之后“三线并行”:考研与调剂准备、拖入职时间然后上班、找新的更好的工作。最终我用四个月的时间的完美操作,让本该落榜的我“起死回生”,最终考研上岸和工作实习两不耽误。完美完成了在上班期间同时考研上岸的独一份成就。我当时的工作经历也成为了能考研调剂成功的最主要的决定性因素。我事后发帖,浏览量颇高,脉脉浏览量五万多,同时登顶当周牛客网热帖第一名。我后面发现,我应该是全网头一个这么做,并做成功了的人。

那次经历给了我很多启发和经验。比方说我需要不断地尝试并获取信息,再接收到新的信息之后及时调整接下来的方向,而不是一股脑的一个方向。在你的面前永远是有一棵分叉树的,每个枝丫都有自己的判断语句和权重。每个新收集到的信息都会改变枝丫的判断语句和权重。这样走下去,得到的路径会是比较优秀的。

我前面三个学期在实验室打了一年半的工,第四个学期尝试去实验室发论文申博,但是时间已经赶不上今年的申请季了。这个月本来是开始准备秋招和找实习的,但是与此同时我越看越觉得大模型这块是一个机会,如果继续搞软件开发不一定是一件好事情,毕竟增长的红利期已过。

周围朋友信息收集

自从有这个想法之后,我接触到了一些人,他们的路径很有借鉴意义。

老哥甲

成电同届研究生,河畔第一个发大模型转行贴的。他的帖子也给了我很大的启发。因为他不希望自己的信息被传得过多,所以我这里只说个大概。本硕985,之前做推荐系统,然后现在决定all in 大模型,之前有过大模型RAG项目经历。目前面了腾讯、字节、美团、饿了么的暑期实习,都是一面挂。他觉得是否有微调大模型的经历,直接决定了你是否能通过面试。另外他说目前大模型岗学历歧视严重,除非清北华五相关论文顶会一作以外,没有微调的经验直接寄。他在面试被挂之后决定恶补大模型微调相关知识,并同时去做一个微调项目。他严重推荐转行,整体思路跟我类似。

老哥乙

成电上一届研究生,刚毕业,零基础通过两段实习成功转行。他开始是在做java,可惜面试不顺利,当时正好有某中小厂大模型实习offer他就去了,之后又去了另一家公司做大模型实习。他告诉我,他去的地方,所有人包括面试官和领导都不会大模型技术。是因为老板特别看好大模型,所以叫了一些原先做软件开发的工程师过来,大家边干边学,既然大家都不会所以也把他招进来了,大家一起在公司里学。两段实习之后就是春招了,最终老哥通过这两段实习去了某一线城市某中厂大模型岗,担任AIGC工程师。不过比较难受的一点是,组里没有人带,所以比较痛苦。

老哥丙

本科同学,做数据中心算力相关的业务,跟人工智能行业直接相关。他算是目睹了这个行业最近一年多的风起云涌,强力强力推荐我赶紧立马转行过去分一杯羹,再慢就晚了。他这个告诉我的信息很多,不过千言万语得出一个结论:AI是未来,目前是红利阶段,情况异常的好。人工智能领域是未来,目前相关行业的企业在疯狂抢占市场,非相关的企业也在进行转型。对于每一位想入局分一杯羹的我们,可以找准定位尽快进场。不是“要不要参与”的问题,而是“如何快速占位”的问题。(他的原话)

  1. 给我看了一份几个城市发布的关于算力的优惠政策,这些政策的特点是政府反应非常快,补贴力度非常大。
  2. 某个非相关行业的企业投资他们公司,立马就有股市那边的人来联系他们,想搞清楚为什么该公司要来投资算力相关的企业。那人分析完之后立马重仓了该企业。这说明他们分析后得出这个企业投资的产业是非常有前景的。
  3. 他的一个搞AI的朋友通过公司的信息差,去年赚了一台特斯拉model Y

老哥丁

成电研一,也是看到了大模型的前景,目前在开发大模型的应用软件,老哥有创业的想法,平时也有时间去做大模型的应用软件。

结尾

我写这篇文章的目的:一是记录整理我收集到的信息和脑海里的思路。二是周围也不少人对大模型转行很感兴趣,我索性直接写成一篇文章便于大家查看和分享。三是希望通过文章扩展影响力,让更多有想法有资源的伙伴成为我的朋友,大家一起努力,互帮互助。雷军说:一个人可以走得更稳,而一群人可以走得更快。

2024年7月6日星期六 深圳

#大模型##人工智能##AIGC##C++##软件开发#
全部评论
我也想转大模型hhh,但不知道从哪开始
4 回复 分享
发布于 2024-07-06 14:33 广东
1 回复 分享
发布于 2024-07-19 11:03 河南
本科没机会吗,是不是一定要读研我怕自己读研读完后又成了四九年入国军
点赞 回复 分享
发布于 2025-08-27 00:40 陕西
上海ailab有个书生大模型的实训营,可以看看是否符合需要
点赞 回复 分享
发布于 2024-07-31 09:07 江西
写的很好,我们也是边干边学
点赞 回复 分享
发布于 2024-07-14 23:40 北京
大模型女友有没有搞头
点赞 回复 分享
发布于 2024-07-07 00:22 四川
老哥是深圳的校友吗
点赞 回复 分享
发布于 2024-07-06 14:50 北京

相关推荐

一、怎么找Agent开发工作/实习?(精准渠道+投递策略)1. 核心招聘渠道(按优先级排序)校招/实习平台:实习僧、BOSS直聘(筛选“Agent开发”“大模型应用开发”“LLM落地”关键词)、智联招聘(企业校招专区);技术社区:GitHub(关注Agent相关开源项目的招聘帖)、掘金/CSDN招聘板块、V2EX(“工作机会”分区);企业官网:大厂(字节、阿里、腾讯、百度)AI实验室/智能终端部门、AI创业公司(如科大讯飞、商汤科技、MiniMax)、海外企业(OpenAI、Anthropic的远程实习机会);内推:通过学长学姐、LinkedIn人脉、开源项目贡献(如给LangChain、AutoGPT提PR)获取内推,跳过简历初筛。2. 投递策略简历关键词对齐:围绕“LLM”“Agent框架(LangChain/LLaMA Index)”“工具调用(Function Call)”“Prompt Engineering”“多智能体协作”“知识库构建”等核心技能;投递时间:实习提前2-3个月投递(如暑期实习3-4月集中投递),校招秋招(9-11月)为主、春招(3-5月)补录;针对性投递:优先选择“大模型应用落地”“智能助手开发”“企业级Agent解决方案”相关岗位,避开纯算法研究岗(竞争激烈且门槛高)。二、Agent开发实习具体在做什么?(真实工作场景)1. 基础层工作:基于LangChain/LLaMA Index等框架搭建Agent基础架构,实现“指令解析→工具调用→结果反馈”的闭环;优化Prompt模板,提升Agent对复杂指令的理解准确率,调试Function Call参数(如温度系数、最大 tokens);构建知识库(如向量数据库Milvus/Pinecone的使用),实现Agent的知识检索与问答功能。2. 应用层工作:开发垂直场景Agent(如电商客服Agent、科研辅助Agent、代码生成Agent),对接业务需求(如对接企业ERP系统、API接口);多智能体协作开发(如拆分任务给不同子Agent,设计Agent间通信机制);测试与优化:通过用户反馈迭代Agent功能,解决“指令误解”“工具调用错误”“结果不准确”等问题。3. 辅助性工作:撰写技术文档(如Agent使用手册、接口说明文档);参与需求评审,和产品、算法团队沟通Agent的落地可行性。三、简历上如何包装Agent开发经历?(STAR法则+量化成果)1. 无相关实习?突出“项目经历”(核心加分项)模板:项目名称+技术栈+核心职责+量化成果示例1:“基于LangChain的学术科研Agent开发”技术栈:Python、LangChain、OpenAI API、Pinecone、Streamlit职责:设计“文献检索→摘要生成→公式解析→参考文献整理”的Agent工作流;优化Prompt工程,提升摘要准确率;搭建可视化界面。成果:Agent处理文献效率提升60%,支持3种学术格式输出,获校内科创竞赛二等奖。示例2:“多智能体协作的电商客服系统”技术栈:LLaMA 2、Function Call、Redis、FastAPI职责:拆分“咨询应答→订单查询→售后处理”子Agent,设计Agent通信协议;对接电商平台API,实现实时数据查询。成果:客服响应时间缩短40%,问题解决率提升55%,支持日均1000+用户咨询。2. 有相关实习?强化“业务落地”与“技术难点”示例:“XX公司Agent开发实习生”职责:参与企业级智能办公Agent开发,负责工具调用模块优化;解决复杂指令拆解、跨工具数据同步问题;对接OA系统API。成果:优化后Agent工具调用成功率从82%提升至95%,落地3个部门的日常办公场景,降低人工操作成本30%。四、怎么判断Agent开发实习的好坏?(4个核心维度)1. 项目落地性:是否有明确的业务场景(如To B企业解决方案、C端产品功能),而非纯理论研究;是否能接触到完整的Agent开发流程(从需求到上线)。2. 技术成长空间:是否能使用主流框架(LangChain、LLaMA Index)和工具(大模型API、向量数据库);是否有资深工程师带教,能指导技术难点(如多智能体协作、复杂任务拆解)。3. 资源支持:公司是否提供充足的算力(GPU资源)、数据支持;是否允许参与开源项目或技术分享。4. 团队与氛围:团队是否以AI落地为核心目标,而非“蹭热点”;是否有明确的实习考核标准和反馈机制,而非打杂(如仅做数据标注、文档整理)。五、你有自己动手做过Agent吗?有!比如基于LangChain+ChatGLM开发的“大学生科创竞赛辅助Agent”,核心功能包括:竞赛选题推荐(结合行业热点+数据支撑)、方案框架生成、技术难点查询、参考文献整理,已开源至GitHub(含完整代码和部署教程),适合作为简历项目经历。
点赞 评论 收藏
分享
评论
28
79
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务