后端岗如何拥抱ai应用开发?双非硕方向转换实录(附学习路径)

本文以有java后端基础/python基础如何转向ai开发岗进行讨论分析。

个人bg : 专升本,26届双非硕,硕士转码,25.6 - 26.2 小厂ai应用开发实习,入职前ai相关项目 * 1 ,春招面试时含公司实习项目共计10+ai相关项目(简历体现4个),ai相关内容学习实习前累计1m左右,深入了解时长等同于实习时长。

重要经历 :实习期间参与三个ai项目开发,垂直领域涉及金融审核相关业务(涵盖文档、检索、分析、agent等)

1. ai应用开发岗是什么?涉及什么?

ai应用开发岗作为新兴岗位,主要分为两部分:

  • 上游任务(偏向于算法) : 模型后训练,微调(SFT,QLora) ,场景定制化模型开发 - 如 : 标题分级,内容抽取,舆情检测等细分领域场景模型二次开发优化等,语言以python为主;
  • 下游任务(偏向应用层) :针对指定任务进行下游开发,主要以RAG,MCP,Agent,prompt Engineering为主,最近新兴的Skill,Clawdbot等也归为此类,在这类任务中,框架以springAi,Langchain(Langchain4j)为主,数据库主要采用Mineru,postgreSql等。

在多数公司中,上下游基本不进行分离或进一步细分,如某公司岗位jd所示。

同时,有的同学存在一定的误区,认为后端开发与ai应用开发是完全区分开的岗位,但实际上,ai应用开发不止要了解ai相关内容,同时对于后端的内容也必须尽可能的扎实,因为在实际业务场景中要进行落地,那后端开发一定是必不可少的,甚至在部分场景中,后端的内容要占据一大半——即适合场景的才是最好的,比如在文档指定字符检索类任务时,如果完全依赖ai,那么首先幻觉问题无法解决,同时业务的总耗时会达到一个非常夸张的数字,而此时采用ac自动机模式进行匹配,整体耗时甚至可以达到大模型的1/100,且只是简单的字符匹配,不考虑文档跨页的情况下,准确率可以达到100%。

2. 后端如何转向ai应用开发岗?路径简析

正如前文所言,后端岗位与ai应用开发岗位并非分离,而是相互依存的关系,所以后端在转向ai应用开发岗位时整体而言用时较短且难度较低(一定一定要有后端经验)。以下是个人转岗学习路径:

(bg: 暑期实习面试成功的岗位即ai应用开发岗,所以属于是边干边学,干中学了)

2.1 语言以什么为主?

在实际的开发中,Java和Python通常都会用到,实际应用层在多数公司中会选择java,而在ai层(如后训练模型,微调后模型)通常会选择python然后通过fastapi暴露相关接口来进行调用,所以两个语言尽量都需要掌握,可以选择一个自己更为精通的进行深入,就目前而言,RAG、MCP、Agent等在python上的生态更为成熟,但是java依托于spring ai等框架,两者相差不大,所以语言可以按需选择,不需要太过纠结。

2.2 项目如何选择

目前github上的开源项目极多,也有非常多的知识星球,目前来看多数知识星球均有ai相关项目,所以在项目上大家可以自由选取,按照自己手头的资源来进行就可以。

个人项目学习路径顺序建议 :

  1. RAG : 在这一部分完整实现一个项目,且同时必须要了解掌握包括但不限于以下内容:
  2. Embedding , 要了解什么是embedding,为什么要embedding,选取什么embedding模型,每个模型的优缺点是什么;
  3. Chunk(文本切块),要了解什么是文本切块,为什么需要文本切块,都有哪些策略;
  4. 选用什么向量数据库,每个向量数据库的特点是什么;
  5. 如何计算文本相似度,都有哪些算法;
  6. re-ranking,Top-K是什么
  7. 不同格式文档如何处理
  8. prompt engineering - 压缩查询,自查询等如何实现,如何通过修改prompt使得模型表现更好
  9. 如何评估rag性能
  10. …………
  11. MCP :在这一部分完整实现一个项目,这一部分强烈建议自己改造一个java微服务项目为MCP,会对业务理解的更为深入, 且同时必须要了解掌握包括但不限于以下内容:
  12. 整体流程是什么,什么是MCP协议,如何进行项目改造
  13. 如何确保工具调用的准确性,降低调用幻觉,如何进行实际执行,prompt设计,参数传递,以及大模型在这里扮演了什么角色
  14. 项目改造完成后,如何替换原有加载方式,如何排查配置加载失败的问题,如何进行动态更新,如何保证原有性能
  15. 如何与其他项目进行有机结合?如何设计降级、熔断方案?
  16. 如何评估mcp整体性能?
  17. Agent :agent目前相关生态非常丰富,大家可以结合自己的实际项目进行生态引入,如Prometheus等,也可以在开源的基础上进行自己的二次开发和改造,但还是建议找一个项目从零开发,玩具项目的意义就在与构建对整体的理解:
  18. 如何实现对话历史的管理和持久化?如果原生框架不支持,可以通过哪些方法进行自主实现?
  19. 如何实现multi-agent?
  20. react范式/Plan-and-Execute 范式的区别及如何选取
  21. 如何与其他生态进行有机结合?
  22. 如何优化指定场景下的agent性能?
  23. 如何对原生agent性能进行测试?
  24. 多模态场景下如何进行推理?
  25. AutoGPT如何实现自主决策?
  26. …………

以上为项目学习路径的简单规划,可以按照自己手头的资源进行项目选择然后进行开发,实际上在我学习的过程中,对于网课或视频的依赖程度并不高,多数在不了解相关内容时按需搜索查看,从我的经验来看的话,如果按部就班的看视频 -> 做项目 -> 背八股,这条路径所花的时间成本极高,同时收益不一定会更好,ai应用开发的相关内容并不多,边做边学可能效果会更好,结合开源项目和付费项目,做完几个项目对于整体的理解程度已经足以进行面试了。

在面试过程中,面试官对于实际项目的兴趣点会更高,对于论文/八股的兴致缺缺,而且机会比较大(综合来看),如果有ai实习的话,基本进面率会非常高(没有实习的情况个人不太了解),所以有后端经验的同学可以深入学习项目。

预祝大家前程似锦,都找到心仪的offer!

#AI求职实录##推荐一个值得做的AI项目#
全部评论
简历上有一段ai应用实习,去找java后端开发岗可以加分吗
2 回复 分享
发布于 02-08 09:57 浙江
写的真好
2 回复 分享
发布于 02-06 17:42 北京
大佬你好,我目前双非研二在读,想去找一个agent开发实习,需要达到什么程度面比较稳呢。之前做过苍穹外卖,黑马点评,最近在研究rag和agent。
1 回复 分享
发布于 03-06 11:04 河北
大佬,想问下转应用开发需要补全llm,机器学习这些知识嘛。还是直接先做项目边做边学呀
1 回复 分享
发布于 02-11 18:58 四川
你好哥,我是专升本,211硕,27届毕业生,因为我这个专硕是2年制的,时间比较紧张。现在有个Agent项目和一个RAG的项目,因为平常用的python多一点,所以Java那套技术栈没怎么学过,就只有Java基础和Mysql基础,python这一块还稍微懂一点,我这种情况可以直接找ai应用开发的实习不,我想的是找到实习了再把Java的那些框架都学学,感觉现在要是学完Java那套,再用Java做个项目有点来不及了,毕竟我还没实习经历,暑假过后就秋招了。哥,给点建议吧,真的很焦虑
点赞 回复 分享
发布于 03-03 21:42 北京
感谢分享!沾点喜气~
点赞 回复 分享
发布于 03-01 11:09 四川
佬 想问一下如果想找agent开发岗 但是同时又想投后端的岗位 建议简历上除了agent项目的另外一个项目放一个什么样的项目比较合适呢
点赞 回复 分享
发布于 02-27 13:11 北京
林神,永远的神! my god~
点赞 回复 分享
发布于 02-09 21:09 北京
佬最后去哪了啊 我双非本海硕不知道明年有没有机会冲一下ai开发
点赞 回复 分享
发布于 02-09 03:00 意大利

相关推荐

一面: 1. 自我介绍,讲论文和实习。2. Transformer自注意力机制、位置编码、梯度消失/爆炸的解决方案。3. 微调方法对比(Full Fine-tuning vs. LoRA/Adapter/P-Tuning)。4. 推理加速技术(量化、动态批处理、FlashAttention)。5. 如何优化大模型在长文本生成中的显存占用?6. RLHF中奖励模型(RM)的训练数据如何构建?7. 为网易云音乐设计一个AI歌词生成系统,如何提升创意性和押韵效果?8. 模型剪枝/量化(GPTQ、AWQ)、服务化框架(FastAPI+vLLM)。9. 如何解决大模型API服务的响应延迟问题?一面八股挺多的,问的知识点也非常多,主要考察对大模型的理解,整体来说难度不算大,复习熟记八股应该都比较好答。二面:1. 自我介绍,讲论文和实习。2. LayerNorm和BatchNorm在大模型中的区别?为什么Transformer用LayerNorm?3. 解释大模型训练中的“灾难性遗忘”现象及解决方法。4. 如果微调后的模型过拟合,你会如何调整?5. 如何评估一个对话系统的生成质量?6. 如何用大模型提升网易新闻的推荐效率?7. 设计一个游戏内AI陪玩系统,需考虑哪些模块?8. 领域适配时,如何构建高质量的垂域训练集?9. 你在项目中如何解决数据稀缺问题?10. 模型上线后遇到了什么性能瓶颈?如何优化的?建议:精读《Attention Is All You Need》、HuggingFace文档。如果没有大模型项目,可用Kaggle/开源项目复现(如LangChain应用)。
查看18道真题和解析
点赞 评论 收藏
分享
评论
56
252
分享

创作者周榜

更多
正在热议
更多
# 春招至今,你的战绩如何? #
8454次浏览 76人参与
# 你的实习产出是真实的还是包装的? #
1557次浏览 39人参与
# MiniMax求职进展汇总 #
23616次浏览 305人参与
# 军工所铁饭碗 vs 互联网高薪资,你会选谁 #
7300次浏览 40人参与
# 简历第一个项目做什么 #
31444次浏览 320人参与
# 当下环境,你会继续卷互联网,还是看其他行业机会 #
186719次浏览 1118人参与
# 米连集团26产品管培生项目 #
5440次浏览 213人参与
# 不考虑薪资和职业,你最想做什么工作呢? #
152201次浏览 887人参与
# 研究所笔面经互助 #
118829次浏览 577人参与
# 重来一次,我还会选择这个专业吗 #
433235次浏览 3926人参与
# 简历中的项目经历要怎么写? #
309862次浏览 4177人参与
# 面试紧张时你会有什么表现? #
30460次浏览 188人参与
# 你今年的平均薪资是多少? #
212910次浏览 1039人参与
# AI时代,哪些岗位最容易被淘汰 #
63185次浏览 789人参与
# 我的求职精神状态 #
447925次浏览 3128人参与
# 你最满意的offer薪资是哪家公司? #
76352次浏览 374人参与
# 正在春招的你,也参与了去年秋招吗? #
363053次浏览 2635人参与
# 你怎么看待AI面试 #
179703次浏览 1220人参与
# 牛客AI文生图 #
21391次浏览 237人参与
# 职能管理面试记录 #
10773次浏览 59人参与
# 网易游戏笔试 #
6422次浏览 83人参与
# 腾讯音乐求职进展汇总 #
160527次浏览 1109人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务