2025-11-05 09:19 深圳大学 Java 发布于广东

关注

从零到一：AI应用开发工程师学习路线

什么是AI应用开发工程师？

在梳理学习路线前，知道什么是AI应用开发工程师，快速建立对岗位的基本认知是非常有必要的。

AI应用开发工程师，也可以叫大模型应用开发工程师，主要负责将大模型的能力落地应用到实际产品和业务中。与AI算法岗不同，应用岗更偏向工程实现。AI应用开发岗不只是简单地调用大模型API，而是基于大模型构建一套可运行的系统。随着近年来大模型的火热发展，大模型应用开发岗逐渐成为了热门岗位。

岗位职责与招聘要求？

我相信大部分人学习AI应用是为了就业。所以在开始学习前，先了解招聘市场对AI应用开发岗的要求，知道我们实际工作中要做什么，需要具备哪些技能，建立起对应的人才画像。我们在学习的时候就可以有目的性地针对性准备了。

岗位职责

1.使用已有大模型接口（如 OpenAI、通义千问、飞书 aily）开发企业级 AI 应用，如：内部知识库、工具链、智能客服、智能问数

2.与产品经理、业务专家及后端工程师紧密合作，共同定义产品需求，并将AI能力无缝集成到现有平台中

3.AI Infra平台建设：参与或主导AI基础架构平台/工具链的设计与建设，包括但不限于CI/CD for Models（模型的持续集成与部署）、模型版本管理、在线实验（A/B测试）平台等，提升算法团队的迭代效率

4.研究行业专用小模型/垂直模型的训练和部署，负责相关领域的数据收集、清洗、送标、微调、训练、效果评估工作

任职要求

1.有计算机科学、机器学习，人工智能，数据科学或相关领域知识，本科以上学历，AI工作经验

2.编程语言：Python + FastAPI框架，使用Python构建高性能、高可用的后端API服务

3.深度学习框架：Pytorch / TensorFlow

4.向量数据库：Milvus、Faiss、ES、Chromdb

5.熟悉 AI 应用开发的核心技术要点，如 MCP、Function Call、Agent 架构设计、RAG 知识库构建与检索、长/短期记忆等，并能灵活运用

6.积极使用AI辅助编程：熟练使用至少一种AI编程助手，并乐于探索其提升工作效率的边界

加分项

1.有AI产品从0到1的落地经验

2.深刻理解主流大模型厂商（如 OpenAI、Qwen、Claude、LLaMA 等）产品特性及优劣，有深度或重度使用经验者优先

软技能

1.快速学习能力： AI领域日新月异，需要持续学习新技术和工具

2.产品思维：关注用户体验，理解业务目标，而不仅仅是技术实现

技术学习路线？

因为我本人是从Java后端转大模型应用开发的，所以我推荐的学习路线会有点”邪修“。很多人入门大模型，都是被庞大的算法学习内容给难住了，于是就半途而废。其实我们可以先从我们擅长的地方入手，先把项目跑起来，有了成就感，再慢慢研究它背后的原理。

1.编程语言基础

Python：无疑是目前AI应用开发最好的语言，拥有最好的生态。即使是从Java转型AI开发，我也建议学习Python，基于Python的技术栈进行开发。

FastAPI：是Python的Web框架，可以快速把大模型的能力封装成API，是集成业务的关键。

2.大模型应用基础

常见参数：如temperature、top_p、max_tokens，理解这些参数对生成结果的影响

提示词工程：学习如何设计清晰、结构化的提示词，让模型更好地理解任务意图，输出符合预期的内容

上下文工程：解决 “如何让模型记住对话历史” 以及 “如何克服模型的上下文长度限制” 的问题

大模型API：熟悉主流模型平台（如OpenAI、Qwen、DeepSeek等）的接口调用方式

3.AI开发框架

LangChain：目前最流行的大模型应用编排框架，支持组件化构建复杂AI工作流。

LangGraph：基于LangChain，适用于有状态、多环节的复杂任务流程设计。

LangSmith / LangFuse：用于调试、追踪和评估大模型应用的表现，是提升应用稳定性的必备工具。

LlamaIndex：专注于RAG场景的数据处理与检索增强，是构建知识库问答系统的利器。

4.大模型项目经验

Workflow：最基础的AI项目，通过多个节点构成完成某个功能的工作流，本质是 “将复杂任务拆解为可自动化的步骤”，如：AI自动审批

RAG：通过给大模型外挂知识库，让大模型基于知识库生成答案，如：智能客服、智能问数

Agent：能够自主规划、调用工具、并执行动作来达成目标的智能体，如Mauns

Fine Tuning：基于已有大模型，在特定领域进行微调，从而增强模型在这个领域的表现效果。微调用于改变模型的“知识”或“风格”，而提示工程和RAG主要用于引导和增强模型已有的能力

5.大模型底层基础

机器学习：了解基本概念与常见算法

深度学习：理解神经网络的基本结构与训练方式

NLP：学习词向量、Transformer架构等自然语言处理核心知识

这部分内容不必一开始就深入，可在实战中根据需要逐步补全。

6.AI Infra与工程化

当你成功构建了一个能在本地顺畅运行的AI应用后，下一个核心挑战就是：如何让它稳定、高效、可扩展地服务成百上千的用户？这就是AI基础设施与工程化要解决的问题。它不再只关注模型本身，而是关注承载模型应用的整个系统。这也是本身具备后端工程能力的程序员转行AI的优势所在。

7.微调与部署

Lora微调技术：学习参数高效微调方法，低成本适配特定任务。

Llama-Factory等微调工具：实践使用可视化工具快速完成模型定制

ollama / vLLM等部署方案：掌握本地化部署与高性能推理服务的搭建方法

学习建议？

AI应用岗与算法岗的区别？是否需要学习算法？

算法岗关注“造模型”

1.从零开始训练模型（Transformer、CNN、LSTM、Diffusion等）

2.研究优化算法、Loss函数、模型结构改进

3.熟悉数学（线性代数、概率论、微积分）和深度学习框架（PyTorch、TensorFlow）

应用岗关注“用模型”

1.调用大模型（API / 本地推理）完成具体任务

2.设计 RAG、Agent、Workflow 等应用逻辑

3.关注 Prompt 工程、上下文管理、模型集成、API编排、成本与性能

所以，应用岗不需要深入掌握模型训练算法、梯度传播、参数调优这些算法层知识，你的核心价值在于利用工程能力将AI模型转化为可靠的商业价值。但完全不了解算法层也不行。至少需要达到“能理解但不实现”的程度。

1.大模型工作原理的黑箱理解：知道 Transformer 怎么“看上下文”，什么是注意力机制

2.关键术语：token、embedding、context window、temperature、top_p

3.模型类型差异：理解 GPT 类模型、视觉模型（如 CLIP、Qwen-VL）、多模态模型各自擅长什么

4.推理层 vs 训练层：知道为什么你只调用推理 API，不必关心训练集和梯度

怎么入门AI应用开发？

我推荐按上面的学习路线进行学习。核心思想是：先具备编程基础，对大模型建立基础的认知，然后就可以直接动手做项目了，通过项目驱动学习。做了几个可以跑起来的项目之后，再去补充算法基础，对大模型的底层有进一步的认知。最后研究工程化、部署微调这些高阶知识，达到企业级AI应用岗要求。

为什么我建议都转成Python？

生态垄断：目前所有核心的AI框架（PyTorch, TensorFlow）、大模型库（Transformers）和应用开发框架（LangChain, LlamaIndex）都是为Python原生设计的，拥有最丰富、最即时的示例和社区支持。

开发效率： Python语法简洁，能让你快速将想法转化为代码，专注于AI逻辑本身，而不是语言细节。

以上每个技术点，展开来讲都是很深的技术。我会持续更新，与你一起在AI应用的方向上成长。

我是AI Rookie Guide，希望能成为你在AI浪潮中的指路明灯。

#AI##AI应用#

全部评论

推荐最新楼层

JeremyLi_

郑州大学算法工程师

求资料

1 回复分享

发布于 02-24 20:48 辽宁

goodbetter

北京交通大学 Java

你好，可以发一份大模型应用开发的学习资料吗

1 回复分享

发布于 2025-11-16 11:53 上海

希望奇迹发生的查理很想喝咖啡

江苏大学风控

up可以分享一下资料么？

点赞回复分享

发布于 04-06 11:33 江苏

牛客902461882号

深圳技术大学产品经理

求助一下项目该如何入手

点赞回复分享

发布于 2025-12-19 17:09 广东

拥抱太阳的高级磨洋工很俊朗

郑州大学 Java

有资料吗

点赞回复分享

发布于 2025-12-17 20:08 安徽

贝尔法斯特

东华大学人工智能

mark求资料

点赞回复分享

发布于 2025-12-06 16:24 上海

wvov7

北京邮电大学算法工程师

mark学习了

点赞回复分享

发布于 2025-11-21 20:28 北京

汤鸡佬

北京交通大学 Java

只能Python吗 typescript行不行

点赞回复分享

发布于 2025-11-10 15:28 北京

03-26 09:27

门头沟学院 Java

AI时代岗位活路全景图

刷到这个话题，发现很多同学对AI时代的岗位认知，还停留在“AI能写代码=程序员要失业”的表层焦虑里。作为在AI行业摸爬滚打了一年的开发，结合行业现状和招聘市场的真实需求，今天给大家做一份完整的「AI时代岗位活路全景图」，分6大类讲清楚：哪些岗位不仅不会被AI替代，还会在AI浪潮里迎来长期红利，核心壁垒是什么，入行需要什么能力，全是干货，没有一句废话。先给一个最核心的底层逻辑：AI能替代的，是标准化、重复性、低决策成本的执行类工作；永远替代不了的，是需要非标准化、深度思考、复杂决策、业务理解、人性洞察的工作。判断一个岗位有没有活路，就看它的核心价值，是执行，还是思考与决策。一、AI原生核心赛道：...

你觉得什么岗位会被AI替...

点赞评论收藏

04-10 19:33

大连理工大学 Java

字节剪映 ai应用开发

攒人品！！！ 大家都要拿到暑期实习的offer啊！！！项目一：1. 你这里的意图判断是怎么做的？直接交给模型做，还是这个用户的查询query做了一些其他处理。2. 为什么要设计这三层记忆架构，是一个通用的设计还是参考了什么论文。3. Agent 的评估是怎么做的4. 有没有评估过你的记忆架构，在没参考openclaw之前和之后的指标有什么变化，成功率有对比吗？5. 你之前向量检索加redis缓存是怎么做的？ redis健和值是什么？6. 新的记忆加到文件里 是直接append吗？ 覆盖？还是改写？7. 改的方式 模型改吗？模型调用editor去改文件是吗？8. 你觉得 redis+milvus向量存储 和mysql+文件系统+向量检索，他们的优劣如何？优点缺点分别是什么。9. 其实我比较感兴趣的是他们这两种方式的查询检索召回 效率的对比。10. 对于每一个用户，在系统中怎么保存这些不同用户的文档？11. 其实就是模型通过路径去读这些文件是吧，那如果两个人登了同一个账号，在同一时刻，这个文件会被两个不同的用户使用，在这个情况下，你们的系统如何处理？怎么解决这个问题？项目二：1. 你说你的文档准确率达到90%，具体做的改变是什么。2. 那为什么医院的问答项目里，不采用同样的实现3. 你说pdf表格密集，那假如用户就是问一个表格里，第二行是2025年，第三行是2024年，具体问2025年的值是多少，你的系统能做到吗？4. skill是自己写的吗 ，互相之间可以联动吗？5. 为什么不用skill-creator6. 你的数据集是怎么收集的，然后是怎么评估的呢？打分是谁在打分？人在打分 ，还是模型裁判员去打分？如果有很好用的模型裁判员，为什么不用裁判员模型7. 介绍一下KV cache8. 讲一下transfromer架构。算法题1. 字符串数字相减2. 字符串最长连续序列

查看21道真题和解析

点赞评论收藏

04-09 11:38

门头沟学院全栈开发

大模型Agent面试全攻略（附答题思路）

一、核心概念与架构篇Q1：请简述Agent的基本架构组成，并解释其与传统LLM Chain的区别。回答要点：Agent = LLM + 规划(Planning) + 记忆(Memory) + 工具使用(Tool Use)。区别：Chain是预定义的、线性的硬编码工作流。Agent具备“自主性”，它根据目标自发决定执行路径，通过推理循环（Reasoning Loop）不断调整策略。Q2：解释ReAct模式的工作原理。回答要点：ReAct (Reasoning + Acting)是Agent的基石。它将“思考”（Thought）和“行动”（Action）结合。LLM先生成一段推理，说明下一步要做什...

Agent面试会问什么？

点赞评论收藏

03-25 11:22

已编辑

门头沟学院算法工程师

AI infra应届春招

📍面试公司：京东infra一面（更新2026/03/25已挂）🕐面试时间：2026/03/23💻面试岗位：ai infra❓面试问题：零、查户口，问我啥时候毕业，哪里人，哪个专业，手头上有没有offer，面过其他什么公司？（简历上有但是会问）一、项目拷打（十分钟）二、八股（二十五分钟）1、讲一下大模型推理优化有些方法？                                      ——（这个问的很宽泛，可以从各方面回答）2、你刚刚说到有pageattention，这个具体是什么？               ——（上个问题的追问）3、Flashattention为什么能加速，计算过程是什么？4、你有讲到PD分离机制，那么如何实现调度队列？5、PD分离的时候chunk prefill是指同一个请求的PD插入吗？      ——（这里回答说A的prefill chunk过程中插入B的decoder，而不是A的decoder）6、C++的多态如何实现？7、你刚刚说的虚函数是怎么实现多态的，请具体说说看？8、你说了虚函数表，那么虚函数表里面的函数顺序是怎么样的？是按照声明顺序吗？   ——（这个问题我没答好）三、手撕（快排）（十五分钟）没写出来😭，其他排序都会写，就这个忘了，我又炸了。。。。。。/(ㄒoㄒ)/~~四、反问1、公式一问（我今天表现怎么样？对我有什么建议吗？）答：整体表现还可以，快排写不出来很不应该，我们这边很重视这个代码能力。（意思是寄/(ㄒoㄒ)/~~）2、他都这么说了，我也不好意思再问下去了。🙌面试感想：大概是寄了，就当积攒经验了，还有26届的同学还在找工作吗，可以交流交流看看。

查看10道真题和解析

点赞评论收藏

04-15 13:13

广西大学算法工程师

高德大模型算法开发一面(暑期)

1. 自我介绍2. 项目拷打3. Perplexity 的定义、公式和真正的使用边界是什么Perplexity 本质上是语言模型对测试序列平均不确定性的指数化表达。若测试集为(x1,…,xT),则 它等价于平均负对数似然的指数形式，值越低通常表示模型对数据分布拟合得越好。很多人只会背“越低越好”，但真正面试里要说明白：PPL 是训练分布拟合指标，不直接等价于问答质量、推理能力、事实性或者指令遵循能力。模型可能 PPL 更低，但在复杂推理或者对齐任务上不一定更强。4. 为什么不同 tokenizer 下的 Perplexity 不能直接横向比较因为 PPL 的分母是 token 数，而 toke...

AI-Agent面试实战...

点赞评论收藏

250

招聘动态

AI网申助手

网申字段一键填写

龙湖集团数字科技平台

2026届春季招聘&实习生招聘

阿里巴巴集团

2027届实习生校园招聘

招商银行数字金融训练营

火热报名中

联想

27届暑期实习

厦门银行

2026届春季校园招聘

联想

26届补录

27届校招宝典

滴滴

2027届秋招储备实习生招聘

快手

27届实习超多转正机会

全站热榜

创作者周榜

正在热议

# 华泰星战营，提前锁定校招offer #

# 总结:offer选择，我是怎么选的 #

287604次浏览 1566人参与