ai应用开发学习路线(1):ai扫盲
今年暑期连带日常我一共面试次数达近20次,其中热门的问题大多数为mcp,skill以及今年年初爆火的小龙虾等问题,一直以来我对ai的了解都是皮毛,并不深入,在入职之后我也做了很多skill相关的工作,这让我对ai相关的学习更加深入,也让我与身边懂ai与agent的朋友交流更多,与朋友一起总结了一个适合新手的ai应用学习路线
今天我就来从本质到实践给大家讲一讲ai应用的学习路线,目前我们这个路线在其他平台的收藏量很高,碍于篇幅,我们今天来分段讲解一下:
一:AI应用工程师 / Agent 到底是什么?
工程定义:
AI应用工程师 = 就是在传统后端的基础上接入大模型。
(这里面也会有并发,数据一致性,通信协议,本质上就是后端中的一种新型业务,很像传统的搜推工程)
Agent = 一个“能思考 + 能调用工具 + 能执行任务”的程序系统
本质拆解(核心四件套)
一个Agent =
1. 大脑(LLM)
2. 手脚(Tools / MCP)
3. 记忆(Memory)
4. 规划(Planning / Workflow)
后面的所有学习,本质都是在补这四个东西。
二:学习路线
阶段1:ai扫盲
LLM基础认知
你不用学算法,但必须知道:
- Transformer 架构这个要知道qkv和自注意力机制即可
- Token 是啥(影响成本)
- 上下文窗口(为什么会爆)
- 温度 / Top-p(控制风格)
- 幻觉(为什么会胡说)
科普网站推荐:[大语言模型智能体简介 | Prompt Engineering Guide](https://www.promptingguide.ai/zh/research/llm-agents)(这个网站具有最完善的ai知识)
阶段2:AI应用基础
学什么(强化版)
1. Prompt Engineering(不是写提示词,是写“接口协议”)
主要是为了控制LLM的输出!
重点:
- 结构化输出(JSON)
- Role + Task + Constraint
- 少即是多,因为你用越少的语言传递越多有效的信息,LLM推理结果就会更好。
示例:
```
你是一个音乐分析助手
输入:一首歌
输出:
{
"bpm": "",
"情绪": "",
"风格": "",
"结构": ""
}
```
2. RAG(非常重要):让agent拥有你想要的知识
这对于后端工作者是一个很友好的工程化实践,会引入向量数据库,这种数据库在agent领域会非常常见。
为什么需要 RAG?
LLM的问题:
- 不知道你私有数据
- 容易幻觉
- 无法实时更新
RAG目前是agent技术栈中使用最广泛的,商业化最广泛的技术
详细RAG介绍:
(首先这里,想说一下,诸位可以试着去看论文,因为论文本身就是规范的工程化方案,而且有ai和翻译的情况下,看论文的难度仅次于两数之和不让用哈希表的难度)
奠基论文:https://arxiv.org/abs/2005.11401
前沿方案:https://arxiv.org/abs/2312.10997
最强解析:
[RAG帝王分析](https://app.notion.com/p/RAG-354e766aea9f8049ad24c84cce32924a?pvs=21)
---
下面的demo就不提供项目链接了,现在的AI这么厉害,大家直接可以试着vibocoding即可
任务一
做一个:
「知识库问答 Agent」
功能:
- 上传文档
- 选取文档向量化(Embedding)
- LLM回答基于文档回答
- 这里对于这个llm的回答提示词,可以锻炼一下自己写,尝试写三个不同风格的版本,看看输出结果是否相同,然后还可以根据结果进行评测。
到这里基本就可以算是入门了,因为如今agent最成熟的,认可度最广的就是RAG了,虽然他的步骤比较泛化,但是核心思想跟深度是很值得练习的,就算你下面所有的都不学,RAG技术有自己亲身实践过的一套链路,对于现在的很多agent岗位是完全可以接受的。
以上就是我们今天分享的内容,后续我还会分享动起来的agent即mcp,skill等内容以及agent的harness,大家敬请期待😊 #如何成为1个AI工程师?# #ai就业#
今天我就来从本质到实践给大家讲一讲ai应用的学习路线,目前我们这个路线在其他平台的收藏量很高,碍于篇幅,我们今天来分段讲解一下:
一:AI应用工程师 / Agent 到底是什么?
工程定义:
AI应用工程师 = 就是在传统后端的基础上接入大模型。
(这里面也会有并发,数据一致性,通信协议,本质上就是后端中的一种新型业务,很像传统的搜推工程)
Agent = 一个“能思考 + 能调用工具 + 能执行任务”的程序系统
本质拆解(核心四件套)
一个Agent =
1. 大脑(LLM)
2. 手脚(Tools / MCP)
3. 记忆(Memory)
4. 规划(Planning / Workflow)
后面的所有学习,本质都是在补这四个东西。
二:学习路线
阶段1:ai扫盲
LLM基础认知
你不用学算法,但必须知道:
- Transformer 架构这个要知道qkv和自注意力机制即可
- Token 是啥(影响成本)
- 上下文窗口(为什么会爆)
- 温度 / Top-p(控制风格)
- 幻觉(为什么会胡说)
科普网站推荐:[大语言模型智能体简介 | Prompt Engineering Guide](https://www.promptingguide.ai/zh/research/llm-agents)(这个网站具有最完善的ai知识)
阶段2:AI应用基础
学什么(强化版)
1. Prompt Engineering(不是写提示词,是写“接口协议”)
主要是为了控制LLM的输出!
重点:
- 结构化输出(JSON)
- Role + Task + Constraint
- 少即是多,因为你用越少的语言传递越多有效的信息,LLM推理结果就会更好。
示例:
```
你是一个音乐分析助手
输入:一首歌
输出:
{
"bpm": "",
"情绪": "",
"风格": "",
"结构": ""
}
```
2. RAG(非常重要):让agent拥有你想要的知识
这对于后端工作者是一个很友好的工程化实践,会引入向量数据库,这种数据库在agent领域会非常常见。
为什么需要 RAG?
LLM的问题:
- 不知道你私有数据
- 容易幻觉
- 无法实时更新
RAG目前是agent技术栈中使用最广泛的,商业化最广泛的技术
详细RAG介绍:
(首先这里,想说一下,诸位可以试着去看论文,因为论文本身就是规范的工程化方案,而且有ai和翻译的情况下,看论文的难度仅次于两数之和不让用哈希表的难度)
奠基论文:https://arxiv.org/abs/2005.11401
前沿方案:https://arxiv.org/abs/2312.10997
最强解析:
[RAG帝王分析](https://app.notion.com/p/RAG-354e766aea9f8049ad24c84cce32924a?pvs=21)
---
下面的demo就不提供项目链接了,现在的AI这么厉害,大家直接可以试着vibocoding即可
任务一
做一个:
「知识库问答 Agent」
功能:
- 上传文档
- 选取文档向量化(Embedding)
- LLM回答基于文档回答
- 这里对于这个llm的回答提示词,可以锻炼一下自己写,尝试写三个不同风格的版本,看看输出结果是否相同,然后还可以根据结果进行评测。
到这里基本就可以算是入门了,因为如今agent最成熟的,认可度最广的就是RAG了,虽然他的步骤比较泛化,但是核心思想跟深度是很值得练习的,就算你下面所有的都不学,RAG技术有自己亲身实践过的一套链路,对于现在的很多agent岗位是完全可以接受的。
以上就是我们今天分享的内容,后续我还会分享动起来的agent即mcp,skill等内容以及agent的harness,大家敬请期待😊 #如何成为1个AI工程师?# #ai就业#
全部评论
Mark
mark
相关推荐
点赞 评论 收藏
分享
今天 09:52
哈尔滨工程大学 Java 点赞 评论 收藏
分享
05-10 21:33
南京大学 Java 点赞 评论 收藏
分享

查看40道真题和解析