ai应用开发学习路线（1）：ai扫盲

今年暑期连带日常我一共面试次数达近20次，其中热门的问题大多数为mcp，skill以及今年年初爆火的小龙虾等问题，一直以来我对ai的了解都是皮毛，并不深入，在入职之后我也做了很多skill相关的工作，这让我对ai相关的学习更加深入，也让我与身边懂ai与agent的朋友交流更多，与朋友一起总结了一个适合新手的ai应用学习路线

今天我就来从本质到实践给大家讲一讲ai应用的学习路线，目前我们这个路线在其他平台的收藏量很高，碍于篇幅，我们今天来分段讲解一下：

一：AI应用工程师 / Agent 到底是什么？

工程定义：

AI应用工程师 = 就是在传统后端的基础上接入大模型。

（这里面也会有并发，数据一致性，通信协议，本质上就是后端中的一种新型业务，很像传统的搜推工程）

Agent = 一个“能思考 + 能调用工具 + 能执行任务”的程序系统

本质拆解（核心四件套）

一个Agent =

1. 大脑（LLM）
2. 手脚（Tools / MCP）
3. 记忆（Memory）
4. 规划（Planning / Workflow）

后面的所有学习，本质都是在补这四个东西。

二：学习路线

阶段1：ai扫盲

LLM基础认知

你不用学算法，但必须知道：

- Transformer 架构这个要知道qkv和自注意力机制即可
- Token 是啥（影响成本）
- 上下文窗口（为什么会爆）
- 温度 / Top-p（控制风格）
- 幻觉（为什么会胡说）

科普网站推荐：[大语言模型智能体简介 | Prompt Engineering Guide](https://www.promptingguide.ai/zh/research/llm-agents)（这个网站具有最完善的ai知识）

阶段2：AI应用基础

学什么（强化版）

1. Prompt Engineering（不是写提示词，是写“接口协议”）

主要是为了控制LLM的输出！

重点：

- 结构化输出（JSON）
- Role + Task + Constraint
- 少即是多，因为你用越少的语言传递越多有效的信息，LLM推理结果就会更好。

示例：

```
你是一个音乐分析助手
输入：一首歌
输出：
{
  "bpm": "",
  "情绪": "",
  "风格": "",
  "结构": ""
}
```

2. RAG（非常重要）：让agent拥有你想要的知识

这对于后端工作者是一个很友好的工程化实践，会引入向量数据库，这种数据库在agent领域会非常常见。

为什么需要 RAG？

LLM的问题：

- 不知道你私有数据
- 容易幻觉
- 无法实时更新

RAG目前是agent技术栈中使用最广泛的，商业化最广泛的技术

详细RAG介绍：

（首先这里，想说一下，诸位可以试着去看论文，因为论文本身就是规范的工程化方案，而且有ai和翻译的情况下，看论文的难度仅次于两数之和不让用哈希表的难度）

奠基论文：https://arxiv.org/abs/2005.11401

前沿方案：https://arxiv.org/abs/2312.10997

最强解析：

[RAG帝王分析](https://app.notion.com/p/RAG-354e766aea9f8049ad24c84cce32924a?pvs=21)

---

下面的demo就不提供项目链接了，现在的AI这么厉害，大家直接可以试着vibocoding即可

任务一

做一个：

「知识库问答 Agent」

功能：

- 上传文档
- 选取文档向量化（Embedding）
- LLM回答基于文档回答
- 这里对于这个llm的回答提示词，可以锻炼一下自己写，尝试写三个不同风格的版本，看看输出结果是否相同，然后还可以根据结果进行评测。

到这里基本就可以算是入门了，因为如今agent最成熟的，认可度最广的就是RAG了，虽然他的步骤比较泛化，但是核心思想跟深度是很值得练习的，就算你下面所有的都不学，RAG技术有自己亲身实践过的一套链路，对于现在的很多agent岗位是完全可以接受的。

以上就是我们今天分享的内容，后续我还会分享动起来的agent即mcp，skill等内容以及agent的harness，大家敬请期待😊 #如何成为1个AI工程师？#  #ai就业#

ai应用开发学习路线（1）：ai扫盲

全站热榜

创作者周榜