AI主理牛

04-15 16:23 牛客运营

发布于陕西

关注

大学生 AI Agent 入门实战

龙虾还没安装，现在又来到了Hermes时代了，这是AI讨论最火热的方向之一，下面教大家动手实操！速速mark住！简单上手，且免费对学生党友好！

一、为什么是 Hermes Agent？

2026 年 AI 圈有句话："模型智力已经在线，现在比拼的是 Harness（模型外围的运行时与基础设施）。"

翻译成人话：ChatGPT / Claude / DeepSeek 这种"模型"已经够聪明了，真正能拉开差距的，是你有没有能力把模型包装成一个能自己跑起来、会调工具、会记事、会自我改进的系统——这个系统就叫 Agent，承载它的基础设施就叫 Harness。

当前 Harness 生态分两类：

类型	代表	适合场景
纵深型	Claude Code、Cursor	深度工程开发，一来一往的精细交互
横向型	Hermes、OpenClaw	跨平台自动化、多任务 Agent

为什么推荐大学生从 Hermes 开始：

开源、免费：不用订阅 ChatGPT Plus（20美元/月），接 DeepSeek 免费模型，$5 VPS 就能跑
多平台：接 Telegram、Discord、Slack、飞书都行，做成自己的"私人助理"
代码可读：Python 为主，86k stars 的生产级项目，读起来比 Claude Code 友好
简历友好：搭一个完整 Agent 系统，比"用过 ChatGPT"强 3 个档次
自学习：内置 skills 自动创建循环，是当前最前沿的 Agent 设计模式之一

二、学习前必懂的核心概念：Harness 六大组件

这是整篇教程最重要的一节——先建立概念，再动手，否则你跑起来也看不懂。

Agent = Model + Harness

Harness 包含 6 个核心模块，Hermes 项目的目录和这 6 个模块几乎一一对应：

#	组件	作用（大白话）	Hermes 对应目录
1	Agentic Loop	Agent 的"心脏"——接到任务 → 思考 → 调工具 → 看结果 → 再思考，循环到搞定	`agent/`
2	Tool System	Agent 的"手脚"——能执行的外部动作（搜网页、跑代码、发消息）	`tools/`
3	Memory & Context	Agent 的"记忆"——跨对话记住你的信息，压缩长上下文	`honcho` 相关 + FTS5 搜索
4	Guardrails	Agent 的"缰绳"——该做什么不该做什么的权限控制	斜杠命令如 `/retry`、`/undo`、`/compress`
5	Hooks	Agent 的"守卫"——在关键时刻自动触发的钩子	`plugins/`、`cron/`
6	Session	Agent 的"会话连续性"——跨平台跨时间保持对话状态	`gateway/` 模块

记下这张表——面试时按这 6 个模块讲你的项目，立刻进入"工程师视角"而不是"API 调用者视角"。

三、30 天实操计划

第 1 周：跑起来，找感觉

目标：本地能跑，能对话，理解整个项目骨架。

Day 1：准备环境

# 装 Python 3.10+（已装可跳过）
python3 --version

# 克隆项目
git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent

# 建虚拟环境
python3 -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate

# 装依赖（大概需要 3-5 分钟）
pip install -e .

Day 2：接免费模型（DeepSeek）

DeepSeek 对新用户有免费额度，足够学习用。注册 https://platform.deepseek.com，拿到 API Key。

# 启动配置向导
hermes setup

# 或手动选择模型
hermes model
# 选择 openrouter 或直接配 deepseek 的 base_url

填入 API Key 后测试：

hermes
# 进入 CLI 后输入：帮我写一个 Python 的斐波那契数列函数

能看到流式输出就成功了。

Day 3-4：对照六大组件读代码

这是最重要的一步。 不要跳过。

# 列出主要目录
ls -la

# 重点读以下 3 个文件，每个读 30 分钟
# 1. agent/ 目录下的核心循环文件 —— 对应 Agentic Loop
# 2. tools/ 目录下随便挑 3 个工具看实现 —— 对应 Tool System
# 3. gateway/ 目录下的消息路由 —— 对应 Session

建议做读码笔记：每个模块用自己的话写 3 句总结，发朋友圈/牛客记录——这就是你简历的素材。

Day 5-7：跑通 1 个完整任务

在 CLI 里让 Hermes 完成一个工具调用任务，比如：

"帮我搜一下今天 arxiv 上关于 LLM Agent 的新论文，列出标题和摘要。"

观察它的行为：

它调用了哪个 tool？
它的 Agentic Loop 转了几圈？
失败时它怎么重试？

记录下来，这就是你面试时讲 Agentic Loop 的素材。

第 2 周：接 Telegram，让它为你工作

目标：让 Hermes 不只在终端里跑，而是成为你随时可用的 AI 助理。

步骤 1：创建 Telegram Bot

在 Telegram 找 @BotFather
发送 /newbot，按提示起名
拿到 Token（形如 123456:ABC-...）

步骤 2：启动 Gateway

# 在 Hermes 配置里填入 Telegram Token
hermes gateway

# 或者用 config 文件配置后后台运行

现在打开你的 Telegram，给自己的 Bot 发消息——Hermes 会回你。

步骤 3：用斜杠命令玩起来

在 Telegram 里直接用这些命令（和 CLI 一致）：

命令	作用
`/new`	开启新对话
`/model deepseek-chat`	切换模型
`/compress`	压缩上下文（防止超 token）
`/usage`	查看 token 消耗
`/retry`	重试上一步
`/undo`	撤销上一步

到这一步，你已经有了一个"随身 AI 助理"——等公交、吃饭、上课偷懒的时候都能用。

第 3 周：写自己的 Tool 和 Skill

目标：从"用户"升级到"开发者"。这一步最能证明你理解 Agent。

写一个自己的 Tool

挑一个你真实会用到的场景写，下面 3 个任选（或三个都写）：

场景 A：论文查重辅助 tool

写论文最头疼的就是查重——先把句子扔给搜索引擎看看网上有没有高度相似的。

# 在 tools/ 目录下新建 paper_similarity.py
from hermes_agent.tools import tool
import requests

@tool
def check_paper_similarity(sentence: str) -> dict:
    """在学术搜索引擎查这句话是否和已有文献高度相似，用于论文查重辅助。
    
    Args:
        sentence: 要检查的句子（建议 20-50 字）
    
    Returns:
        {'matched_sources': [...], 'similarity_hint': str}
    """
    # 用 Semantic Scholar / Google Scholar 的免费 API
    resp = requests.get(
        'https://api.semanticscholar.org/graph/v1/paper/search',
        params={'query': sentence, 'limit': 5, 'fields': 'title,abstract,url'}
    )
    papers = resp.json().get('data', [])
    return {
        'matched_sources': [{'title': p['title'], 'url': p.get('url')} for p in papers],
        'similarity_hint': f'找到 {len(papers)} 篇可能相关文献，请人工核对'
    }

用的时候直接说："帮我查一下这段话'深度学习在医学影像领域展现出显著优势……'有没有和已有论文高度重合"。

场景 B：代码执行 + 测试 tool

写 LeetCode、课程作业，最烦的是改完想测一下，还要切出去打开编辑器。

# tools/run_python.py
from hermes_agent.tools import tool
import subprocess, tempfile, os

@tool
def run_python_code(code: str, test_input: str = "") -> dict:
    """在隔离环境执行一段 Python 代码，返回输出和耗时。
    
    Args:
        code: 完整 Python 代码
        test_input: 可选，作为 stdin 传入
    
    Returns:
        {'stdout': str, 'stderr': str, 'elapsed_ms': int}
    """
    with tempfile.NamedTemporaryFile('w', suffix='.py', delete=False) as f:
        f.write(code)
        fpath = f.name
    import time
    t0 = time.time()
    try:
        r = subprocess.run(
            ['python3', fpath], input=test_input,
            capture_output=True, text=True, timeout=10
        )
        return {
            'stdout': r.stdout, 'stderr': r.stderr,
            'elapsed_ms': int((time.time()-t0)*1000)
        }
    finally:
        os.unlink(fpath)

用法："帮我写一个二分查找，写完直接跑一下测 [1,3,5,7,9] 查 7"——Hermes 会自己写代码、自己调用 tool 跑、看到输出后判断对错再改。这就是 Agent 的魔法。

场景 C：论文/博客 Markdown 拉取 + 总结 tool

读文献时很多链接要整理，手动复制粘贴太慢。

# tools/fetch_and_summarize.py
from hermes_agent.tools import tool
import requests
from bs4 import BeautifulSoup

@tool
def fetch_url_and_extract(url: str) -> dict:
    """抓取网页正文并返回纯文本，便于后续总结或引用。
    
    Args:
        url: 任意公开网页（论文 HTML 页、博客、新闻等）
    
    Returns:
        {'title': str, 'text': str, 'length': int}
    """
    resp = requests.get(url, timeout=15, headers={'User-Agent': 'Mozilla/5.0'})
    soup = BeautifulSoup(resp.text, 'html.parser')
    title = soup.title.string if soup.title else ''
    # 粗暴提取正文
    for tag in soup(['script', 'style', 'nav', 'footer']):
        tag.decompose()
    text = soup.get_text(separator='\n', strip=True)
    return {'title': title, 'text': text[:10000], 'length': len(text)}

用法："帮我读这篇 arxiv 的 HTML 版 https://arxiv.org/abs/2401.xxxxx，总结核心方法并列出 3 个可以延伸的研究问题"——一步到位。

重启 Hermes，任意一个 tool 写好后都可以自然语言调用：

hermes
# 然后对话：帮我查重这段话 xxx / 跑一下这段代码 / 总结这个链接

让 Hermes 自己创建 Skill

Skill 是 Hermes 独特的功能——完成一个复杂任务后，Agent 会自动把"怎么做"沉淀成 skill，下次直接复用。

触发方法：完成一个多步任务后说"把这个流程保存为 skill，以后我只要说'日报'，你就自动执行"。

查看已有 skills：

hermes skills
# 或 CLI 里 /skills

这就是黄佳文章里"Harness 闭合学习循环"的具体实现——你亲手触发过一次，就理解了这个设计哲学。

第 4 周：部署到 $5 VPS + 定时任务

目标：脱离本地电脑，Hermes 7×24 小时为你工作。

步骤 1：买 VPS

大学生选：

Vultr / DigitalOcean / Linode：$5/月起，选最便宜的
阿里云学生机：9.9 元/月（有学生认证）
甲骨文永久免费：0 元，但需要科学网络注册

拿到 IP、SSH 用户名和密码。

步骤 2：把 Hermes 搭到 VPS

ssh root@你的IP
git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
pip install -e .
hermes setup

# 后台运行
nohup hermes gateway > hermes.log 2>&1 &

步骤 3：设置定时任务（Cron）

Hermes 内置 cron 调度。举例：每天早上 8 点把 arxiv 上 LLM Agent 的新论文发到你 Telegram：

hermes cron add "每天 8:00 搜索 arxiv 上昨天发的 LLM Agent 相关论文，摘要前 5 篇发到我的 Telegram"

这一步做完——你的简历就可以写：

基于 Hermes Agent 框架，部署并二次开发 AI Agent 系统，集成 Telegram + DeepSeek + 自研 tool，实现 7×24 自动化信息推送与任务调度。熟悉 Agentic Loop、Tool System、Memory 管理、Guardrails 等 Harness 核心组件设计。

四、面试杀伤力话术（按"不要说 / 要说"对比）

问题	❌ 不要说	✅ 要说
"你用过 AI 吗？"	"我用过 ChatGPT 写代码"	"我搭了一个 Hermes Agent 跑在 VPS 上，接了 Telegram 和 DeepSeek，每天自动做 XX。"
"你觉得 AI 会取代程序员吗？"	"不会吧/会吧"	"会取代码农，不会取代工程师。工程师的价值在于驾驭复杂系统——我在做 Hermes 二次开发时就发现，真正难的不是调用 API，而是处理上下文爆炸、无限循环、权限失控这些落地难题。"
"能讲一下 Agent 的工作原理吗？"	"它能调工具…"	"Agent = Model + Harness。Harness 六大核心组件是 Agentic Loop、Tool System、Memory、Guardrails、Hooks、Session。以 Hermes 为例……"（画图）
"Claude Code 和 Hermes 有什么区别？"	"没了解过"	"Claude Code 是纵深型 Harness，强在精细的一来一往工程；Hermes 是横向型，强在跨平台自动化。设计权衡在于 XX。"

五、踩坑预警

Q1：装依赖报错？ A：大概率是 Python 版本低于 3.10。用 pyenv 装一个 3.11.x 再试。

Q2：DeepSeek 返回太慢？ A：DeepSeek 官方 API 高峰期会慢。可以换 OpenRouter（聚合所有模型的中转服务），同样免费额度。

Q3：Telegram Bot 在国内收不到消息？ A：你的 VPS 需要能访问 Telegram API（非大陆 IP）。甲骨文永久免费机（日本/首尔）正好合适。

Q4：代码看不懂？ A：不要硬读。按以下优先级：

先看 README + docs
再读 agent/ 核心循环（最多 500 行）
工具系统挑 1 个具体 tool 看实现
其他模块等用到再看

Q5：我英语不好，文档看不下去？ A：把文档丢给 Hermes 自己："把 hermes-agent 的 README 翻译成中文并总结重点"——这是 Agent 最擅长的任务，而且你马上就能体验"Agent 替你学习"的感觉。

六、彩蛋：进阶方向

学完这 30 天后，你可以继续探索：

读 Claude Code 泄露源码：对照 Hermes 的横向型设计，理解纵深型的不同
读 DeepMind Agents 论文：Same model, different harness → big performance gap 的经典实验
参与 Hermes 开源贡献：从改文档错别字开始，issue 里挑"good first issue"
自己搭一个垂直 Agent：比如"新闻收集Agent"、"周报自动生成 Agent"（这个美团最近面试题出过）
学习 Atropos：Hermes 集成的 RL 训练环境，用于 Agent 模型微调