Hermes Agent Skills 进阶全攻略: 从 SKILL.md 到 GEPA 自我进化
2026 年初,Nous Research 发布的 Hermes Agent 两个月内 GitHub Star 突破 16 万,核心理念是 "the agent that grows with you"——Agent 会随使用越来越懂你。底层支撑这一切的,正是其 Skills(技能)系统:一套有标准、可进化、跨会话持久的程序性记忆,而非一次性 Prompt。
面向已部署 Hermes 的开发者与 AI 工程师,本文覆盖进阶全貌:① Skills 与 Memory、Prompt 的本质区别及渐进式加载如何控 Token;② SKILL.md 格式、Skill Bundles、条件激活与 Tap 发布;③ GEPA + DSPy 五阶段自我进化与社区生态。读完可独立编写、打包、发布并进化自己的技能资产。
01 为什么 Hermes Agent 的技能系统值得单独深入研究?
入门教程解决「怎么装」,进阶要解决「怎么让 Agent 越用越强」。Hermes Skills 的独特价值在于四点:
- 按需加载:激活前零 Token 消耗,靠 Progressive Disclosure 控制成本。
- 开放标准:遵循 agentskills.io,Hermes、Claude Code、Cursor 可跨平台复用。
- 可组合:Skill Bundles 一条斜杠命令加载整套工作流。
- 可进化:GEPA 算法分析执行轨迹,自动改进 SKILL.md 文本,无需动模型权重。
进阶用户常见的四个痛点:
- Token 膨胀:把所有 SOP 塞进系统提示,每次会话白白烧掉数千 Token。
- 技能误激活:description 写得太模糊,LLM 在无关场景加载错误技能。
- 工作流碎片化:PR 审查、TDD、部署要逐个
/skill-name,效率低。 - 团队无法共享:技能散落在个人目录,换机器或新同事 onboarding 成本高。
02 Skills、Memory、Prompt 三者有什么区别?
| 维度 | 普通 Prompt | Memory(记忆) | Skills(技能) |
|---|---|---|---|
| 持久性 | 当前对话 | 跨会话,永久 | 跨会话,永久 |
| 加载时机 | 每次都在上下文中 | 每次会话自动注入 | 按需加载 |
| Token 成本 | 每次消耗 | 小而稳定 | 激活前零消耗 |
| 内容类型 | 任意意图描述 | 用户偏好/事实 | 程序性步骤 |
| 谁来维护 | 用户手动 | Agent 自动 | 用户 + Agent 均可 |
| 可共享性 | 不方便 | 私有 | 可发布为社区 Tap |
记忆口诀:Prompt = 便利贴(当次有效);Memory = 便签本(永久笔记,随时在手边);Skill = SOP 手册(步骤化流程,需要时翻阅)。
Skills 与 MCP 互补:MCP 提供工具接口(如数据库访问),Skill 教 Agent如何正确使用该工具完成迁移等任务。
03 SKILL.md 格式深度解析与渐进式加载
所有 Hermes Skills 遵循 agentskills.io 开放标准。基础 frontmatter 结构如下:
---
name: my-skill
description: |
Use when the user needs to [...].
version: 1.0.0
license: MIT
compatibility: Requires git, docker
allowed-tools: Bash(git:*) Read
metadata:
hermes:
tags: [devops, automation]
category: software-development
related_skills: [github-pr-workflow]
requires_toolsets: [terminal]
fallback_for_toolsets: [web]
---
# My Skill Title
## Overview / When to Use / Procedure / Common Pitfalls / Verification Checklist
推荐目录结构:
my-category/my-skill/
├── SKILL.md # 核心步骤,建议 ≤500 行
├── references/ # API 参考,按需加载
├── templates/ # 可复用模板
└── scripts/ # Agent 可直接执行的脚本
| 层级 | 内容 | 触发时机 | Token 成本 |
|---|---|---|---|
| Level 0 | name + description | 每次会话开始,所有技能 | 全部技能合计约 3K |
| Level 1 | 完整 SKILL.md 正文 | /skill-name 或 LLM 判断需要 |
取决于文件长度 |
| Level 2 | references/ scripts/ 文件 | 执行时 LLM 判断需要 | 按需,单文件 |
写作要点:description 是 Level 0 的全部信息,写清「什么时候用」比「是什么」更重要;SKILL.md 建议含 Overview、When to Use、Procedure、Common Pitfalls、Verification Checklist 五段。可用 skills-ref validate ./my-skill 验证格式合规。
04 Skill Bundles:一条命令触发完整工作流
Skill Bundles 是 Hermes 2026 新增特性:轻量 YAML 把多个技能打包成一个斜杠命令,执行 /bundle-name 时所有列出的技能同时加载。
文件位置:~/.hermes/skill-bundles/<slug>.yaml
name: backend-dev
description: Full backend feature workflow — code review, TDD, and PR management.
skills:
- github-code-review
- test-driven-development
- github-pr-workflow
instruction: |
Always write failing tests first before implementation.
Never push directly to main.
进阶场景:研究员工工作流可打包 arxiv、deep-research、plan、excalidraw;MLOps 部署可打包 vllm、llama-cpp、github-pr-workflow、systematic-debugging。
优先级规则:Bundle 与单个 Skill 同名时 Bundle 优先;未安装的 Skill 跳过不报错并提示缺失;Bundle 不修改系统提示,不会导致 Prompt Cache 失效。
hermes bundles create backend-dev \
--skills github-code-review,test-driven-development,github-pr-workflow \
--instruction "Always write failing tests first"
05 条件激活:让技能智能感知环境
在 metadata.hermes 下配置四种激活规则,技能可根据工具可用性自动显示或隐藏:
| 字段 | 行为逻辑 |
|---|---|
requires_toolsets |
列出的工具集不存在时,隐藏此技能 |
requires_tools |
列出的工具不存在时,隐藏此技能 |
fallback_for_toolsets |
列出的工具集存在时,隐藏此技能(备选方案) |
fallback_for_tools |
列出的工具存在时,隐藏此技能 |
经典场景:DuckDuckGo 搜索技能设置 fallback_for_tools: [web_search]——当用户配置了 FIRECRAWL_KEY / BRAVE_SEARCH_KEY 时付费 web_search 激活,DuckDuckGo 自动隐藏省 Token;API 不可用时备选自动浮现。
平台感知:telegram-notify 可设 requires_toolsets: [messaging] 与 platforms: [telegram, discord];通过 hermes skills TUI 可为 CLI、Telegram、Discord 独立开关技能。
06 Skills Hub 与开源社区生态
官方安装渠道:
hermes skills install official/research/arxiv
hermes skills install https://example.com/SKILL.md --name my-skill
hermes skills install github:openai/skills/k8s
hermes skills tap add github:my-org/my-skills
| 仓库 | 亮点 |
|---|---|
| awesome-hermes-skills | 精选生产级技能,含 Deep Research、MLOps、Apple 集成,23 个技能集成 GitHub Copilot |
| hermeshub | 社区注册中心,安全扫描认证,支持 API 与市场 |
| ai-agent-skills | 191 个技能、28 分类,Hermes/Claude Code/Cursor 一键安装 |
| hermes-agent | 官方权威来源,含所有内置 Skills 与编写规范 |
agentskills.io 意味着技能可在 Hermes、Claude Code、Cursor、OpenCode 间跨平台使用,资产不绑定单一平台。
07 发布你自己的 Skill Tap:团队与社区共享六步落地
通过 GitHub 仓库作为 Tap,团队或社区可订阅你的技能集。推荐仓库结构:
my-skills-tap/
├── skills.sh.json # 分类配置(可选)
├── mlops/vllm-deploy/SKILL.md
├── research/paper-summarizer/SKILL.md
└── README.md
- 规划分类:按 MLOps、Research 等域组织目录,编写
skills.sh.json控制 Hub 展示分组。 - 编写 SKILL.md:每个技能独立目录,通过
skills-ref validate校验。 - 推送 GitHub 仓库:公开或私有(私有需 Token)。
- 团队成员订阅:
hermes skills tap add github:your-org/your-skills-tap。 - 定期更新:
hermes skills tap update拉取最新技能。 - 版本管理:将
~/.hermes/skills/纳入 Git,跨设备git pull && hermes skills reset同步。
hermes skills tap add github:your-org/private-skills --token $GH_TOKEN
hermes skills tap list
hermes skills tap update
08 Self-Evolving Skills:GEPA + DSPy 让技能自动进化
GEPA(Genetic-Pareto Prompt Evolution) 是 2026 年 ICLR Oral 成果,集成于 hermes-agent-self-evolution。核心思路:不微调模型权重,通过分析执行轨迹、生成变体、多目标帕累托优化改进技能文本。每次优化约 $2–10(纯 API,无需 GPU)。
五阶段进化流程:① 执行轨迹收集(SQLite);② 反思式失败分析(可操作侧信息);③ 靶向变异(10–20 个 SKILL.md 变体);④ 多目标帕累托评估(成功率 × Token 效率 × 速度);⑤ 人工审查 PR 后上线。
export HERMES_AGENT_PATH=~/.hermes
python -m evolution.skills.evolve_skill \
--skill github-code-review \
--iterations 10 \
--eval-source sessiondb
四大安全护栏:全量测试套件 100% 通过;Skills ≤ 15KB、工具描述 ≤ 500 字符;Prompt 缓存兼容;语义保留检查不偏离原始目的。
| 阶段 | 优化目标 | 状态 |
|---|---|---|
| Phase 1 | Skill 文件(SKILL.md) | 已实现 |
| Phase 2 | 工具描述 | 计划中 |
| Phase 3 | 系统提示片段 | 计划中 |
| Phase 4 | 工具实现代码 | 计划中 |
| Phase 5 | 持续改进循环(全自动) | 计划中 |
Skills 遵循 agentskills.io,可将 Claude Code 或 Gemini CLI 轨迹喂给优化器:--eval-source mixed --trace-dirs ~/.claude/traces,~/.hermes/sessions。
09 Plugin 技能与进阶编写技巧
插件将技能打包为命名空间 plugin:skill:不出现在默认 skills_list、仅用户明确调用时激活、插件内技能可相互引用。加载 skill_view("superpowers:writing-plans") 时会展示同插件兄弟技能。
description 决定激活精度:避免「Helps with code」这类模糊写法;应写清触发条件与排除场景。
Pitfalls 是质量分水岭:须含具体失败模式、根因与修复步骤(如 CSS selector 脆弱性、GitHub API 限流、大 diff Token 溢出)。
脚本化:在 Procedure 中引用 scripts/ 下可执行脚本,失败时 fallback 到 references/manual-extract.md。
| 大小 | 建议 |
|---|---|
| < 500 行 | 全部放在 SKILL.md |
| 500–1000 行 | 详细资料移至 references/ |
| > 1000 行 | 强烈建议拆分,考虑是否为两个技能 |
| > 15KB | 超过 GEPA 限制,必须拆分 |
Agent 可通过 skill_manage 动态 patch 或 create 技能;在 config.yaml 设 skills.agent_writes_require_approval: true 开启人工审批门。
10 实战案例:技术博客工作流 Skills 设计
构建 blog-workflow Bundle,一键加载 SEO 调研、大纲生成、代码校验、双语检查、发布技能:
name: blog-workflow
description: Full tech blog writing workflow.
skills:
- seo-keyword-research
- outline-generator
- code-example-validator
- bilingual-checker
- publish-to-platform
instruction: |
Always research SEO keywords before writing.
Ensure all code examples are tested and runnable.
Generate both Chinese and English title options.
自定义 seo-keyword-research 技能应设 requires_toolsets: [web],流程含:识别主题 → 中文长尾(「X 怎么用」「X 教程」)→ 英文长尾(「X tutorial」「X vs Y」)→ 交叉参考掘金/Dev.to/HN 热榜 → 输出 3–5 主词 + 10–15 长尾矩阵。注意中英文受众搜索习惯不同,技术术语译法需按目标平台校验。
11 Hermes Agent Skills 常见问题 FAQ
- Skills 和 MCP 有什么区别? Skills 是程序性知识文档,MCP 是工具接口;两者互补。
- 改了 Skill 为何还用旧版? 当前会话不生效,需
/reset新会话,或安装加--now(会导致 Prompt Cache 失效)。 - GEPA 进化安全吗? 四大护栏 + 人工 PR 审查;仍建议 review 每个 diff。
- Claude Code 如何复用? 复制 SKILL.md 到
~/.claude/skills/,或用 ai-agent-skills 一键多端安装。 - 中文内容影响 Token? 中文每字约 1–1.5 token;description 建议保留英文或中英双语,LLM 匹配更精确。
12 关键数据与 JEXCLOUD 收束
- GitHub Star:Hermes Agent 2026 年初发布,两个月内突破 16 万 Star。
- Level 0 Token:全部技能 name+description 合计约 3K Token/会话。
- GEPA 单次成本:约 $2–10,纯 API 调用,无需 GPU。
- GEPA 大小限制:Skills ≤ 15KB,工具描述 ≤ 500 字符。
- 社区规模:kevinnft/ai-agent-skills 含 191 个技能、28 分类;hermeshub 166 Star 含安全扫描。
跑 Hermes Agent 与 GEPA 进化流水线,需要 7×24 在线、低延迟的 macOS 宿主。树莓派内存不足、共享 VPS 超卖导致长连接中断、家用宽带抖动——这些都会让 Skills 进化轨迹收集与 Gateway 常驻打折扣。
对于需要稳定运行 Hermes Gateway、持续收集 sessiondb 轨迹并执行 GEPA 迭代的生产环境,JEXCLOUD 多区域裸金属 Mac 是更优解:独占 Apple Silicon、7×24 在线、按月弹性扩缩,120 秒交付节点。具体配置与价格见 JEXCLOUD 定价页。