AI Agent 2026.06.18

Hermes Agent Skills 进阶全攻略: 从 SKILL.md 到 GEPA 自我进化

2026 年初,Nous Research 发布的 Hermes Agent 两个月内 GitHub Star 突破 16 万,核心理念是 "the agent that grows with you"——Agent 会随使用越来越懂你。底层支撑这一切的,正是其 Skills(技能)系统:一套有标准、可进化、跨会话持久的程序性记忆,而非一次性 Prompt。

面向已部署 Hermes 的开发者与 AI 工程师,本文覆盖进阶全貌:① Skills 与 Memory、Prompt 的本质区别及渐进式加载如何控 Token;② SKILL.md 格式、Skill Bundles、条件激活与 Tap 发布;③ GEPA + DSPy 五阶段自我进化与社区生态。读完可独立编写、打包、发布并进化自己的技能资产。

01 为什么 Hermes Agent 的技能系统值得单独深入研究?

入门教程解决「怎么装」,进阶要解决「怎么让 Agent 越用越强」。Hermes Skills 的独特价值在于四点:

  • 按需加载:激活前零 Token 消耗,靠 Progressive Disclosure 控制成本。
  • 开放标准:遵循 agentskills.io,Hermes、Claude Code、Cursor 可跨平台复用。
  • 可组合:Skill Bundles 一条斜杠命令加载整套工作流。
  • 可进化:GEPA 算法分析执行轨迹,自动改进 SKILL.md 文本,无需动模型权重。

进阶用户常见的四个痛点:

  • Token 膨胀:把所有 SOP 塞进系统提示,每次会话白白烧掉数千 Token。
  • 技能误激活:description 写得太模糊,LLM 在无关场景加载错误技能。
  • 工作流碎片化:PR 审查、TDD、部署要逐个 /skill-name,效率低。
  • 团队无法共享:技能散落在个人目录,换机器或新同事 onboarding 成本高。

02 Skills、Memory、Prompt 三者有什么区别?

Skills vs Memory vs Prompt 对比
维度 普通 Prompt Memory(记忆) Skills(技能)
持久性 当前对话 跨会话,永久 跨会话,永久
加载时机 每次都在上下文中 每次会话自动注入 按需加载
Token 成本 每次消耗 小而稳定 激活前零消耗
内容类型 任意意图描述 用户偏好/事实 程序性步骤
谁来维护 用户手动 Agent 自动 用户 + Agent 均可
可共享性 不方便 私有 可发布为社区 Tap

记忆口诀:Prompt = 便利贴(当次有效);Memory = 便签本(永久笔记,随时在手边);Skill = SOP 手册(步骤化流程,需要时翻阅)。

Skills 与 MCP 互补:MCP 提供工具接口(如数据库访问),Skill 教 Agent如何正确使用该工具完成迁移等任务。

03 SKILL.md 格式深度解析与渐进式加载

所有 Hermes Skills 遵循 agentskills.io 开放标准。基础 frontmatter 结构如下:

SKILL.md
---
name: my-skill
description: |
  Use when the user needs to [...].
version: 1.0.0
license: MIT
compatibility: Requires git, docker
allowed-tools: Bash(git:*) Read
metadata:
  hermes:
    tags: [devops, automation]
    category: software-development
    related_skills: [github-pr-workflow]
    requires_toolsets: [terminal]
    fallback_for_toolsets: [web]
---

# My Skill Title
## Overview / When to Use / Procedure / Common Pitfalls / Verification Checklist

推荐目录结构:

~/.hermes/skills/
my-category/my-skill/
├── SKILL.md              # 核心步骤,建议 ≤500 行
├── references/           # API 参考,按需加载
├── templates/            # 可复用模板
└── scripts/              # Agent 可直接执行的脚本
Progressive Disclosure 三级加载机制
层级 内容 触发时机 Token 成本
Level 0 name + description 每次会话开始,所有技能 全部技能合计约 3K
Level 1 完整 SKILL.md 正文 /skill-name 或 LLM 判断需要 取决于文件长度
Level 2 references/ scripts/ 文件 执行时 LLM 判断需要 按需,单文件

写作要点:description 是 Level 0 的全部信息,写清「什么时候用」比「是什么」更重要;SKILL.md 建议含 Overview、When to Use、Procedure、Common Pitfalls、Verification Checklist 五段。可用 skills-ref validate ./my-skill 验证格式合规。

04 Skill Bundles:一条命令触发完整工作流

Skill Bundles 是 Hermes 2026 新增特性:轻量 YAML 把多个技能打包成一个斜杠命令,执行 /bundle-name 时所有列出的技能同时加载

文件位置:~/.hermes/skill-bundles/<slug>.yaml

backend-dev.yaml
name: backend-dev
description: Full backend feature workflow — code review, TDD, and PR management.
skills:
  - github-code-review
  - test-driven-development
  - github-pr-workflow
instruction: |
  Always write failing tests first before implementation.
  Never push directly to main.

进阶场景:研究员工工作流可打包 arxiv、deep-research、plan、excalidraw;MLOps 部署可打包 vllm、llama-cpp、github-pr-workflow、systematic-debugging。

优先级规则:Bundle 与单个 Skill 同名时 Bundle 优先;未安装的 Skill 跳过不报错并提示缺失;Bundle 不修改系统提示,不会导致 Prompt Cache 失效。

CLI
hermes bundles create backend-dev \
  --skills github-code-review,test-driven-development,github-pr-workflow \
  --instruction "Always write failing tests first"

05 条件激活:让技能智能感知环境

metadata.hermes 下配置四种激活规则,技能可根据工具可用性自动显示或隐藏:

条件激活字段与行为
字段 行为逻辑
requires_toolsets 列出的工具集不存在时,隐藏此技能
requires_tools 列出的工具不存在时,隐藏此技能
fallback_for_toolsets 列出的工具集存在时,隐藏此技能(备选方案)
fallback_for_tools 列出的工具存在时,隐藏此技能

经典场景:DuckDuckGo 搜索技能设置 fallback_for_tools: [web_search]——当用户配置了 FIRECRAWL_KEY / BRAVE_SEARCH_KEY 时付费 web_search 激活,DuckDuckGo 自动隐藏省 Token;API 不可用时备选自动浮现。

平台感知:telegram-notify 可设 requires_toolsets: [messaging]platforms: [telegram, discord];通过 hermes skills TUI 可为 CLI、Telegram、Discord 独立开关技能。

06 Skills Hub 与开源社区生态

官方安装渠道:

hermes skills
hermes skills install official/research/arxiv
hermes skills install https://example.com/SKILL.md --name my-skill
hermes skills install github:openai/skills/k8s
hermes skills tap add github:my-org/my-skills
值得关注的开源技能仓库
仓库 亮点
awesome-hermes-skills 精选生产级技能,含 Deep Research、MLOps、Apple 集成,23 个技能集成 GitHub Copilot
hermeshub 社区注册中心,安全扫描认证,支持 API 与市场
ai-agent-skills 191 个技能、28 分类,Hermes/Claude Code/Cursor 一键安装
hermes-agent 官方权威来源,含所有内置 Skills 与编写规范

agentskills.io 意味着技能可在 Hermes、Claude Code、Cursor、OpenCode 间跨平台使用,资产不绑定单一平台。

07 发布你自己的 Skill Tap:团队与社区共享六步落地

通过 GitHub 仓库作为 Tap,团队或社区可订阅你的技能集。推荐仓库结构:

my-skills-tap/
my-skills-tap/
├── skills.sh.json          # 分类配置(可选)
├── mlops/vllm-deploy/SKILL.md
├── research/paper-summarizer/SKILL.md
└── README.md
  1. 规划分类:按 MLOps、Research 等域组织目录,编写 skills.sh.json 控制 Hub 展示分组。
  2. 编写 SKILL.md:每个技能独立目录,通过 skills-ref validate 校验。
  3. 推送 GitHub 仓库:公开或私有(私有需 Token)。
  4. 团队成员订阅hermes skills tap add github:your-org/your-skills-tap
  5. 定期更新hermes skills tap update 拉取最新技能。
  6. 版本管理:将 ~/.hermes/skills/ 纳入 Git,跨设备 git pull && hermes skills reset 同步。
Tap 管理
hermes skills tap add github:your-org/private-skills --token $GH_TOKEN
hermes skills tap list
hermes skills tap update

08 Self-Evolving Skills:GEPA + DSPy 让技能自动进化

GEPA(Genetic-Pareto Prompt Evolution) 是 2026 年 ICLR Oral 成果,集成于 hermes-agent-self-evolution。核心思路:不微调模型权重,通过分析执行轨迹、生成变体、多目标帕累托优化改进技能文本。每次优化约 $2–10(纯 API,无需 GPU)。

五阶段进化流程:① 执行轨迹收集(SQLite);② 反思式失败分析(可操作侧信息);③ 靶向变异(10–20 个 SKILL.md 变体);④ 多目标帕累托评估(成功率 × Token 效率 × 速度);⑤ 人工审查 PR 后上线。

evolve_skill
export HERMES_AGENT_PATH=~/.hermes
python -m evolution.skills.evolve_skill \
    --skill github-code-review \
    --iterations 10 \
    --eval-source sessiondb

四大安全护栏:全量测试套件 100% 通过;Skills ≤ 15KB、工具描述 ≤ 500 字符;Prompt 缓存兼容;语义保留检查不偏离原始目的。

官方五阶段进化路线图
阶段 优化目标 状态
Phase 1 Skill 文件(SKILL.md) 已实现
Phase 2 工具描述 计划中
Phase 3 系统提示片段 计划中
Phase 4 工具实现代码 计划中
Phase 5 持续改进循环(全自动) 计划中

Skills 遵循 agentskills.io,可将 Claude Code 或 Gemini CLI 轨迹喂给优化器:--eval-source mixed --trace-dirs ~/.claude/traces,~/.hermes/sessions

09 Plugin 技能与进阶编写技巧

插件将技能打包为命名空间 plugin:skill:不出现在默认 skills_list、仅用户明确调用时激活、插件内技能可相互引用。加载 skill_view("superpowers:writing-plans") 时会展示同插件兄弟技能。

description 决定激活精度:避免「Helps with code」这类模糊写法;应写清触发条件与排除场景。

Pitfalls 是质量分水岭:须含具体失败模式、根因与修复步骤(如 CSS selector 脆弱性、GitHub API 限流、大 diff Token 溢出)。

脚本化:在 Procedure 中引用 scripts/ 下可执行脚本,失败时 fallback 到 references/manual-extract.md

技能大小控制建议
大小 建议
< 500 行 全部放在 SKILL.md
500–1000 行 详细资料移至 references/
> 1000 行 强烈建议拆分,考虑是否为两个技能
> 15KB 超过 GEPA 限制,必须拆分

Agent 可通过 skill_manage 动态 patch 或 create 技能;在 config.yamlskills.agent_writes_require_approval: true 开启人工审批门。

10 实战案例:技术博客工作流 Skills 设计

构建 blog-workflow Bundle,一键加载 SEO 调研、大纲生成、代码校验、双语检查、发布技能:

blog-workflow.yaml
name: blog-workflow
description: Full tech blog writing workflow.
skills:
  - seo-keyword-research
  - outline-generator
  - code-example-validator
  - bilingual-checker
  - publish-to-platform
instruction: |
  Always research SEO keywords before writing.
  Ensure all code examples are tested and runnable.
  Generate both Chinese and English title options.

自定义 seo-keyword-research 技能应设 requires_toolsets: [web],流程含:识别主题 → 中文长尾(「X 怎么用」「X 教程」)→ 英文长尾(「X tutorial」「X vs Y」)→ 交叉参考掘金/Dev.to/HN 热榜 → 输出 3–5 主词 + 10–15 长尾矩阵。注意中英文受众搜索习惯不同,技术术语译法需按目标平台校验。

11 Hermes Agent Skills 常见问题 FAQ

  • Skills 和 MCP 有什么区别? Skills 是程序性知识文档,MCP 是工具接口;两者互补。
  • 改了 Skill 为何还用旧版? 当前会话不生效,需 /reset 新会话,或安装加 --now(会导致 Prompt Cache 失效)。
  • GEPA 进化安全吗? 四大护栏 + 人工 PR 审查;仍建议 review 每个 diff。
  • Claude Code 如何复用? 复制 SKILL.md 到 ~/.claude/skills/,或用 ai-agent-skills 一键多端安装。
  • 中文内容影响 Token? 中文每字约 1–1.5 token;description 建议保留英文或中英双语,LLM 匹配更精确。

延伸阅读官方文档中文文档GEPA 算法DSPy 框架

12 关键数据与 JEXCLOUD 收束

  • GitHub Star:Hermes Agent 2026 年初发布,两个月内突破 16 万 Star。
  • Level 0 Token:全部技能 name+description 合计约 3K Token/会话。
  • GEPA 单次成本:约 $2–10,纯 API 调用,无需 GPU。
  • GEPA 大小限制:Skills ≤ 15KB,工具描述 ≤ 500 字符。
  • 社区规模:kevinnft/ai-agent-skills 含 191 个技能、28 分类;hermeshub 166 Star 含安全扫描。

跑 Hermes Agent 与 GEPA 进化流水线,需要 7×24 在线、低延迟的 macOS 宿主。树莓派内存不足、共享 VPS 超卖导致长连接中断、家用宽带抖动——这些都会让 Skills 进化轨迹收集与 Gateway 常驻打折扣。

对于需要稳定运行 Hermes Gateway、持续收集 sessiondb 轨迹并执行 GEPA 迭代的生产环境,JEXCLOUD 多区域裸金属 Mac 是更优解:独占 Apple Silicon、7×24 在线、按月弹性扩缩,120 秒交付节点。具体配置与价格见 JEXCLOUD 定价页