Hermes Agent Skills 上級ガイド: SKILL.md から GEPA 自己進化へ
2026 年初頭、Nous Research が公開した Hermes Agent は、公開から 2 か月で GitHub Star が 16 万を超えました。核心理念は "the agent that grows with you"——使うほど Agent があなたを理解する、というものです。その基盤を支えるのが Skills(スキル)システムです。標準化され、進化可能で、セッションをまたいで持続する手続き的メモリであり、使い捨て Prompt ではありません。
すでに Hermes をデプロイした開発者・AI エンジニア向けに、本稿では上級内容を網羅します。① Skills と Memory・Prompt の本質的な違い、および Progressive Disclosure による Token 制御;② SKILL.md 形式、Skill Bundles、条件付きアクティベーション、Tap 公開;③ GEPA + DSPy による五段階自己進化とコミュニティエコシステム。読了後、独自のスキル資産を作成・パッケージ化・公開・進化させられるようになります。
01 なぜ Hermes Agent のスキルシステムを深く学ぶ価値があるのか
入門チュートリアルは「どうインストールするか」を解決します。上級編では「Agent を使うほど強くするには」を解決します。Hermes Skills の独自価値は次の四点です。
- オンデマンドロード:アクティベーション前は Token 消費ゼロ。Progressive Disclosure でコストを制御します。
- オープン標準:agentskills.io に準拠し、Hermes・Claude Code・Cursor でクロスプラットフォーム再利用が可能です。
- コンポーザブル:Skill Bundles でスラッシュコマンド 1 本にワークフロー一式をロードできます。
- 進化可能:GEPA アルゴリズムが実行トレースを分析し、モデル重みを触らず SKILL.md テキストを自動改善します。
上級ユーザーがよく直面する四つの課題は次のとおりです。
- Token 膨張:すべての SOP をシステム Prompt に詰め込み、毎セッション数千 Token を無駄に消費する。
- スキル誤アクティベーション:description が曖昧すぎて、LLM が無関係な場面で誤ったスキルをロードする。
- ワークフローの断片化:PR レビュー、TDD、デプロイを
/skill-nameで個別に呼び出し、効率が低い。 - チーム共有の困難:スキルが個人ディレクトリに散在し、マシン変更や新メンバーのオンボーディングコストが高い。
02 Skills・Memory・Prompt の違いは何か
| 観点 | 通常の Prompt | Memory(記憶) | Skills(スキル) |
|---|---|---|---|
| 永続性 | 現在の会話のみ | セッション跨ぎ、永続 | セッション跨ぎ、永続 |
| ロードタイミング | 毎回コンテキストに含まれる | 毎セッション自動注入 | オンデマンド |
| Token コスト | 毎回消費 | 小さく安定 | アクティベーション前はゼロ |
| 内容の種類 | 任意の意図記述 | ユーザー嗜好・事実 | 手続き的ステップ |
| メンテナンス | ユーザー手動 | Agent 自動 | ユーザー + Agent 双方 |
| 共有可能性 | 不便 | プライベート | コミュニティ Tap として公開可能 |
覚え方:Prompt = 付箋(当該回のみ有効);Memory = メモ帳(永久メモ、常に手元);Skill = SOP マニュアル(手順化フロー、必要時に参照)。
Skills は MCP と補完関係にあります。MCP はツールインターフェース(例:データベースアクセス)を提供し、Skill は Agent にそのツールを正しく使ってマイグレーション等のタスクを完了する方法を教えます。
03 SKILL.md 形式の詳解と段階的ロード
すべての Hermes Skills は agentskills.io オープン標準に従います。基本的な frontmatter 構造は次のとおりです。
---
name: my-skill
description: |
Use when the user needs to [...].
version: 1.0.0
license: MIT
compatibility: Requires git, docker
allowed-tools: Bash(git:*) Read
metadata:
hermes:
tags: [devops, automation]
category: software-development
related_skills: [github-pr-workflow]
requires_toolsets: [terminal]
fallback_for_toolsets: [web]
---
# My Skill Title
## Overview / When to Use / Procedure / Common Pitfalls / Verification Checklist
推奨ディレクトリ構造:
my-category/my-skill/
├── SKILL.md # Core steps, keep ≤500 lines
├── references/ # API refs, loaded on demand
├── templates/ # Reusable templates
└── scripts/ # Scripts Agent can execute directly
| レイヤー | 内容 | トリガー | Token コスト |
|---|---|---|---|
| Level 0 | name + description | 各セッション開始時、全スキル | 全スキル合計 約 3K |
| Level 1 | SKILL.md 全文 | /skill-name または LLM が必要と判断 |
ファイル長に依存 |
| Level 2 | references/ scripts/ ファイル | 実行時に LLM が必要と判断 | オンデマンド、単一ファイル |
執筆の要点:description は Level 0 の唯一の情報源です。「何か」より「いつ使うか」を明確に書くことが重要です。SKILL.md には Overview、When to Use、Procedure、Common Pitfalls、Verification Checklist の五セクションを含めることを推奨します。skills-ref validate ./my-skill で形式の妥当性を検証できます。
04 Skill Bundles:コマンド 1 本でワークフロー全体を起動
Skill Bundles は Hermes 2026 の新機能です。軽量 YAML で複数スキルを 1 つのスラッシュコマンドにパッケージし、/bundle-name 実行時に列挙されたスキルを同時ロードします。
ファイル配置:~/.hermes/skill-bundles/<slug>.yaml
name: backend-dev
description: Full backend feature workflow — code review, TDD, and PR management.
skills:
- github-code-review
- test-driven-development
- github-pr-workflow
instruction: |
Always write failing tests first before implementation.
Never push directly to main.
上級シナリオ:研究員ワークフローでは arxiv、deep-research、plan、excalidraw をパッケージ化できます。MLOps デプロイでは vllm、llama-cpp、github-pr-workflow、systematic-debugging をパッケージ化できます。
優先度ルール:Bundle と単一 Skill が同名の場合、Bundle が優先されます。未インストールの Skill はスキップされエラーにならず、欠落を通知します。Bundle はシステム Prompt を変更せず、Prompt Cache 無効化を引き起こしません。
hermes bundles create backend-dev \
--skills github-code-review,test-driven-development,github-pr-workflow \
--instruction "Always write failing tests first"
05 条件付きアクティベーション:スキルを環境に賢く適応させる
metadata.hermes 配下で四種類のアクティベーションルールを設定すると、ツール可用性に応じてスキルを自動表示・非表示できます。
| フィールド | 挙動 |
|---|---|
requires_toolsets |
列挙したツールセットが存在しない場合、このスキルを非表示 |
requires_tools |
列挙したツールが存在しない場合、このスキルを非表示 |
fallback_for_toolsets |
列挙したツールセットが存在する場合、このスキルを非表示(フォールバック) |
fallback_for_tools |
列挙したツールが存在する場合、このスキルを非表示 |
典型シナリオ:DuckDuckGo 検索スキルに fallback_for_tools: [web_search] を設定——ユーザーが FIRECRAWL_KEY / BRAVE_SEARCH_KEY を設定している場合、有料 web_search がアクティブになり DuckDuckGo は自動非表示で Token を節約します。API 不可時にはフォールバックが自動で現れます。
プラットフォーム感知:telegram-notify には requires_toolsets: [messaging] と platforms: [telegram, discord] を設定できます。hermes skills TUI で CLI、Telegram、Discord ごとにスキルを個別にオン・オフできます。
06 Skills Hub とオープンソースコミュニティエコシステム
公式インストールチャネル:
hermes skills install official/research/arxiv
hermes skills install https://example.com/SKILL.md --name my-skill
hermes skills install github:openai/skills/k8s
hermes skills tap add github:my-org/my-skills
| リポジトリ | ハイライト |
|---|---|
| awesome-hermes-skills | 本番向け厳選スキル。Deep Research、MLOps、Apple 連携。23 スキルが GitHub Copilot と統合 |
| hermeshub | コミュニティレジストリ。セキュリティスキャン認証。API とマーケットプレイス対応 |
| ai-agent-skills | 191 スキル、28 カテゴリ。Hermes / Claude Code / Cursor ワンクリックインストール |
| hermes-agent | 公式の権威ソース。全組み込み Skills と執筆規約を含む |
agentskills.io により、スキルは Hermes、Claude Code、Cursor、OpenCode 間でクロスプラットフォーム利用が可能です。資産は単一プラットフォームに縛られません。
07 独自 Skill Tap の公開:チーム・コミュニティ共有の六段階
GitHub リポジトリを Tap として使うと、チームやコミュニティがスキルセットを購読できます。推奨リポジトリ構造:
my-skills-tap/
├── skills.sh.json # Category config (optional)
├── mlops/vllm-deploy/SKILL.md
├── research/paper-summarizer/SKILL.md
└── README.md
- カテゴリ設計:MLOps、Research 等のドメインでディレクトリを整理し、
skills.sh.jsonで Hub 表示グループを制御します。 - SKILL.md 執筆:各スキルを独立ディレクトリに置き、
skills-ref validateで検証します。 - GitHub リポジトリへ push:公開またはプライベート(プライベートは Token が必要)。
- チームメンバーが購読:
hermes skills tap add github:your-org/your-skills-tap。 - 定期更新:
hermes skills tap updateで最新スキルを取得します。 - バージョン管理:
~/.hermes/skills/を Git 管理し、デバイス間はgit pull && hermes skills resetで同期します。
hermes skills tap add github:your-org/private-skills --token $GH_TOKEN
hermes skills tap list
hermes skills tap update
08 Self-Evolving Skills:GEPA + DSPy によるスキル自動進化
GEPA(Genetic-Pareto Prompt Evolution) は 2026 年 ICLR Oral 成果で、hermes-agent-self-evolution に統合されています。核心思想は、モデル重みをファインチューンせず、実行トレース分析・変異生成・多目的パレート最適化でスキルテキストを改善することです。1 回の最適化は約 $2–10(純粋な API 呼び出し、GPU 不要)。
五段階進化フロー:① 実行トレース収集(SQLite);② 反射的失敗分析(実行可能な側面情報);③ ターゲット変異(10–20 個の SKILL.md 変異体);④ 多目的パレート評価(成功率 × Token 効率 × 速度);⑤ 人手 PR レビュー後に本番投入。
export HERMES_AGENT_PATH=~/.hermes
python -m evolution.skills.evolve_skill \
--skill github-code-review \
--iterations 10 \
--eval-source sessiondb
四つの安全ガードレール:全テストスイート 100% パス;Skills ≤ 15KB、ツール説明 ≤ 500 文字;Prompt キャッシュ互換;意味保持チェックで元の目的から逸脱しない。
| フェーズ | 最適化対象 | 状態 |
|---|---|---|
| Phase 1 | Skill ファイル(SKILL.md) | 実装済み |
| Phase 2 | ツール説明 | 計画中 |
| Phase 3 | システム Prompt 断片 | 計画中 |
| Phase 4 | ツール実装コード | 計画中 |
| Phase 5 | 継続改善ループ(完全自動) | 計画中 |
Skills は agentskills.io に準拠するため、Claude Code や Gemini CLI のトレースをオプティマイザに投入できます:--eval-source mixed --trace-dirs ~/.claude/traces,~/.hermes/sessions。
09 Plugin スキルと上級執筆テクニック
プラグインはスキルを plugin:skill 名前空間にパッケージします。デフォルト skills_list には表示されず、ユーザーが明示的に呼び出したときのみアクティブになります。プラグイン内スキルは相互参照可能です。skill_view("superpowers:writing-plans") ロード時、同一プラグインの兄弟スキルが表示されます。
description がアクティベーション精度を決める:「Helps with code」のような曖昧な表現は避け、トリガー条件と除外シナリオを明記します。
Pitfalls が品質の分水嶺:具体的な失敗パターン、根本原因、修正手順を含める必要があります(例:CSS selector の脆弱性、GitHub API レート制限、大きな diff による Token オーバーフロー)。
スクリプト化:Procedure で scripts/ 配下の実行可能スクリプトを参照し、失敗時は references/manual-extract.md にフォールバックします。
| サイズ | 推奨 |
|---|---|
| < 500 行 | すべて SKILL.md に配置 |
| 500–1000 行 | 詳細資料を references/ へ移動 |
| > 1000 行 | 分割を強く推奨。2 つのスキルに分けるべきか検討 |
| > 15KB | GEPA 制限超過。分割必須 |
Agent は skill_manage でスキルを動的に patch または create できます。config.yaml で skills.agent_writes_require_approval: true を設定すると、人手承認ゲートを有効化できます。
10 実践例:技術ブログワークフロー Skills 設計
blog-workflow Bundle を構築し、SEO 調査、アウトライン生成、コード検証、多言語チェック、公開スキルをワンクリックでロードします。
name: blog-workflow
description: Full tech blog writing workflow.
skills:
- seo-keyword-research
- outline-generator
- code-example-validator
- bilingual-checker
- publish-to-platform
instruction: |
Always research SEO keywords before writing.
Ensure all code examples are tested and runnable.
Generate both Chinese and English title options.
カスタム seo-keyword-research スキルには requires_toolsets: [web] を設定します。フローは:テーマ特定 → 中国語ロングテール(「X 怎么用」「X 教程」)→ 英語ロングテール(「X tutorial」「X vs Y」)→ 掘金 / Dev.to / HN トレンドのクロス参照 → 3–5 主キーワード + 10–15 ロングテールマトリクスを出力。中日英の検索習慣の違いに注意し、技術用語の訳法はターゲットプラットフォームに合わせて検証します。
11 Hermes Agent Skills よくある質問 FAQ
- Skills と MCP の違いは? Skills は手続き的知識ドキュメント、MCP はツールインターフェースです。両者は補完関係にあります。
- Skill を変更したのに旧版が使われるのはなぜ? 現在のセッションには反映されません。
/resetで新セッションを開始するか、インストール時に--nowを付けます(Prompt Cache が無効化されます)。 - GEPA 進化は安全か? 四つのガードレール + 人手 PR レビューがあります。それでも各 diff の review を推奨します。
- Claude Code で再利用するには? SKILL.md を
~/.claude/skills/にコピーするか、ai-agent-skills でマルチエンドポイント一括インストールします。 - 中国語コンテンツは Token に影響するか? 中国語 1 文字あたり約 1–1.5 token。description は英語または日中英バイリンガルを推奨し、LLM マッチング精度を高めます。
関連リンク:公式ドキュメント、中国語ドキュメント、GEPA アルゴリズム、DSPy フレームワーク。
12 主要データと JEXCLOUD まとめ
- GitHub Star:Hermes Agent は 2026 年初頭に公開、2 か月で 16 万 Star を突破。
- Level 0 Token:全スキルの name+description 合計 約 3K Token/セッション。
- GEPA 1 回あたりコスト:約 $2–10。純粋な API 呼び出し、GPU 不要。
- GEPA サイズ制限:Skills ≤ 15KB、ツール説明 ≤ 500 文字。
- コミュニティ規模:kevinnft/ai-agent-skills に 191 スキル、28 カテゴリ。hermeshub は 166 Star、セキュリティスキャン付き。
Hermes Agent と GEPA 進化パイプラインの実行には、7×24 オンライン・低レイテンシの macOS ホストが必要です。Raspberry Pi はメモリ不足、共有 VPS はオーバーセルで長時間接続が切断、家庭用回線は不安定——これらは Skills 進化トレース収集と Gateway 常駐の効果を損ないます。
Hermes Gateway を安定稼働させ、sessiondb トレースを継続収集し GEPA イテレーションを実行する本番環境には、JEXCLOUD マルチリージョン裸金属 Mac が最適です。専有 Apple Silicon、7×24 オンライン、月次の弾力的スケール、120 秒でノード交付。構成と価格は JEXCLOUD 料金ページをご覧ください。