Hermes Agent Skills Advanced Guide: Von SKILL.md bis GEPA Self-Evolution
Anfang 2026 erreichte Hermes Agent von Nous Research innerhalb von zwei Monaten über 160.000 GitHub Stars. Kernversprechen: „the agent that grows with you“ — der Agent wird mit der Nutzung präziser. Träger ist das Skills-System: standardisierte, evolvierbare, sessionsübergreifende prozedurale Erinnerung statt Einmal-Prompts.
Für Entwickler mit laufendem Hermes-Deployment deckt dieser Guide ab: (1) Unterschied Skills/Memory/Prompt und Token-Kontrolle via Progressive Disclosure; (2) SKILL.md, Skill Bundles, bedingte Aktivierung, Tap-Publishing; (3) GEPA + DSPy Fünf-Phasen-Evolution und Community-Ökosystem. Ziel: Skills eigenständig schreiben, bündeln, veröffentlichen und evolvieren.
01 Warum das Hermes Skills-System vertieft studiert werden sollte
Einsteiger-Tutorials klären Installation; Fortgeschrittene klären Skalierung. Vier messbare Vorteile:
- On-Demand-Laden: Null Token vor Aktivierung — Progressive Disclosure kontrolliert Kosten.
- Offener Standard: agentskills.io — Hermes, Claude Code, Cursor plattformübergreifend nutzbar.
- Komponierbar: Skill Bundles laden ganze Workflows per Slash-Command.
- Evolvierbar: GEPA analysiert Ausführungstraces und verbessert SKILL.md-Text ohne Modell-Fine-Tuning.
Vier typische Schmerzpunkte fortgeschrittener Nutzer:
- Token-Inflation: Alle SOPs im System-Prompt — tausende Token pro Session ohne Nutzen.
- Fehlaktivierung: Vage
description— LLM lädt Skills in falschen Kontexten. - Workflow-Fragmentierung: PR-Review, TDD, Deploy einzeln via
/skill-name. - Kein Team-Sharing: Skills in persönlichen Verzeichnissen — hoher Onboarding-Aufwand.
02 Skills vs Memory vs Prompt — Vergleichsmatrix
| Dimension | Prompt | Memory | Skills |
|---|---|---|---|
| Persistenz | Aktuelle Konversation | Sessionsübergreifend, permanent | Sessionsübergreifend, permanent |
| Ladezeitpunkt | Immer im Kontext | Automatisch pro Session | On-Demand |
| Token-Kosten | Pro Aufruf | Klein, stabil | Null vor Aktivierung |
| Inhaltstyp | Beliebige Absicht | Präferenzen/Fakten | Prozedurale Schritte |
| Wartung | Manuell (User) | Automatisch (Agent) | User + Agent |
| Teilbarkeit | Schwierig | Privat | Als Community-Tap |
Merksatz: Prompt = Haftnotiz (einmalig); Memory = Notizbuch (dauerhaft griffbereit); Skill = SOP-Handbuch (Schrittfolge, bei Bedarf geöffnet).
Skills und MCP ergänzen sich: MCP liefert Tool-Schnittstellen (z. B. DB-Zugriff); Skills lehren den Agenten, korrekte Nutzung für Migration etc.
03 SKILL.md-Format und progressives Laden
Alle Hermes Skills folgen agentskills.io. Basis-Frontmatter:
---
name: my-skill
description: |
Use when the user needs to [...].
version: 1.0.0
license: MIT
compatibility: Requires git, docker
allowed-tools: Bash(git:*) Read
metadata:
hermes:
tags: [devops, automation]
category: software-development
related_skills: [github-pr-workflow]
requires_toolsets: [terminal]
fallback_for_toolsets: [web]
---
# My Skill Title
## Overview / When to Use / Procedure / Common Pitfalls / Verification Checklist
Empfohlene Verzeichnisstruktur:
my-category/my-skill/
├── SKILL.md # Kernschritte, empfohlen ≤500 Zeilen
├── references/ # API-Referenz, on-demand
├── templates/ # Wiederverwendbare Vorlagen
└── scripts/ # Direkt ausführbare Skripte
| Ebene | Inhalt | Trigger | Token-Kosten |
|---|---|---|---|
| Level 0 | name + description | Session-Start, alle Skills | Alle Skills ~3K gesamt |
| Level 1 | Vollständiger SKILL.md-Body | /skill-name oder LLM-Entscheidung |
Abhängig von Dateilänge |
| Level 2 | references/ scripts/ | Bei Ausführung, LLM-Entscheidung | Pro Datei on-demand |
Schreibregeln: description ist die gesamte Level-0-Info — „wann nutzen“ schlägt „was ist es“; SKILL.md mit Overview, When to Use, Procedure, Common Pitfalls, Verification Checklist. Validierung: skills-ref validate ./my-skill.
04 Skill Bundles — ein Befehl, vollständiger Workflow
Skill Bundles (Hermes 2026): leichtes YAML bündelt mehrere Skills zu einem Slash-Command. Bei /bundle-name werden alle gelisteten Skills gleichzeitig geladen.
Pfad: ~/.hermes/skill-bundles/<slug>.yaml
name: backend-dev
description: Full backend feature workflow — code review, TDD, and PR management.
skills:
- github-code-review
- test-driven-development
- github-pr-workflow
instruction: |
Always write failing tests first before implementation.
Never push directly to main.
Szenarien: Research-Workflow: arxiv, deep-research, plan, excalidraw; MLOps-Deploy: vllm, llama-cpp, github-pr-workflow, systematic-debugging.
Prioritätsregeln: Bundle schlägt gleichnamigen Skill; fehlende Skills werden übersprungen (Hinweis); Bundles ändern keinen System-Prompt — Prompt Cache bleibt gültig.
hermes bundles create backend-dev \
--skills github-code-review,test-driven-development,github-pr-workflow \
--instruction "Always write failing tests first"
05 Bedingte Aktivierung — Skills reagieren auf Umgebung
Unter metadata.hermes vier Aktivierungsregeln — Skills erscheinen/verschwinden je nach Tool-Verfügbarkeit:
| Feld | Logik |
|---|---|
requires_toolsets |
Skill versteckt, wenn Toolset fehlt |
requires_tools |
Skill versteckt, wenn Tool fehlt |
fallback_for_toolsets |
Skill versteckt, wenn Toolset vorhanden (Fallback) |
fallback_for_tools |
Skill versteckt, wenn Tool vorhanden |
Referenzfall: DuckDuckGo-Skill mit fallback_for_tools: [web_search] — bei FIRECRAWL_KEY / BRAVE_SEARCH_KEY aktiviert sich web_search, DuckDuckGo wird ausgeblendet; bei API-Ausfall erscheint Fallback.
Plattform-Awareness: telegram-notify: requires_toolsets: [messaging], platforms: [telegram, discord]; via hermes skills TUI Skills pro CLI/Telegram/Discord schaltbar.
06 Skills Hub und Open-Source-Ökosystem
Offizielle Installationskanäle:
hermes skills install official/research/arxiv
hermes skills install https://example.com/SKILL.md --name my-skill
hermes skills install github:openai/skills/k8s
hermes skills tap add github:my-org/my-skills
| Repository | Merkmale |
|---|---|
| awesome-hermes-skills | Produktions-Skills: Deep Research, MLOps, Apple-Integration; 23 Skills mit GitHub Copilot |
| hermeshub | Community-Registry, Security-Scan, API und Marktplatz |
| ai-agent-skills | 191 Skills, 28 Kategorien; Hermes/Claude Code/Cursor One-Click |
| hermes-agent | Offizielle Quelle, alle Built-in Skills und Specs |
agentskills.io ermöglicht plattformübergreifende Nutzung in Hermes, Claude Code, Cursor, OpenCode — Skills sind nicht an eine Plattform gebunden.
07 Skill Tap veröffentlichen — Sechs Schritte für Team und Community
GitHub-Repo als Tap — Team/Community abonniert Skill-Sets. Empfohlene Struktur:
my-skills-tap/
├── skills.sh.json # Kategorien (optional)
├── mlops/vllm-deploy/SKILL.md
├── research/paper-summarizer/SKILL.md
└── README.md
- Kategorien planen: MLOps, Research etc.;
skills.sh.jsonfür Hub-Gruppierung. - SKILL.md schreiben: Pro Skill eigenes Verzeichnis;
skills-ref validate. - GitHub pushen: Public oder private (Token für private).
- Team abonnieren:
hermes skills tap add github:your-org/your-skills-tap. - Updates:
hermes skills tap update. - Versionierung:
~/.hermes/skills/in Git; Cross-Device:git pull && hermes skills reset.
hermes skills tap add github:your-org/private-skills --token $GH_TOKEN
hermes skills tap list
hermes skills tap update
08 Self-Evolving Skills: GEPA + DSPy
GEPA (Genetic-Pareto Prompt Evolution) — ICLR 2026 Oral, integriert in hermes-agent-self-evolution. Kein Fine-Tuning: Analyse von Ausführungstraces, Variantengenerierung, multi-objektive Pareto-Optimierung des Skill-Texts. Kosten pro Lauf: ca. $2–10 (reine API, kein GPU).
Fünf Phasen: (1) Trace-Sammlung (SQLite); (2) reflexive Fehleranalyse; (3) gezielte Mutation (10–20 SKILL.md-Varianten); (4) Pareto-Bewertung (Erfolgsrate × Token-Effizienz × Geschwindigkeit); (5) manueller PR-Review vor Rollout.
export HERMES_AGENT_PATH=~/.hermes
python -m evolution.skills.evolve_skill \
--skill github-code-review \
--iterations 10 \
--eval-source sessiondb
Vier Sicherheits-Guardrails: 100 % Test-Suite; Skills ≤ 15 KB, Tool-Beschreibungen ≤ 500 Zeichen; Prompt-Cache-kompatibel; semantische Erhaltungsprüfung.
| Phase | Optimierungsziel | Status |
|---|---|---|
| Phase 1 | Skill-Dateien (SKILL.md) | Implementiert |
| Phase 2 | Tool-Beschreibungen | Geplant |
| Phase 3 | System-Prompt-Fragmente | Geplant |
| Phase 4 | Tool-Implementierungscode | Geplant |
| Phase 5 | Kontinuierlicher Verbesserungszyklus | Geplant |
agentskills.io-kompatibel — Claude Code/Gemini CLI Traces: --eval-source mixed --trace-dirs ~/.claude/traces,~/.hermes/sessions.
09 Plugin-Skills und fortgeschrittene Schreibtipps
Plugins als Namespace plugin:skill: nicht in Default-skills_list, nur bei explizitem Aufruf; Skills im Plugin referenzieren sich gegenseitig. skill_view("superpowers:writing-plans") zeigt Geschwister-Skills.
description bestimmt Aktivierungsgenauigkeit: „Helps with code“ vermeiden; Trigger und Ausschlusskriterien explizit.
Pitfalls als Qualitätsgrenze: Konkrete Fehlermuster, Root Cause, Fix (CSS-Selector-Fragilität, GitHub API Rate Limit, großer Diff Token-Overflow).
Scripting: scripts/ in Procedure referenzieren; Fallback auf references/manual-extract.md.
| Größe | Empfehlung |
|---|---|
| < 500 Zeilen | Alles in SKILL.md |
| 500–1000 Zeilen | Details nach references/ |
| > 1000 Zeilen | Split empfohlen — evtl. zwei Skills |
| > 15 KB | GEPA-Limit — Split erforderlich |
Agent kann via skill_manage patchen/erstellen; config.yaml: skills.agent_writes_require_approval: true für manuelle Freigabe.
10 Praxis: Tech-Blog-Workflow Skills
blog-workflow Bundle — SEO-Recherche, Outline, Code-Validierung, Bilingual-Check, Publish in einem Schritt:
name: blog-workflow
description: Full tech blog writing workflow.
skills:
- seo-keyword-research
- outline-generator
- code-example-validator
- bilingual-checker
- publish-to-platform
instruction: |
Always research SEO keywords before writing.
Ensure all code examples are tested and runnable.
Generate both Chinese and English title options.
Custom seo-keyword-research: requires_toolsets: [web]; Ablauf: Thema → DE/EN Long-Tail → Cross-Ref Dev.to/HN → 3–5 Hauptkeywords + 10–15 Long-Tail-Matrix. Suchverhalten und Terminologie je Zielplattform validieren.
11 Hermes Agent Skills — FAQ
- Skills vs MCP? Skills = prozedurales Wissen; MCP = Tool-Schnittstelle — komplementär.
- Skill geändert, alte Version aktiv? Aktuelle Session unverändert —
/resetoder Install mit--now(invalidiert Prompt Cache). - GEPA sicher? Vier Guardrails + manueller PR — trotzdem jeden Diff reviewen.
- Claude Code Reuse? SKILL.md nach
~/.claude/skills/oder ai-agent-skills Multi-Platform-Install. - Mehrsprachige Inhalte und Token? Nicht-EN description kann Matching verschlechtern — EN oder zweisprachig empfohlen.
Weiterführend: Offizielle Docs, GEPA, DSPy.
12 Kennzahlen und JEXCLOUD
- GitHub Stars: Hermes Agent Anfang 2026 — 160K+ in zwei Monaten.
- Level-0-Token: Alle name+description ~3K Token/Session.
- GEPA-Kosten/Lauf: ca. $2–10, reine API, kein GPU.
- GEPA-Größenlimit: Skills ≤ 15 KB, Tool-Beschreibungen ≤ 500 Zeichen.
- Community: kevinnft/ai-agent-skills — 191 Skills, 28 Kategorien; hermeshub 166 Stars mit Security-Scan.
Hermes Agent und GEPA-Evolution erfordern 24/7-online, latenzarmen macOS-Host. Raspberry Pi (RAM), überbuchte VPS (Long-Connection-Abbrüche), instabiles Heimnetz — beeinträchtigen Trace-Sammlung und Gateway-Dauerbetrieb.
Für stabile Hermes-Gateway-, sessiondb- und GEPA-Iteration: JEXCLOUD Multi-Region Bare-Metal Mac — dediziertes Apple Silicon, 24/7, monatlich skalierbar, 120-Sekunden-Provisioning. Details: JEXCLOUD Preise.