AI Agent 2026.06.18

Hermes Agent Skills Advanced Guide: Von SKILL.md bis GEPA Self-Evolution

JEX

JEXCLOUD Technikteam

· 18. Juni 2026 · Ca. 32 Min. Lesezeit

Anfang 2026 erreichte Hermes Agent von Nous Research innerhalb von zwei Monaten über 160.000 GitHub Stars. Kernversprechen: „the agent that grows with you“ — der Agent wird mit der Nutzung präziser. Träger ist das Skills-System: standardisierte, evolvierbare, sessionsübergreifende prozedurale Erinnerung statt Einmal-Prompts.

Für Entwickler mit laufendem Hermes-Deployment deckt dieser Guide ab: (1) Unterschied Skills/Memory/Prompt und Token-Kontrolle via Progressive Disclosure; (2) SKILL.md, Skill Bundles, bedingte Aktivierung, Tap-Publishing; (3) GEPA + DSPy Fünf-Phasen-Evolution und Community-Ökosystem. Ziel: Skills eigenständig schreiben, bündeln, veröffentlichen und evolvieren.

01 Warum das Hermes Skills-System vertieft studiert werden sollte

Einsteiger-Tutorials klären Installation; Fortgeschrittene klären Skalierung. Vier messbare Vorteile:

On-Demand-Laden: Null Token vor Aktivierung — Progressive Disclosure kontrolliert Kosten.
Offener Standard: agentskills.io — Hermes, Claude Code, Cursor plattformübergreifend nutzbar.
Komponierbar: Skill Bundles laden ganze Workflows per Slash-Command.
Evolvierbar: GEPA analysiert Ausführungstraces und verbessert SKILL.md-Text ohne Modell-Fine-Tuning.

Vier typische Schmerzpunkte fortgeschrittener Nutzer:

Token-Inflation: Alle SOPs im System-Prompt — tausende Token pro Session ohne Nutzen.
Fehlaktivierung: Vage description — LLM lädt Skills in falschen Kontexten.
Workflow-Fragmentierung: PR-Review, TDD, Deploy einzeln via /skill-name.
Kein Team-Sharing: Skills in persönlichen Verzeichnissen — hoher Onboarding-Aufwand.

02 Skills vs Memory vs Prompt — Vergleichsmatrix

Skills vs Memory vs Prompt
Dimension	Prompt	Memory	Skills
Persistenz	Aktuelle Konversation	Sessionsübergreifend, permanent	Sessionsübergreifend, permanent
Ladezeitpunkt	Immer im Kontext	Automatisch pro Session	On-Demand
Token-Kosten	Pro Aufruf	Klein, stabil	Null vor Aktivierung
Inhaltstyp	Beliebige Absicht	Präferenzen/Fakten	Prozedurale Schritte
Wartung	Manuell (User)	Automatisch (Agent)	User + Agent
Teilbarkeit	Schwierig	Privat	Als Community-Tap

Merksatz: Prompt = Haftnotiz (einmalig); Memory = Notizbuch (dauerhaft griffbereit); Skill = SOP-Handbuch (Schrittfolge, bei Bedarf geöffnet).

Skills und MCP ergänzen sich: MCP liefert Tool-Schnittstellen (z. B. DB-Zugriff); Skills lehren den Agenten, korrekte Nutzung für Migration etc.

03 SKILL.md-Format und progressives Laden

Alle Hermes Skills folgen agentskills.io. Basis-Frontmatter:

SKILL.md

---
name: my-skill
description: |
  Use when the user needs to [...].
version: 1.0.0
license: MIT
compatibility: Requires git, docker
allowed-tools: Bash(git:*) Read
metadata:
  hermes:
    tags: [devops, automation]
    category: software-development
    related_skills: [github-pr-workflow]
    requires_toolsets: [terminal]
    fallback_for_toolsets: [web]
---

# My Skill Title
## Overview / When to Use / Procedure / Common Pitfalls / Verification Checklist

Empfohlene Verzeichnisstruktur:

~/.hermes/skills/

my-category/my-skill/
├── SKILL.md              # Kernschritte, empfohlen ≤500 Zeilen
├── references/           # API-Referenz, on-demand
├── templates/            # Wiederverwendbare Vorlagen
└── scripts/              # Direkt ausführbare Skripte

Progressive Disclosure — Drei Ladeebenen
Ebene	Inhalt	Trigger	Token-Kosten
Level 0	name + description	Session-Start, alle Skills	Alle Skills ~3K gesamt
Level 1	Vollständiger SKILL.md-Body	`/skill-name` oder LLM-Entscheidung	Abhängig von Dateilänge
Level 2	references/ scripts/	Bei Ausführung, LLM-Entscheidung	Pro Datei on-demand

Schreibregeln: description ist die gesamte Level-0-Info — „wann nutzen“ schlägt „was ist es“; SKILL.md mit Overview, When to Use, Procedure, Common Pitfalls, Verification Checklist. Validierung: skills-ref validate ./my-skill.

04 Skill Bundles — ein Befehl, vollständiger Workflow

Skill Bundles (Hermes 2026): leichtes YAML bündelt mehrere Skills zu einem Slash-Command. Bei /bundle-name werden alle gelisteten Skills gleichzeitig geladen.

Pfad: ~/.hermes/skill-bundles/<slug>.yaml

backend-dev.yaml

name: backend-dev
description: Full backend feature workflow — code review, TDD, and PR management.
skills:
  - github-code-review
  - test-driven-development
  - github-pr-workflow
instruction: |
  Always write failing tests first before implementation.
  Never push directly to main.

Szenarien: Research-Workflow: arxiv, deep-research, plan, excalidraw; MLOps-Deploy: vllm, llama-cpp, github-pr-workflow, systematic-debugging.

Prioritätsregeln: Bundle schlägt gleichnamigen Skill; fehlende Skills werden übersprungen (Hinweis); Bundles ändern keinen System-Prompt — Prompt Cache bleibt gültig.

CLI

hermes bundles create backend-dev \
  --skills github-code-review,test-driven-development,github-pr-workflow \
  --instruction "Always write failing tests first"

05 Bedingte Aktivierung — Skills reagieren auf Umgebung

Unter metadata.hermes vier Aktivierungsregeln — Skills erscheinen/verschwinden je nach Tool-Verfügbarkeit:

Felder bedingter Aktivierung
Feld	Logik
`requires_toolsets`	Skill versteckt, wenn Toolset fehlt
`requires_tools`	Skill versteckt, wenn Tool fehlt
`fallback_for_toolsets`	Skill versteckt, wenn Toolset vorhanden (Fallback)
`fallback_for_tools`	Skill versteckt, wenn Tool vorhanden

Referenzfall: DuckDuckGo-Skill mit fallback_for_tools: [web_search] — bei FIRECRAWL_KEY / BRAVE_SEARCH_KEY aktiviert sich web_search, DuckDuckGo wird ausgeblendet; bei API-Ausfall erscheint Fallback.

Plattform-Awareness: telegram-notify: requires_toolsets: [messaging], platforms: [telegram, discord]; via hermes skills TUI Skills pro CLI/Telegram/Discord schaltbar.

06 Skills Hub und Open-Source-Ökosystem

Offizielle Installationskanäle:

hermes skills

hermes skills install official/research/arxiv
hermes skills install https://example.com/SKILL.md --name my-skill
hermes skills install github:openai/skills/k8s
hermes skills tap add github:my-org/my-skills

Relevante Open-Source-Repositories
Repository	Merkmale
awesome-hermes-skills	Produktions-Skills: Deep Research, MLOps, Apple-Integration; 23 Skills mit GitHub Copilot
hermeshub	Community-Registry, Security-Scan, API und Marktplatz
ai-agent-skills	191 Skills, 28 Kategorien; Hermes/Claude Code/Cursor One-Click
hermes-agent	Offizielle Quelle, alle Built-in Skills und Specs

agentskills.io ermöglicht plattformübergreifende Nutzung in Hermes, Claude Code, Cursor, OpenCode — Skills sind nicht an eine Plattform gebunden.

07 Skill Tap veröffentlichen — Sechs Schritte für Team und Community

GitHub-Repo als Tap — Team/Community abonniert Skill-Sets. Empfohlene Struktur:

my-skills-tap/

my-skills-tap/
├── skills.sh.json          # Kategorien (optional)
├── mlops/vllm-deploy/SKILL.md
├── research/paper-summarizer/SKILL.md
└── README.md

Kategorien planen: MLOps, Research etc.; skills.sh.json für Hub-Gruppierung.
SKILL.md schreiben: Pro Skill eigenes Verzeichnis; skills-ref validate.
GitHub pushen: Public oder private (Token für private).
Team abonnieren: hermes skills tap add github:your-org/your-skills-tap.
Updates: hermes skills tap update.
Versionierung: ~/.hermes/skills/ in Git; Cross-Device: git pull && hermes skills reset.

Tap-Verwaltung

hermes skills tap add github:your-org/private-skills --token $GH_TOKEN
hermes skills tap list
hermes skills tap update

08 Self-Evolving Skills: GEPA + DSPy

GEPA (Genetic-Pareto Prompt Evolution) — ICLR 2026 Oral, integriert in hermes-agent-self-evolution. Kein Fine-Tuning: Analyse von Ausführungstraces, Variantengenerierung, multi-objektive Pareto-Optimierung des Skill-Texts. Kosten pro Lauf: ca. $2–10 (reine API, kein GPU).

Fünf Phasen: (1) Trace-Sammlung (SQLite); (2) reflexive Fehleranalyse; (3) gezielte Mutation (10–20 SKILL.md-Varianten); (4) Pareto-Bewertung (Erfolgsrate × Token-Effizienz × Geschwindigkeit); (5) manueller PR-Review vor Rollout.

evolve_skill

export HERMES_AGENT_PATH=~/.hermes
python -m evolution.skills.evolve_skill \
    --skill github-code-review \
    --iterations 10 \
    --eval-source sessiondb

Vier Sicherheits-Guardrails: 100 % Test-Suite; Skills ≤ 15 KB, Tool-Beschreibungen ≤ 500 Zeichen; Prompt-Cache-kompatibel; semantische Erhaltungsprüfung.

Offizielle Fünf-Phasen-Roadmap
Phase	Optimierungsziel	Status
Phase 1	Skill-Dateien (SKILL.md)	Implementiert
Phase 2	Tool-Beschreibungen	Geplant
Phase 3	System-Prompt-Fragmente	Geplant
Phase 4	Tool-Implementierungscode	Geplant
Phase 5	Kontinuierlicher Verbesserungszyklus	Geplant

agentskills.io-kompatibel — Claude Code/Gemini CLI Traces: --eval-source mixed --trace-dirs ~/.claude/traces,~/.hermes/sessions.

09 Plugin-Skills und fortgeschrittene Schreibtipps

Plugins als Namespace plugin:skill: nicht in Default-skills_list, nur bei explizitem Aufruf; Skills im Plugin referenzieren sich gegenseitig. skill_view("superpowers:writing-plans") zeigt Geschwister-Skills.

description bestimmt Aktivierungsgenauigkeit: „Helps with code“ vermeiden; Trigger und Ausschlusskriterien explizit.

Pitfalls als Qualitätsgrenze: Konkrete Fehlermuster, Root Cause, Fix (CSS-Selector-Fragilität, GitHub API Rate Limit, großer Diff Token-Overflow).

Scripting: scripts/ in Procedure referenzieren; Fallback auf references/manual-extract.md.

Größenempfehlungen für Skills
Größe	Empfehlung
< 500 Zeilen	Alles in SKILL.md
500–1000 Zeilen	Details nach references/
> 1000 Zeilen	Split empfohlen — evtl. zwei Skills
> 15 KB	GEPA-Limit — Split erforderlich

Agent kann via skill_manage patchen/erstellen; config.yaml: skills.agent_writes_require_approval: true für manuelle Freigabe.

10 Praxis: Tech-Blog-Workflow Skills

blog-workflow Bundle — SEO-Recherche, Outline, Code-Validierung, Bilingual-Check, Publish in einem Schritt:

blog-workflow.yaml

name: blog-workflow
description: Full tech blog writing workflow.
skills:
  - seo-keyword-research
  - outline-generator
  - code-example-validator
  - bilingual-checker
  - publish-to-platform
instruction: |
  Always research SEO keywords before writing.
  Ensure all code examples are tested and runnable.
  Generate both Chinese and English title options.

Custom seo-keyword-research: requires_toolsets: [web]; Ablauf: Thema → DE/EN Long-Tail → Cross-Ref Dev.to/HN → 3–5 Hauptkeywords + 10–15 Long-Tail-Matrix. Suchverhalten und Terminologie je Zielplattform validieren.

11 Hermes Agent Skills — FAQ

Skills vs MCP? Skills = prozedurales Wissen; MCP = Tool-Schnittstelle — komplementär.
Skill geändert, alte Version aktiv? Aktuelle Session unverändert — /reset oder Install mit --now (invalidiert Prompt Cache).
GEPA sicher? Vier Guardrails + manueller PR — trotzdem jeden Diff reviewen.
Claude Code Reuse? SKILL.md nach ~/.claude/skills/ oder ai-agent-skills Multi-Platform-Install.
Mehrsprachige Inhalte und Token? Nicht-EN description kann Matching verschlechtern — EN oder zweisprachig empfohlen.

Weiterführend: Offizielle Docs, GEPA, DSPy.

12 Kennzahlen und JEXCLOUD

GitHub Stars: Hermes Agent Anfang 2026 — 160K+ in zwei Monaten.
Level-0-Token: Alle name+description ~3K Token/Session.
GEPA-Kosten/Lauf: ca. $2–10, reine API, kein GPU.
GEPA-Größenlimit: Skills ≤ 15 KB, Tool-Beschreibungen ≤ 500 Zeichen.
Community: kevinnft/ai-agent-skills — 191 Skills, 28 Kategorien; hermeshub 166 Stars mit Security-Scan.

Hermes Agent und GEPA-Evolution erfordern 24/7-online, latenzarmen macOS-Host. Raspberry Pi (RAM), überbuchte VPS (Long-Connection-Abbrüche), instabiles Heimnetz — beeinträchtigen Trace-Sammlung und Gateway-Dauerbetrieb.

Für stabile Hermes-Gateway-, sessiondb- und GEPA-Iteration: JEXCLOUD Multi-Region Bare-Metal Mac — dediziertes Apple Silicon, 24/7, monatlich skalierbar, 120-Sekunden-Provisioning. Details: JEXCLOUD Preise.

Zurück zur Blog-Übersicht

Tags: Hermes Agent Skills GEPA Skill Bundles Cloud Mac