AI Agent OpenRouter 2026.06.06

Classement hebdomadaire OpenRouter : la facturation ne ment pas — qui domine vraiment ?

JEX

Équipe ingénierie JEXCLOUD

· 6 juin 2026 · environ 16 minutes de lecture

Pendant que MMLU et HumanEval s’affrontent en keynote sur « l’intelligence », le classement hebdomadaire OpenRouter mesure autre chose : combien de milliers de milliards de tokens développeurs et entreprises ont réellement routés vers chaque modèle sur sept jours. La facturation ne ment pas — dépenses et trafic reflètent mieux l’adoption réelle que tout benchmark ponctuel.

Cet article s’adresse aux développeurs, Tech Leads et décideurs d’achat qui doivent expliquer « ce que le marché utilise vraiment » : pourquoi les tokens hebdomadaires glissants surpassent les benchmarks ; le total mondial de 28,9 billions pour la semaine jusqu’au 24 mai 2026 et la dynamique Chine/États-Unis ; le Top 10 modèles et la domination de la matrice DeepSeek ; le paradoxe Anthropic (parts tokens en baisse, revenus USD élevés) ; la conclusion contre-intuitive du rapport conjoint a16z ; une checklist de routage en six étapes ; et le rôle d’un Mac bare metal cloud pour les agents 24/7. Source : OpenRouter Rankings, agrégation glissante 7 jours, au 2026-05-24.

01 Pourquoi le volume hebdomadaire OpenRouter prime sur MMLU

OpenRouter est l’une des plus grandes plateformes neutres d’agrégation d’API IA : 300+ modèles, 60+ fournisseurs (OpenAI, Anthropic, Google, DeepSeek, etc.), plus de 8 millions d’utilisateurs, environ 100 billions de tokens traités par mois. La page Rankings agrège entrées et sorties sur une base hebdomadaire glissante (7 jours) — la fenêtre publique la plus directe sur « qui est réellement appelé ».

Les benchmarks mesurent le plafond, la facturation mesure le défaut. Les scores Q&A de laboratoire n’intègrent pas les boucles multi-étapes des agents, les retries ni le coût des tool calls. Le haut du classement est dominé par les tiers Flash et les MoE open source, pas les flagships de keynote.
Les données auto-déclarées des éditeurs ne sont pas comparables. Jeux d’évaluation et modes d’inférence diffèrent. OpenRouter unifie facturation et routage — le volume hebdomadaire est directement ordonnable.
Les totaux mensuels masquent les inflexions hebdomadaires. Les nouveaux modèles (Hy3 Preview, Owl Alpha) explosent souvent d’abord en variation semaine sur semaine.
Parts de tokens et revenus USD peuvent diverger. Un modèle fermé coûteux peut dominer les revenus tout en perdant du volume — se fier au « numéro un » fausse la structure budgétaire.

Thèse centrale : le volume de tokens est le thermomètre de l’adoption réelle ; la granularité hebdomadaire est l’ECG des changements de cap à court terme.

Pour les matrices de capacité Agent et la sélection de juin, voir notre guide de sélection Agent OpenRouter. Ce texte se concentre sur les données de facturation hebdomadaire et la structure commerciale des fournisseurs.

02 28,9 billions de tokens : volume mondial et dynamique Chine/États-Unis

Période : 18–24 mai 2026 (fenêtre glissante OpenRouter). Volume hebdomadaire mondial : 28,9 billions de tokens, +7,4 % semaine sur semaine, cinquième hausse consécutive. Il y a un an : environ 2,4 billions — croissance d’environ 12× sur un an. L’IA entre en phase de déploiement à grande échelle.

OpenRouter : aperçu mondial et régional (18–24 mai 2026)
Indicateur	Valeur	Sem./sem.	Lecture
Volume hebdo mondial	28,9 billions de tokens	+7,4 %	Cinquième semaine de hausse, marché en expansion
Modèles chinois	9,223 billions	+19,89 %	Croissance nettement supérieure à la moyenne mondiale
Modèles américains	4,93 billions	+16,27 %	Volume absolu élevé, mais dépassé par la Chine en hebdo
Chine vs États-Unis	Chine #1 quatre semaines de suite	—	Part CN <2 % début 2025 ; premier dépassement US fév. 2026 ; mai ~45 %+

L’enjeu régional n’est pas l’étiquette nationale mais la combinaison open source + API à prix minimal qui redéfinit le routage par défaut : agents, batch et code vers DeepSeek Flash, Hy3, MiniMax — les flagships fermés occidentaux restent dans le raisonnement complexe enterprise à fort prix unitaire et faible volume.

03 Top 10 semaine du 24 mai 2026 : qui capte le plus de tokens ?

Classement par modèle (entrée + sortie). Trois modèles DeepSeek dans le top 9 ; total série 5,74 billions (+25,9 % sem./sem.), deuxième semaine consécutive en #1 fournisseur par volume hebdo, devant Anthropic et Google.

OpenRouter Top 10 modèles par semaine (au 2026-05-24)
Rang	Modèle	Fournisseur	Tokens/semaine	Sem./sem.	Profil
1	DeepSeek-V4-Flash	DeepSeek	3,43T	+66 %	Default Agent, prix minimal
2	Tencent Hy3 Preview	Tencent	3,07T	+16 %	Forte croissance post-gratuité
3	Claude Sonnet 4.6	Anthropic	1,35T	—	1M contexte, code enterprise
4	DeepSeek-V3.2	DeepSeek	1,31T	—	Long tail économique, roleplay
5	Owl Alpha	OpenRouter	1,15T	+29 %	Gratuit, spécialisé Agent, 1M contexte
6	Gemini 3 Flash Preview	Google	1,06T	—	Multimodal, académique/médical
7	DeepSeek-V4-Pro	DeepSeek	1,00T	—	Flagship matrice (série 5,74T)
8	MiniMax M2.7	MiniMax	806B	—	Rapport qualité-prix long contexte
9	Grok 4.1 Fast	xAI	721B	—	2M contexte, juridique
10	Step 3.5 Flash	StepFun	673B	—	Rapide et économique, batch

Changement notable : Kimi K2.6 sort du Top 10 (6e la semaine précédente) — le classement hebdo est très sensible à la rotation. DeepSeek-V4-Flash +66 % et Owl Alpha +29 % confirment la concentration vers « prix minimal + long contexte + tool calls stables », pas vers le flagship le plus cher.

04 Paradoxe Anthropic : parts tokens en baisse, revenus USD proches de la moitié

OpenRouter fournit aussi la comparaison par fournisseur : parts de tokens vs parts de revenus en dollars. Les deux tableaux révèlent la stratification du marché IA en 2026.

Structure à trois niveaux du marché IA 2026 (volume vs pouvoir de paiement)
Niveau	Exemple	Profil tokens	Profil revenus	Scénarios types
Haute valeur · faible volume	Claude Opus 4.6	Part tokens minime	Prix unitaire très élevé, millions USD/mois	Raisonnement complexe, décisions à haut risque
Équilibre · volume moyen	Gemini 3 Flash	Part tokens modérée	Prix moyen, prime multimodale	Académique, médical, analyse multimodale
Prix minimal · fort volume	DeepSeek / MiniMax / StepFun	Dominent le classement hebdo, croissance la plus rapide	Faible revenu/token, victoire par l’échelle	Agents, code, traitement par lots

En chiffres Anthropic : ~12 % des tokens (contre ~25 % il y a un an, en baisse continue) mais ~46 % des revenus USD. Les clients enterprise paient toujours un premium pour Claude/Opus — la direction du trafic appartient aux matrices open source chinoises et aux modèles Agent gratuits. Opus 4.6 peut traiter une fraction du volume DeepSeek tout en générant environ 25 millions USD par mois (estimations publiques).

Pour les équipes : classement hebdo pour le modèle par défaut ; le CFO examine les parts de revenus pour la réalité budgétaire API. Les deux vues sont indispensables.

05 Corrélation inverse benchmarks/marché : rapport a16z et données citables

Le rapport conjoint OpenRouter/a16z « 2025 AI Usage » (environ 100 billions de tokens de métadonnées anonymes) documente une conclusion contre-intuitive : les scores benchmark et les parts de marché sont presque inversement corrélés. Les modèles « assez bons et peu chers » absorbent le trafic ; les champions d’évaluation restent sur les slides.

Les développeurs priorisent le coût d’inférence, pas l’intelligence maximale. Une nuit de pipeline Agent rend les écarts de prix plus critiques que les petits écarts de qualité.
Les agents dépendent de la stabilité et de la latence API. Un tool call échoué coûte plus qu’un gain théorique de +2 points MMLU.
Le code est la plus grande catégorie unique. De ~11 % début 2025 à 50 %+ du trafic plateforme — ce qui explique DeepSeek Flash et Sonnet 4.6 en tête durable.

Données techniques citables (sources publiques à la rédaction ; vérifier OpenRouter en direct avant routage) :

Volume hebdo mondial : 28,9 billions (18–24 mai 2026), +7,4 %, ~12× sur un an.
Série DeepSeek : 5,74 billions/semaine, +25,9 % ; V4-Flash seul 3,43T, +66 %.
Chine vs États-Unis : 9,223T (+19,89 %) vs 4,93T (+16,27 %) ; Chine #1 quatre semaines.
Anthropic double indicateur : ~12 % tokens vs ~46 % revenus USD ; ~25 % tokens il y a un an.
Part code : OpenRouter/a16z : 11 % → 50 %+, plus grande catégorie unique.

Conclusion : les chiffres de facturation sont plus honnêtes que tout classement d’évaluation. Le classement hebdo est le signal le plus fréquent et le moins coûteux pour ajuster le routage OpenRouter.

06 Checklist en six étapes : suivre le classement hebdo et router

Consulter chaque lundi : openrouter.ai/rankings — noter Top 10 et variation sem./sem. ; nouvelles entrées ou >30 % → test de fumée d’1 heure.
Séparer défaut et upgrade : 80 % des étapes Agent vers DeepSeek-V4-Flash ou Sonnet 4.6 ; escalade V4-Pro / Opus seulement après deux échecs ou tâche high-risk.
Croiser tableaux tokens et USD : pour la finance, capturer parts tokens et parts revenus — « volume #1 » ≠ « plus gros budget ».
Choisir par scénario, pas par keynote : Agent/batch → Flash ; raisonnement complexe → Opus ; multimodal → Gemini Flash ; surveiller Hy3 et Owl Alpha.
Limites de dépense et rapport hebdo : plafond mensuel par clé projet OpenRouter ; export hebdomadaire croisé avec l’évolution du classement.
Déployer un hôte 24/7 : persister clés API, routage et unités launchd sur Mac dédié ; fermer un portable interrompt les agents longue durée — macOS bare metal requis (voir dépannage OpenClaw Mac distant).

Modifier le routage sans résoudre « qui exécute l’agent » est insuffisant : Mac personnel éteint = coupure ; VPS sursouscrits souvent sans macOS officiel/Metal/TCC ; jitter SSH interrompt les boucles d’outils ; machines partagées compliquent rotation des clés et versions CLI.

Pour les équipes exécutant Cursor Agent, OpenClaw Gateway et CI iOS en parallèle, le Mac bare metal multi-régions JEXCLOUD offre un hôte de production stable : Apple Silicon dédié, macOS authentique, livraison en 120 secondes, location mensuelle flexible. Facturation modèles via OpenRouter ; machine et routage séparés. Spécifications : tarifs, intégration : centre d’aide.

Retour au blog

Tags : OpenRouter Volume hebdo Classement tokens DeepSeek Mac cloud