Classement hebdomadaire OpenRouter : la facturation ne ment pas — qui domine vraiment ?
Pendant que MMLU et HumanEval s’affrontent en keynote sur « l’intelligence », le classement hebdomadaire OpenRouter mesure autre chose : combien de milliers de milliards de tokens développeurs et entreprises ont réellement routés vers chaque modèle sur sept jours. La facturation ne ment pas — dépenses et trafic reflètent mieux l’adoption réelle que tout benchmark ponctuel.
Cet article s’adresse aux développeurs, Tech Leads et décideurs d’achat qui doivent expliquer « ce que le marché utilise vraiment » : pourquoi les tokens hebdomadaires glissants surpassent les benchmarks ; le total mondial de 28,9 billions pour la semaine jusqu’au 24 mai 2026 et la dynamique Chine/États-Unis ; le Top 10 modèles et la domination de la matrice DeepSeek ; le paradoxe Anthropic (parts tokens en baisse, revenus USD élevés) ; la conclusion contre-intuitive du rapport conjoint a16z ; une checklist de routage en six étapes ; et le rôle d’un Mac bare metal cloud pour les agents 24/7. Source : OpenRouter Rankings, agrégation glissante 7 jours, au 2026-05-24.
01 Pourquoi le volume hebdomadaire OpenRouter prime sur MMLU
OpenRouter est l’une des plus grandes plateformes neutres d’agrégation d’API IA : 300+ modèles, 60+ fournisseurs (OpenAI, Anthropic, Google, DeepSeek, etc.), plus de 8 millions d’utilisateurs, environ 100 billions de tokens traités par mois. La page Rankings agrège entrées et sorties sur une base hebdomadaire glissante (7 jours) — la fenêtre publique la plus directe sur « qui est réellement appelé ».
- Les benchmarks mesurent le plafond, la facturation mesure le défaut. Les scores Q&A de laboratoire n’intègrent pas les boucles multi-étapes des agents, les retries ni le coût des tool calls. Le haut du classement est dominé par les tiers Flash et les MoE open source, pas les flagships de keynote.
- Les données auto-déclarées des éditeurs ne sont pas comparables. Jeux d’évaluation et modes d’inférence diffèrent. OpenRouter unifie facturation et routage — le volume hebdomadaire est directement ordonnable.
- Les totaux mensuels masquent les inflexions hebdomadaires. Les nouveaux modèles (Hy3 Preview, Owl Alpha) explosent souvent d’abord en variation semaine sur semaine.
- Parts de tokens et revenus USD peuvent diverger. Un modèle fermé coûteux peut dominer les revenus tout en perdant du volume — se fier au « numéro un » fausse la structure budgétaire.
Thèse centrale : le volume de tokens est le thermomètre de l’adoption réelle ; la granularité hebdomadaire est l’ECG des changements de cap à court terme.
Pour les matrices de capacité Agent et la sélection de juin, voir notre guide de sélection Agent OpenRouter. Ce texte se concentre sur les données de facturation hebdomadaire et la structure commerciale des fournisseurs.
02 28,9 billions de tokens : volume mondial et dynamique Chine/États-Unis
Période : 18–24 mai 2026 (fenêtre glissante OpenRouter). Volume hebdomadaire mondial : 28,9 billions de tokens, +7,4 % semaine sur semaine, cinquième hausse consécutive. Il y a un an : environ 2,4 billions — croissance d’environ 12× sur un an. L’IA entre en phase de déploiement à grande échelle.
| Indicateur | Valeur | Sem./sem. | Lecture |
|---|---|---|---|
| Volume hebdo mondial | 28,9 billions de tokens | +7,4 % | Cinquième semaine de hausse, marché en expansion |
| Modèles chinois | 9,223 billions | +19,89 % | Croissance nettement supérieure à la moyenne mondiale |
| Modèles américains | 4,93 billions | +16,27 % | Volume absolu élevé, mais dépassé par la Chine en hebdo |
| Chine vs États-Unis | Chine #1 quatre semaines de suite | — | Part CN <2 % début 2025 ; premier dépassement US fév. 2026 ; mai ~45 %+ |
L’enjeu régional n’est pas l’étiquette nationale mais la combinaison open source + API à prix minimal qui redéfinit le routage par défaut : agents, batch et code vers DeepSeek Flash, Hy3, MiniMax — les flagships fermés occidentaux restent dans le raisonnement complexe enterprise à fort prix unitaire et faible volume.
03 Top 10 semaine du 24 mai 2026 : qui capte le plus de tokens ?
Classement par modèle (entrée + sortie). Trois modèles DeepSeek dans le top 9 ; total série 5,74 billions (+25,9 % sem./sem.), deuxième semaine consécutive en #1 fournisseur par volume hebdo, devant Anthropic et Google.
| Rang | Modèle | Fournisseur | Tokens/semaine | Sem./sem. | Profil |
|---|---|---|---|---|---|
| 1 | DeepSeek-V4-Flash | DeepSeek | 3,43T | +66 % | Default Agent, prix minimal |
| 2 | Tencent Hy3 Preview | Tencent | 3,07T | +16 % | Forte croissance post-gratuité |
| 3 | Claude Sonnet 4.6 | Anthropic | 1,35T | — | 1M contexte, code enterprise |
| 4 | DeepSeek-V3.2 | DeepSeek | 1,31T | — | Long tail économique, roleplay |
| 5 | Owl Alpha | OpenRouter | 1,15T | +29 % | Gratuit, spécialisé Agent, 1M contexte |
| 6 | Gemini 3 Flash Preview | 1,06T | — | Multimodal, académique/médical | |
| 7 | DeepSeek-V4-Pro | DeepSeek | 1,00T | — | Flagship matrice (série 5,74T) |
| 8 | MiniMax M2.7 | MiniMax | 806B | — | Rapport qualité-prix long contexte |
| 9 | Grok 4.1 Fast | xAI | 721B | — | 2M contexte, juridique |
| 10 | Step 3.5 Flash | StepFun | 673B | — | Rapide et économique, batch |
Changement notable : Kimi K2.6 sort du Top 10 (6e la semaine précédente) — le classement hebdo est très sensible à la rotation. DeepSeek-V4-Flash +66 % et Owl Alpha +29 % confirment la concentration vers « prix minimal + long contexte + tool calls stables », pas vers le flagship le plus cher.
04 Paradoxe Anthropic : parts tokens en baisse, revenus USD proches de la moitié
OpenRouter fournit aussi la comparaison par fournisseur : parts de tokens vs parts de revenus en dollars. Les deux tableaux révèlent la stratification du marché IA en 2026.
| Niveau | Exemple | Profil tokens | Profil revenus | Scénarios types |
|---|---|---|---|---|
| Haute valeur · faible volume | Claude Opus 4.6 | Part tokens minime | Prix unitaire très élevé, millions USD/mois | Raisonnement complexe, décisions à haut risque |
| Équilibre · volume moyen | Gemini 3 Flash | Part tokens modérée | Prix moyen, prime multimodale | Académique, médical, analyse multimodale |
| Prix minimal · fort volume | DeepSeek / MiniMax / StepFun | Dominent le classement hebdo, croissance la plus rapide | Faible revenu/token, victoire par l’échelle | Agents, code, traitement par lots |
En chiffres Anthropic : ~12 % des tokens (contre ~25 % il y a un an, en baisse continue) mais ~46 % des revenus USD. Les clients enterprise paient toujours un premium pour Claude/Opus — la direction du trafic appartient aux matrices open source chinoises et aux modèles Agent gratuits. Opus 4.6 peut traiter une fraction du volume DeepSeek tout en générant environ 25 millions USD par mois (estimations publiques).
Pour les équipes : classement hebdo pour le modèle par défaut ; le CFO examine les parts de revenus pour la réalité budgétaire API. Les deux vues sont indispensables.
05 Corrélation inverse benchmarks/marché : rapport a16z et données citables
Le rapport conjoint OpenRouter/a16z « 2025 AI Usage » (environ 100 billions de tokens de métadonnées anonymes) documente une conclusion contre-intuitive : les scores benchmark et les parts de marché sont presque inversement corrélés. Les modèles « assez bons et peu chers » absorbent le trafic ; les champions d’évaluation restent sur les slides.
- Les développeurs priorisent le coût d’inférence, pas l’intelligence maximale. Une nuit de pipeline Agent rend les écarts de prix plus critiques que les petits écarts de qualité.
- Les agents dépendent de la stabilité et de la latence API. Un tool call échoué coûte plus qu’un gain théorique de +2 points MMLU.
- Le code est la plus grande catégorie unique. De ~11 % début 2025 à 50 %+ du trafic plateforme — ce qui explique DeepSeek Flash et Sonnet 4.6 en tête durable.
Données techniques citables (sources publiques à la rédaction ; vérifier OpenRouter en direct avant routage) :
- Volume hebdo mondial : 28,9 billions (18–24 mai 2026), +7,4 %, ~12× sur un an.
- Série DeepSeek : 5,74 billions/semaine, +25,9 % ; V4-Flash seul 3,43T, +66 %.
- Chine vs États-Unis : 9,223T (+19,89 %) vs 4,93T (+16,27 %) ; Chine #1 quatre semaines.
- Anthropic double indicateur : ~12 % tokens vs ~46 % revenus USD ; ~25 % tokens il y a un an.
- Part code : OpenRouter/a16z : 11 % → 50 %+, plus grande catégorie unique.
Conclusion : les chiffres de facturation sont plus honnêtes que tout classement d’évaluation. Le classement hebdo est le signal le plus fréquent et le moins coûteux pour ajuster le routage OpenRouter.
06 Checklist en six étapes : suivre le classement hebdo et router
- Consulter chaque lundi : openrouter.ai/rankings — noter Top 10 et variation sem./sem. ; nouvelles entrées ou >30 % → test de fumée d’1 heure.
- Séparer défaut et upgrade : 80 % des étapes Agent vers DeepSeek-V4-Flash ou Sonnet 4.6 ; escalade V4-Pro / Opus seulement après deux échecs ou tâche high-risk.
- Croiser tableaux tokens et USD : pour la finance, capturer parts tokens et parts revenus — « volume #1 » ≠ « plus gros budget ».
- Choisir par scénario, pas par keynote : Agent/batch → Flash ; raisonnement complexe → Opus ; multimodal → Gemini Flash ; surveiller Hy3 et Owl Alpha.
- Limites de dépense et rapport hebdo : plafond mensuel par clé projet OpenRouter ; export hebdomadaire croisé avec l’évolution du classement.
- Déployer un hôte 24/7 : persister clés API, routage et unités launchd sur Mac dédié ; fermer un portable interrompt les agents longue durée — macOS bare metal requis (voir dépannage OpenClaw Mac distant).
Modifier le routage sans résoudre « qui exécute l’agent » est insuffisant : Mac personnel éteint = coupure ; VPS sursouscrits souvent sans macOS officiel/Metal/TCC ; jitter SSH interrompt les boucles d’outils ; machines partagées compliquent rotation des clés et versions CLI.
Pour les équipes exécutant Cursor Agent, OpenClaw Gateway et CI iOS en parallèle, le Mac bare metal multi-régions JEXCLOUD offre un hôte de production stable : Apple Silicon dédié, macOS authentique, livraison en 120 secondes, location mensuelle flexible. Facturation modèles via OpenRouter ; machine et routage séparés. Spécifications : tarifs, intégration : centre d’aide.