OpenRouter Weekly Token Rankings: биллинг не врёт — кто реальный лидер?
Пока MMLU и HumanEval спорят на сцене «кто умнее», недельный рейтинг OpenRouter фиксирует другое: сколько триллионов токенов разработчики и компании реально отдали каждой модели за 7 дней. Биллинг не врёт — потраченные деньги и прошедший трафик ближе к продакшену, чем любой одиночный benchmark.
Текст для тех, кто объясняет команде и руководству «что рынок реально использует»: почему недельные rolling tokens бьют benchmarks; глобальные 28,9 трлн за неделю до 2026-05-24 и расклад Китай/США; Top 10 моделей и доминирование матрицы DeepSeek; парадокс Anthropic (падающая доля tokens, ~46% USD revenue); обратная корреляция benchmark/рынок из отчёта a16z; чеклист routing из шести шагов; зачем 24/7 агентам нужен bare-metal cloud Mac. Источник: OpenRouter Rankings, 7-дневное скользящее окно, на 2026-05-24.
01 Почему недельный объём OpenRouter важнее MMLU для продакшена
OpenRouter — крупнейшая нейтральная агрегирующая платформа API: 300+ моделей, 60+ вендоров (OpenAI, Anthropic, Google, DeepSeek и др.), 8M+ пользователей, ~100 трлн токенов в месяц. Rankings суммирует input+output на недельной (7-дневной) rolling основе — самое прямое публичное окно «кто реально вызывается».
- Benchmark меряет потолок, биллинг — default. Лабораторный single-shot score не видит multi-step agent loops, retries и стоимость tool calls. В топе — Flash-tier и open MoE, не keynote-флагманы.
- Самоотчёты вендоров несопоставимы. Разные eval sets и inference tiers. OpenRouter нормализует billing и routing — недельные tokens сортируются напрямую.
- Месячные агрегаты скрывают недельные переломы. Новые модели (Hy3 Preview, Owl Alpha) часто взрываются сначала в WoW.
- Token share и USD revenue расходятся. Дорогой closed-source может доминировать в выручке при падающем объёме — «#1 по usage» ≠ структура бюджета.
Тезис: объём токенов — термометр реального adoption; недельная гранулярность — ЭКГ краткосрочных сдвигов рынка.
Матрица моделей под Agent и снимок июня — в нашем гайде по выбору Agent на OpenRouter. Здесь фокус на недельных billing-данных и коммерческой структуре вендоров.
02 28,9 трлн недельных tokens: глобальный объём и Китай vs США
Период: 18–24 мая 2026 (OpenRouter 7-day rolling). Глобальный недельный объём платформы: 28,9 трлн tokens, +7,4% WoW, пятая неделя роста подряд. Год назад: ~2,4 трлн — рост ~12× YoY. AI вышел в фазу масштабного deployment.
| Метрика | Значение | WoW | Интерпретация |
|---|---|---|---|
| Глобальный недельный объём | 28,9 трлн tokens | +7,4% | Пятая неделя роста, рынок расширяется |
| Китайские модели | 9,223 трлн | +19,89% | Рост сильно выше глобального среднего |
| US-модели | 4,93 трлн | +16,27% | Абсолют велик, но обогнаны Китаем по неделе |
| Китай vs США | Китай #1 четыре недели подряд | — | Доля CN <2% нач. 2025; первый обгон US в фев. 2026; май ~45%+ |
Региональный сдвиг — не «национальная метка», а open source + ультра-дешёвые API, переписывающие default route: агенты, batch и coding на DeepSeek Flash, Hy3, MiniMax — западные closed флагманы остаются в дорогом enterprise reasoning с низким token volume.
03 Top 10 недели до 24 мая 2026: кто забрал больше всего tokens?
Рейтинг по моделям (input + output). Три модели DeepSeek в top 9; сумма серии 5,74 трлн (+25,9% WoW), вторая неделя подряд #1 вендор по недельному объёму — впереди Anthropic и Google.
| # | Модель | Вендор | Tokens/нед. | WoW | Профиль |
|---|---|---|---|---|---|
| 1 | DeepSeek-V4-Flash | DeepSeek | 3,43T | +66% | Agent default, минимальная цена |
| 2 | Tencent Hy3 Preview | Tencent | 3,07T | +16% | Сильный рост после free tier |
| 3 | Claude Sonnet 4.6 | Anthropic | 1,35T | — | 1M context, enterprise coding |
| 4 | DeepSeek-V3.2 | DeepSeek | 1,31T | — | Дешёвый long tail, roleplay |
| 5 | Owl Alpha | OpenRouter | 1,15T | +29% | Бесплатный Agent-specialized, 1M context |
| 6 | Gemini 3 Flash Preview | 1,06T | — | Multimodal, академия/медицина | |
| 7 | DeepSeek-V4-Pro | DeepSeek | 1,00T | — | Флагман матрицы (серия 5,74T) |
| 8 | MiniMax M2.7 | MiniMax | 806B | — | Цена/качество long context |
| 9 | Grok 4.1 Fast | xAI | 721B | — | 2M context, legal |
| 10 | Step 3.5 Flash | StepFun | 673B | — | Быстро/дёшево, batch |
Заметно: Kimi K2.6 выпал из Top 10 (был #6) — недельный рейтинг крайне чувствителен к ротации. DeepSeek-V4-Flash +66% WoW и Owl Alpha +29% показывают концентрацию на «минимальная цена + long context + стабильные tool calls», а не на самый дорогой флагман.
04 Парадокс Anthropic: ~12% tokens, ~46% USD revenue
OpenRouter даёт сравнение по вендору: доля tokens vs доля USD revenue. Только два слоя таблиц показывают стратификацию рынка AI 2026.
| Уровень | Пример | Token-профиль | Revenue-профиль | Типичные сценарии |
|---|---|---|---|---|
| Высокая ценность · низкий volume | Claude Opus 4.6 | Минимальная доля tokens | Очень высокий $/token, миллионы USD/мес | Сложный enterprise reasoning, high-risk decisions |
| Баланс · средний volume | Gemini 3 Flash | Средняя доля tokens | Средняя цена, multimodal premium | Академия, медицина, multimodal analysis |
| Ультра-дешёво · высокий volume | DeepSeek / MiniMax / StepFun | Доминируют недельный рейтинг, fastest growth | Низкий $/token, победа масштабом | Agents, coding, batch |
Anthropic в цифрах: ~12% token share (год назад ~25%, падает), но ~46% USD revenue share. Enterprise платит premium за Claude/Opus reasoning — лидерство по трафику у китайских open matrices и бесплатных agent-моделей. Opus 4.6 может обрабатывать долю DeepSeek-серии, но давать ~$25M/мес (публичные оценки).
Для команд: недельный рейтинг — default model; CFO смотрит revenue share для API-бюджета. Обе метрики обязательны.
05 Обратная корреляция benchmark/рынок: отчёт a16z и цифры для слайдов
Совместный отчёт OpenRouter/a16z «2025 AI Usage» (~100 трлн tokens анонимных метаданных): benchmark scores почти обратно коррелируют с market share. Самые «достаточно хорошие и дешёвые» модели забирают трафик; eval-чемпионы остаются на слайдах.
- Разработчики ставят inference cost выше marginal IQ. Ночной agent pipeline делает разницу в цене критичнее малых quality gaps.
- Agents зависят от stability и API latency. Один failed tool call дороже +2 MMLU в теории.
- Coding — крупнейшая single category. С ~11% нач. 2025 до 50%+ platform traffic — объясняет DeepSeek Flash и Sonnet 4.6 в топе.
Цитируемые техданные (публичные источники на дату публикации; перед routing сверяйте OpenRouter live):
- Глобальный недельный объём: 28,9 трлн (18–24 мая 2026), +7,4% WoW, ~12× YoY.
- DeepSeek series: 5,74 трлн/нед., +25,9% WoW; V4-Flash alone 3,43T, +66% WoW.
- Китай vs США: 9,223T (+19,89%) vs 4,93T (+16,27%); Китай #1 четыре недели.
- Anthropic dual: ~12% tokens vs ~46% USD revenue; год назад ~25% tokens.
- Доля coding: OpenRouter/a16z: 11% → 50%+, крупнейшая single category.
Вывод: цифры биллинга честнее любого eval-рейтинга. Недельный рейтинг — самый частый и дешёвый сигнал для корректировки OpenRouter routing.
06 Чеклист из шести шагов: трекинг недельного рейтинга и routing
- Проверять каждый понедельник: openrouter.ai/rankings — Top 10 и WoW; новые входы или >30% WoW → 1h smoke test.
- Разделить default и upgrade: 80% agent steps на DeepSeek-V4-Flash или Sonnet 4.6; только после двух fail или high-risk → V4-Pro / Opus.
- Сверять token и USD таблицы: для finance — screenshot vendor token share и revenue share; «volume #1» ≠ «biggest budget».
- Выбирать по сценарию, не по keynote: agent/batch → Flash; complex enterprise reasoning → Opus; multimodal → Gemini Flash; следить за Hy3 и Owl Alpha.
- Spend limits и недельный отчёт: monthly cap на OpenRouter project key; weekly export vs shift рейтинга — ваш route отстаёт от рынка?
- Деплой 24/7 host: persist API keys, routing, launchd на dedicated Mac; закрытый laptop рвёт long-running agents — нужен bare-metal macOS (см. troubleshooting OpenClaw remote Mac).
Routing без ответа «кто крутит агента» не работает: личный Mac offline = pipeline stop; oversold VPS часто без real macOS/Metal/TCC; SSH jitter рвёт tool loops; shared machines усложняют key rotation и CLI versions.
Для команд с Cursor Agent, OpenClaw Gateway и iOS CI параллельно: JEXCLOUD multi-region bare-metal Mac — dedicated Apple Silicon, genuine macOS, 120-секундный provisioning, гибкая месячная аренда. Model billing через OpenRouter; machine и routing разделены. Спеки: pricing, onboarding: help center.