AI Agent OpenRouter 2026.06.06

OpenRouter Weekly Token Rankings: биллинг не врёт — кто реальный лидер?

Пока MMLU и HumanEval спорят на сцене «кто умнее», недельный рейтинг OpenRouter фиксирует другое: сколько триллионов токенов разработчики и компании реально отдали каждой модели за 7 дней. Биллинг не врёт — потраченные деньги и прошедший трафик ближе к продакшену, чем любой одиночный benchmark.

Текст для тех, кто объясняет команде и руководству «что рынок реально использует»: почему недельные rolling tokens бьют benchmarks; глобальные 28,9 трлн за неделю до 2026-05-24 и расклад Китай/США; Top 10 моделей и доминирование матрицы DeepSeek; парадокс Anthropic (падающая доля tokens, ~46% USD revenue); обратная корреляция benchmark/рынок из отчёта a16z; чеклист routing из шести шагов; зачем 24/7 агентам нужен bare-metal cloud Mac. Источник: OpenRouter Rankings, 7-дневное скользящее окно, на 2026-05-24.

01 Почему недельный объём OpenRouter важнее MMLU для продакшена

OpenRouter — крупнейшая нейтральная агрегирующая платформа API: 300+ моделей, 60+ вендоров (OpenAI, Anthropic, Google, DeepSeek и др.), 8M+ пользователей, ~100 трлн токенов в месяц. Rankings суммирует input+output на недельной (7-дневной) rolling основе — самое прямое публичное окно «кто реально вызывается».

  • Benchmark меряет потолок, биллинг — default. Лабораторный single-shot score не видит multi-step agent loops, retries и стоимость tool calls. В топе — Flash-tier и open MoE, не keynote-флагманы.
  • Самоотчёты вендоров несопоставимы. Разные eval sets и inference tiers. OpenRouter нормализует billing и routing — недельные tokens сортируются напрямую.
  • Месячные агрегаты скрывают недельные переломы. Новые модели (Hy3 Preview, Owl Alpha) часто взрываются сначала в WoW.
  • Token share и USD revenue расходятся. Дорогой closed-source может доминировать в выручке при падающем объёме — «#1 по usage» ≠ структура бюджета.

Тезис: объём токенов — термометр реального adoption; недельная гранулярность — ЭКГ краткосрочных сдвигов рынка.

Матрица моделей под Agent и снимок июня — в нашем гайде по выбору Agent на OpenRouter. Здесь фокус на недельных billing-данных и коммерческой структуре вендоров.

02 28,9 трлн недельных tokens: глобальный объём и Китай vs США

Период: 18–24 мая 2026 (OpenRouter 7-day rolling). Глобальный недельный объём платформы: 28,9 трлн tokens, +7,4% WoW, пятая неделя роста подряд. Год назад: ~2,4 трлн — рост ~12× YoY. AI вышел в фазу масштабного deployment.

OpenRouter: глобальный и региональный обзор (18–24 мая 2026)
Метрика Значение WoW Интерпретация
Глобальный недельный объём 28,9 трлн tokens +7,4% Пятая неделя роста, рынок расширяется
Китайские модели 9,223 трлн +19,89% Рост сильно выше глобального среднего
US-модели 4,93 трлн +16,27% Абсолют велик, но обогнаны Китаем по неделе
Китай vs США Китай #1 четыре недели подряд Доля CN <2% нач. 2025; первый обгон US в фев. 2026; май ~45%+

Региональный сдвиг — не «национальная метка», а open source + ультра-дешёвые API, переписывающие default route: агенты, batch и coding на DeepSeek Flash, Hy3, MiniMax — западные closed флагманы остаются в дорогом enterprise reasoning с низким token volume.

03 Top 10 недели до 24 мая 2026: кто забрал больше всего tokens?

Рейтинг по моделям (input + output). Три модели DeepSeek в top 9; сумма серии 5,74 трлн (+25,9% WoW), вторая неделя подряд #1 вендор по недельному объёму — впереди Anthropic и Google.

OpenRouter Top 10 моделей за неделю (на 2026-05-24)
# Модель Вендор Tokens/нед. WoW Профиль
1 DeepSeek-V4-Flash DeepSeek 3,43T +66% Agent default, минимальная цена
2 Tencent Hy3 Preview Tencent 3,07T +16% Сильный рост после free tier
3 Claude Sonnet 4.6 Anthropic 1,35T 1M context, enterprise coding
4 DeepSeek-V3.2 DeepSeek 1,31T Дешёвый long tail, roleplay
5 Owl Alpha OpenRouter 1,15T +29% Бесплатный Agent-specialized, 1M context
6 Gemini 3 Flash Preview Google 1,06T Multimodal, академия/медицина
7 DeepSeek-V4-Pro DeepSeek 1,00T Флагман матрицы (серия 5,74T)
8 MiniMax M2.7 MiniMax 806B Цена/качество long context
9 Grok 4.1 Fast xAI 721B 2M context, legal
10 Step 3.5 Flash StepFun 673B Быстро/дёшево, batch

Заметно: Kimi K2.6 выпал из Top 10 (был #6) — недельный рейтинг крайне чувствителен к ротации. DeepSeek-V4-Flash +66% WoW и Owl Alpha +29% показывают концентрацию на «минимальная цена + long context + стабильные tool calls», а не на самый дорогой флагман.

04 Парадокс Anthropic: ~12% tokens, ~46% USD revenue

OpenRouter даёт сравнение по вендору: доля tokens vs доля USD revenue. Только два слоя таблиц показывают стратификацию рынка AI 2026.

Трёхуровневая структура рынка AI 2026 (volume vs платёжеспособность)
Уровень Пример Token-профиль Revenue-профиль Типичные сценарии
Высокая ценность · низкий volume Claude Opus 4.6 Минимальная доля tokens Очень высокий $/token, миллионы USD/мес Сложный enterprise reasoning, high-risk decisions
Баланс · средний volume Gemini 3 Flash Средняя доля tokens Средняя цена, multimodal premium Академия, медицина, multimodal analysis
Ультра-дешёво · высокий volume DeepSeek / MiniMax / StepFun Доминируют недельный рейтинг, fastest growth Низкий $/token, победа масштабом Agents, coding, batch

Anthropic в цифрах: ~12% token share (год назад ~25%, падает), но ~46% USD revenue share. Enterprise платит premium за Claude/Opus reasoning — лидерство по трафику у китайских open matrices и бесплатных agent-моделей. Opus 4.6 может обрабатывать долю DeepSeek-серии, но давать ~$25M/мес (публичные оценки).

Для команд: недельный рейтинг — default model; CFO смотрит revenue share для API-бюджета. Обе метрики обязательны.

05 Обратная корреляция benchmark/рынок: отчёт a16z и цифры для слайдов

Совместный отчёт OpenRouter/a16z «2025 AI Usage» (~100 трлн tokens анонимных метаданных): benchmark scores почти обратно коррелируют с market share. Самые «достаточно хорошие и дешёвые» модели забирают трафик; eval-чемпионы остаются на слайдах.

  • Разработчики ставят inference cost выше marginal IQ. Ночной agent pipeline делает разницу в цене критичнее малых quality gaps.
  • Agents зависят от stability и API latency. Один failed tool call дороже +2 MMLU в теории.
  • Coding — крупнейшая single category. С ~11% нач. 2025 до 50%+ platform traffic — объясняет DeepSeek Flash и Sonnet 4.6 в топе.

Цитируемые техданные (публичные источники на дату публикации; перед routing сверяйте OpenRouter live):

  • Глобальный недельный объём: 28,9 трлн (18–24 мая 2026), +7,4% WoW, ~12× YoY.
  • DeepSeek series: 5,74 трлн/нед., +25,9% WoW; V4-Flash alone 3,43T, +66% WoW.
  • Китай vs США: 9,223T (+19,89%) vs 4,93T (+16,27%); Китай #1 четыре недели.
  • Anthropic dual: ~12% tokens vs ~46% USD revenue; год назад ~25% tokens.
  • Доля coding: OpenRouter/a16z: 11% → 50%+, крупнейшая single category.

Вывод: цифры биллинга честнее любого eval-рейтинга. Недельный рейтинг — самый частый и дешёвый сигнал для корректировки OpenRouter routing.

06 Чеклист из шести шагов: трекинг недельного рейтинга и routing

  1. Проверять каждый понедельник: openrouter.ai/rankings — Top 10 и WoW; новые входы или >30% WoW → 1h smoke test.
  2. Разделить default и upgrade: 80% agent steps на DeepSeek-V4-Flash или Sonnet 4.6; только после двух fail или high-risk → V4-Pro / Opus.
  3. Сверять token и USD таблицы: для finance — screenshot vendor token share и revenue share; «volume #1» ≠ «biggest budget».
  4. Выбирать по сценарию, не по keynote: agent/batch → Flash; complex enterprise reasoning → Opus; multimodal → Gemini Flash; следить за Hy3 и Owl Alpha.
  5. Spend limits и недельный отчёт: monthly cap на OpenRouter project key; weekly export vs shift рейтинга — ваш route отстаёт от рынка?
  6. Деплой 24/7 host: persist API keys, routing, launchd на dedicated Mac; закрытый laptop рвёт long-running agents — нужен bare-metal macOS (см. troubleshooting OpenClaw remote Mac).

Routing без ответа «кто крутит агента» не работает: личный Mac offline = pipeline stop; oversold VPS часто без real macOS/Metal/TCC; SSH jitter рвёт tool loops; shared machines усложняют key rotation и CLI versions.

Для команд с Cursor Agent, OpenClaw Gateway и iOS CI параллельно: JEXCLOUD multi-region bare-metal Mac — dedicated Apple Silicon, genuine macOS, 120-секундный provisioning, гибкая месячная аренда. Model billing через OpenRouter; machine и routing разделены. Спеки: pricing, onboarding: help center.