AI Agent OpenRouter 2026.06.06

OpenRouter Weekly Token Rankings: биллинг не врёт — кто реальный лидер?

JEX

Инженерная команда JEXCLOUD

· 6 июня 2026 · около 16 минут чтения

Пока MMLU и HumanEval спорят на сцене «кто умнее», недельный рейтинг OpenRouter фиксирует другое: сколько триллионов токенов разработчики и компании реально отдали каждой модели за 7 дней. Биллинг не врёт — потраченные деньги и прошедший трафик ближе к продакшену, чем любой одиночный benchmark.

Текст для тех, кто объясняет команде и руководству «что рынок реально использует»: почему недельные rolling tokens бьют benchmarks; глобальные 28,9 трлн за неделю до 2026-05-24 и расклад Китай/США; Top 10 моделей и доминирование матрицы DeepSeek; парадокс Anthropic (падающая доля tokens, ~46% USD revenue); обратная корреляция benchmark/рынок из отчёта a16z; чеклист routing из шести шагов; зачем 24/7 агентам нужен bare-metal cloud Mac. Источник: OpenRouter Rankings, 7-дневное скользящее окно, на 2026-05-24.

01 Почему недельный объём OpenRouter важнее MMLU для продакшена

OpenRouter — крупнейшая нейтральная агрегирующая платформа API: 300+ моделей, 60+ вендоров (OpenAI, Anthropic, Google, DeepSeek и др.), 8M+ пользователей, ~100 трлн токенов в месяц. Rankings суммирует input+output на недельной (7-дневной) rolling основе — самое прямое публичное окно «кто реально вызывается».

Benchmark меряет потолок, биллинг — default. Лабораторный single-shot score не видит multi-step agent loops, retries и стоимость tool calls. В топе — Flash-tier и open MoE, не keynote-флагманы.
Самоотчёты вендоров несопоставимы. Разные eval sets и inference tiers. OpenRouter нормализует billing и routing — недельные tokens сортируются напрямую.
Месячные агрегаты скрывают недельные переломы. Новые модели (Hy3 Preview, Owl Alpha) часто взрываются сначала в WoW.
Token share и USD revenue расходятся. Дорогой closed-source может доминировать в выручке при падающем объёме — «#1 по usage» ≠ структура бюджета.

Тезис: объём токенов — термометр реального adoption; недельная гранулярность — ЭКГ краткосрочных сдвигов рынка.

Матрица моделей под Agent и снимок июня — в нашем гайде по выбору Agent на OpenRouter. Здесь фокус на недельных billing-данных и коммерческой структуре вендоров.

02 28,9 трлн недельных tokens: глобальный объём и Китай vs США

Период: 18–24 мая 2026 (OpenRouter 7-day rolling). Глобальный недельный объём платформы: 28,9 трлн tokens, +7,4% WoW, пятая неделя роста подряд. Год назад: ~2,4 трлн — рост ~12× YoY. AI вышел в фазу масштабного deployment.

OpenRouter: глобальный и региональный обзор (18–24 мая 2026)
Метрика	Значение	WoW	Интерпретация
Глобальный недельный объём	28,9 трлн tokens	+7,4%	Пятая неделя роста, рынок расширяется
Китайские модели	9,223 трлн	+19,89%	Рост сильно выше глобального среднего
US-модели	4,93 трлн	+16,27%	Абсолют велик, но обогнаны Китаем по неделе
Китай vs США	Китай #1 четыре недели подряд	—	Доля CN <2% нач. 2025; первый обгон US в фев. 2026; май ~45%+

Региональный сдвиг — не «национальная метка», а open source + ультра-дешёвые API, переписывающие default route: агенты, batch и coding на DeepSeek Flash, Hy3, MiniMax — западные closed флагманы остаются в дорогом enterprise reasoning с низким token volume.

03 Top 10 недели до 24 мая 2026: кто забрал больше всего tokens?

Рейтинг по моделям (input + output). Три модели DeepSeek в top 9; сумма серии 5,74 трлн (+25,9% WoW), вторая неделя подряд #1 вендор по недельному объёму — впереди Anthropic и Google.

OpenRouter Top 10 моделей за неделю (на 2026-05-24)
#	Модель	Вендор	Tokens/нед.	WoW	Профиль
1	DeepSeek-V4-Flash	DeepSeek	3,43T	+66%	Agent default, минимальная цена
2	Tencent Hy3 Preview	Tencent	3,07T	+16%	Сильный рост после free tier
3	Claude Sonnet 4.6	Anthropic	1,35T	—	1M context, enterprise coding
4	DeepSeek-V3.2	DeepSeek	1,31T	—	Дешёвый long tail, roleplay
5	Owl Alpha	OpenRouter	1,15T	+29%	Бесплатный Agent-specialized, 1M context
6	Gemini 3 Flash Preview	Google	1,06T	—	Multimodal, академия/медицина
7	DeepSeek-V4-Pro	DeepSeek	1,00T	—	Флагман матрицы (серия 5,74T)
8	MiniMax M2.7	MiniMax	806B	—	Цена/качество long context
9	Grok 4.1 Fast	xAI	721B	—	2M context, legal
10	Step 3.5 Flash	StepFun	673B	—	Быстро/дёшево, batch

Заметно: Kimi K2.6 выпал из Top 10 (был #6) — недельный рейтинг крайне чувствителен к ротации. DeepSeek-V4-Flash +66% WoW и Owl Alpha +29% показывают концентрацию на «минимальная цена + long context + стабильные tool calls», а не на самый дорогой флагман.

04 Парадокс Anthropic: ~12% tokens, ~46% USD revenue

OpenRouter даёт сравнение по вендору: доля tokens vs доля USD revenue. Только два слоя таблиц показывают стратификацию рынка AI 2026.

Трёхуровневая структура рынка AI 2026 (volume vs платёжеспособность)
Уровень	Пример	Token-профиль	Revenue-профиль	Типичные сценарии
Высокая ценность · низкий volume	Claude Opus 4.6	Минимальная доля tokens	Очень высокий $/token, миллионы USD/мес	Сложный enterprise reasoning, high-risk decisions
Баланс · средний volume	Gemini 3 Flash	Средняя доля tokens	Средняя цена, multimodal premium	Академия, медицина, multimodal analysis
Ультра-дешёво · высокий volume	DeepSeek / MiniMax / StepFun	Доминируют недельный рейтинг, fastest growth	Низкий $/token, победа масштабом	Agents, coding, batch

Anthropic в цифрах: ~12% token share (год назад ~25%, падает), но ~46% USD revenue share. Enterprise платит premium за Claude/Opus reasoning — лидерство по трафику у китайских open matrices и бесплатных agent-моделей. Opus 4.6 может обрабатывать долю DeepSeek-серии, но давать ~$25M/мес (публичные оценки).

Для команд: недельный рейтинг — default model; CFO смотрит revenue share для API-бюджета. Обе метрики обязательны.

05 Обратная корреляция benchmark/рынок: отчёт a16z и цифры для слайдов

Совместный отчёт OpenRouter/a16z «2025 AI Usage» (~100 трлн tokens анонимных метаданных): benchmark scores почти обратно коррелируют с market share. Самые «достаточно хорошие и дешёвые» модели забирают трафик; eval-чемпионы остаются на слайдах.

Разработчики ставят inference cost выше marginal IQ. Ночной agent pipeline делает разницу в цене критичнее малых quality gaps.
Agents зависят от stability и API latency. Один failed tool call дороже +2 MMLU в теории.
Coding — крупнейшая single category. С ~11% нач. 2025 до 50%+ platform traffic — объясняет DeepSeek Flash и Sonnet 4.6 в топе.

Цитируемые техданные (публичные источники на дату публикации; перед routing сверяйте OpenRouter live):

Глобальный недельный объём: 28,9 трлн (18–24 мая 2026), +7,4% WoW, ~12× YoY.
DeepSeek series: 5,74 трлн/нед., +25,9% WoW; V4-Flash alone 3,43T, +66% WoW.
Китай vs США: 9,223T (+19,89%) vs 4,93T (+16,27%); Китай #1 четыре недели.
Anthropic dual: ~12% tokens vs ~46% USD revenue; год назад ~25% tokens.
Доля coding: OpenRouter/a16z: 11% → 50%+, крупнейшая single category.

Вывод: цифры биллинга честнее любого eval-рейтинга. Недельный рейтинг — самый частый и дешёвый сигнал для корректировки OpenRouter routing.

06 Чеклист из шести шагов: трекинг недельного рейтинга и routing

Проверять каждый понедельник: openrouter.ai/rankings — Top 10 и WoW; новые входы или >30% WoW → 1h smoke test.
Разделить default и upgrade: 80% agent steps на DeepSeek-V4-Flash или Sonnet 4.6; только после двух fail или high-risk → V4-Pro / Opus.
Сверять token и USD таблицы: для finance — screenshot vendor token share и revenue share; «volume #1» ≠ «biggest budget».
Выбирать по сценарию, не по keynote: agent/batch → Flash; complex enterprise reasoning → Opus; multimodal → Gemini Flash; следить за Hy3 и Owl Alpha.
Spend limits и недельный отчёт: monthly cap на OpenRouter project key; weekly export vs shift рейтинга — ваш route отстаёт от рынка?
Деплой 24/7 host: persist API keys, routing, launchd на dedicated Mac; закрытый laptop рвёт long-running agents — нужен bare-metal macOS (см. troubleshooting OpenClaw remote Mac).

Routing без ответа «кто крутит агента» не работает: личный Mac offline = pipeline stop; oversold VPS часто без real macOS/Metal/TCC; SSH jitter рвёт tool loops; shared machines усложняют key rotation и CLI versions.

Для команд с Cursor Agent, OpenClaw Gateway и iOS CI параллельно: JEXCLOUD multi-region bare-metal Mac — dedicated Apple Silicon, genuine macOS, 120-секундный provisioning, гибкая месячная аренда. Model billing через OpenRouter; machine и routing разделены. Спеки: pricing, onboarding: help center.

Назад к блогу

Теги: OpenRouter Недельный объём Token-рейтинг DeepSeek Облачный Mac