OpenRouter 最新モデル週間 Token ランキング: 請求データは嘘をつかない、真の王者は誰か?
MMLU や HumanEval が発表会で「誰が賢いか」を争う一方、OpenRouter 週間呼び出量ランキングが記録するのは別の事実です。開発者と企業が過去 7 日間に、いったい何兆 Tokenを誰に渡したか。請求は嘘をつきません。支出した金額と流れたトラフィックは、単発 Benchmark より AI の実運用に近い指標です。
本記事は、チームや経営層に「市場が実際に使っているモデル」を説明する必要がある開発者、Tech Lead、調達担当者向けです。① 週間ローリング Token データがベンチマークより信頼できる理由、② 2026 年 5 月 24 日週の28.9 兆グローバル総量と米中の構図、③ 当週 Top 10 モデル週間ランキングと DeepSeek マトリクス覇権の論理、④ Anthropic「Token シェア低下・ドル収入は依然高い」プレミアムパラドックス、⑤ a16z 共同レポートの反直感結論、⑥ 六段階 OpenRouter ルーティング実装チェックリストと 7×24 Agent ホストに裸金属クラウド Mac が必要な理由を示します。データ出典:OpenRouter Rankings 週間(7 日ローリング)集計、2026-05-24 時点。
01 OpenRouter 週間呼び出量は MMLU ランキングより信頼できるのか?
OpenRouter は世界最大級の中立 AI モデル API 集約プラットフォームの一つです。300+ モデル、OpenAI、Anthropic、Google、DeepSeek など 60+ ベンダーをカバーし、プラットフォームユーザーは 800 万超、月間処理 Token は約 100 兆です。Rankings ページは週間(7 日ローリング)で入出力 Token スループットを集計し、毎週更新されます。「誰が実際に呼ばれているか」を観測する最も直接的な公開窓口です。
- 課題一:Benchmark は上限を測り、請求はデフォルトを測る。実験室の単発 Q&A スコアは、Agent の多段ループ、失敗リトライ、ツール呼び出しの実コストを反映しません。ランキング上位は Flash 帯とオープン MoE が多く、発表会の Opus 旗艦ではありません。
- 課題二:ベンダー自報データは横比較が困難。評価セットも推論モードもバラバラです。OpenRouter は同一課金・ルーティング層で集約するため、モデル横断の「週 Token 量」を直接比較できます。
- 課題三:月次総量は週次の転換点を隠す。Hy3 Preview や Owl Alpha のような新モデルは単週で先に急増します。四半期レポートだけではルーティング調整の窓を逃します。
- 課題四:Token シェアとドル収入は乖離しうる。高価格クローズドモデルは Token 占比が下がっても収入の大半を占めることがあります。「誰が一位か」だけ見ると予算構造を誤読します。
核となる論点:Token 呼び出量は AI 実運用と市場承認の体温計であり、週間ローリング基準は心電図のように短期の風向変化を捉えます。
Agent シナリオのモデル能力マトリクスと 6 月スナップショット選定については、当サイトの OpenRouter ランキング Agent 選定ガイドを参照してください。本稿は週間請求データとベンダー商業構造に焦点を当てます。
02 28.9 兆週間 Token:グローバル総量と米中の構図はどう変わったか?
集計期間:2026 年 5 月 18 日—5 月 24 日(OpenRouter 公式週間ローリング基準)。当週のグローバルプラットフォーム週間呼び出量は 28.9 兆 Token、前週比 +7.4%、五週連続上昇です。一年前の同基準は約 2.4 兆、一年で約 12 倍の成長であり、AI アプリは規模化爆発段階に入っています。
| 指標 | 数値 | 前週比 | 解読 |
|---|---|---|---|
| グローバル週間呼び出量 | 28.9 兆 Token | +7.4% | 五週連続上昇、プラットフォーム全体が拡大中 |
| 中国モデル週間呼び出量 | 9.223 兆 Token | +19.89% | グローバル平均を大きく上回る增速 |
| 米国モデル週間呼び出量 | 4.93 兆 Token | +16.27% | 絶対量は依然大きいが、中国モデル週量に逆転 |
| 中国 vs 米国 | 中国が四週連続首位 | — | 2025 年初は中国モデル流量占比 <2%、2026 年 2 月に初超米、5 月は約 45%+ |
地域格局の意味は「国籍ラベル」ではなく、オープンソース + 極低価格 API の組み合わせがデフォルトルートを再編している点にあります。開発者は大量の Agent、バッチ処理、プログラミングタスクを DeepSeek Flash、Hy3、MiniMax などの帯に寄せ、西方クローズド旗艦は高単価・低 Token の企業複雑推論シーンに残っています。
03 2026 年 5 月第四週 Top 10:誰が最多の週 Token を獲得したか?
下表は当週のモデル別週 Token ランキング(入出力合計)です。DeepSeek の3モデルが同時にトップ9に入り、シリーズ合計約 5.74 兆 Token(前週比 +25.9%)、二週連続でベンダー週間呼び出量第一位を維持し、Anthropic と Google を上回りました。
| 順位 | モデル | ベンダー | 週 Token 量 | 前週比 | 特徴 |
|---|---|---|---|---|---|
| 1 | DeepSeek-V4-Flash | DeepSeek | 3.43T | +66% | Agent ワークフロー第一候補、極低価格 |
| 2 | 腾讯 Hy3 Preview | Tencent | 3.07T | +16% | 限免終了後も高成長 |
| 3 | Claude Sonnet 4.6 | Anthropic | 1.35T | — | 百万コンテキスト、企業プログラミング主力 |
| 4 | DeepSeek-V3.2 | DeepSeek | 1.31T | — | 低価格ロングテール、ロールプレイ活発 |
| 5 | Owl Alpha | OpenRouter | 1.15T | +29% | 無料 Agent 特化、百万コンテキスト |
| 6 | Gemini 3 Flash Preview | 1.06T | — | マルチモーダル、学術・医療シーン | |
| 7 | DeepSeek-V4-Pro | DeepSeek | 1.00T | — | マトリクス旗艦(シリーズ合計 5.74T) |
| 8 | MiniMax M2.7 | MiniMax | 806B | — | 長コンテキストコスパ |
| 9 | Grok 4.1 Fast | xAI | 721B | — | 2M コンテキスト、法務シーン |
| 10 | Step 3.5 Flash | StepFun | 673B | — | 高速低価格、バッチ処理 |
当週の notable 変化:Kimi K2.6 は前週第 6 位だったが、当週はトップ十から脱落しました。週間ランキングは「ヒット交代」に極めて敏感です。首位 DeepSeek-V4-Flash 単週 +66% と Owl Alpha +29% は、Agent デフォルトルートが「極低価格 + 長コンテキスト + 安定ツール呼び出し」へ加速集中しており、最高価格旗艦へではないことを示しています。
04 Anthropic プレミアムパラドックス:Token シェアは下がるのにドル収入は近半?
OpenRouter はモデル週間ランキングに加え、ベンダー次元の Token シェアとドル収入シェアの対比も提供します。二つの表を重ねて初めて、2026 年 AI 市場の階層構造が見えます。
| 階層 | 代表モデル | Token 特徴 | 収入特徴 | 典型シーン |
|---|---|---|---|---|
| 高価値・低流量 | Claude Opus 4.6 | Token 占比極小 | 単価極高、月収数千万ドル級も | 企業複雑推論、高リスク意思決定 |
| コスパ・中流量 | Gemini 3 Flash | 中程度 Token 占比 | 中単価、マルチモーダルプレミアム | 学術、医療、マルチモーダル分析 |
| 極低価格・高流量 | DeepSeek / MiniMax / StepFun | 週間ランキング主導、增速最快 | Token 単価収入低、規模で勝つ | Agent、プログラミング、バッチ処理 |
Anthropic の「プレミアムパラドックス」は週次データで特に鮮明です。Token シェア約 12%(一年前は約 25%、継続低下)なのに、ドル収入シェアは依然約 46%です。企業ユーザーは Claude、特に Opus 帯の複雑推論に高価格を払い続けていますが、トラフィックの主導権は中国オープンマトリクスと無料 Agent モデルに移っています。Claude Opus 4.6 の月 Token 量は DeepSeek シリーズの数分の一でも、月収は約 2500 万ドル級に達する可能性があります(公開報道ベース)。
開発者への示唆:個人や小チームは週間ランキングでデフォルトモデルを選び、企業 CFO は収入シェアで「誰が API から稼いでいるか」を理解します。二つの表はどちらも欠かせません。
05 ベンチマークと市場シェアは逆相関?a16z レポートと引用可能ハードデータ
OpenRouter と a16z が共同公開した《2025 AI 使用レポート》(約 100 兆 Tokenの匿名メタデータに基づく)には、反直感の結論があります。モデル Benchmark スコアと実際の市場シェアはほぼ逆相関です。ランキングで最も「安くて十分安定」なモデルが最多流量を吸い、評測チャンピオンは発表会スライドに留まることが多いのです。
- 理由一:開発者は限界知能より推論コストを優先する。Agent パイプラインを一晩走らせると、能力差より価格差の方が致命的になります。
- 理由二:Agent は安定性と API 遅延に依存する。ツール呼び出しが一度失敗したときのリトライコストは、MMLU が 2 点高い理論的利益を上回ります。
- 理由三:プログラミングが最大単一用途になった。プログラミング関連タスクはプラットフォーム流量の 2025 年初約 11% から超 50% へ上昇しました。DeepSeek Flash と Sonnet 4.6 が長期ランキング上位にいる理由がここにあります。
引用可能な技術データ(執筆時点の公開資料、ルーティング前に OpenRouter リアルタイムページで再確認してください):
- グローバル週間呼び出量:28.9 兆 Token(2026-05-18 〜 05-24)、前週比 +7.4%、一年前比約 12 倍。
- DeepSeek シリーズ週合計:5.74 兆 Token、前週比 +25.9%;V4-Flash 単モデル 3.43T、単週 +66%。
- 米中週間呼び出对比:中国モデル 9.223T(+19.89%)vs 米国モデル 4.93T(+16.27%);中国が四週連続週量首位。
- Anthropic 二重指標:Token シェア約 12% vs ドル収入シェア約 46%;一年前 Token シェア約 25%。
- プログラミングタスク占比:OpenRouter + a16z レポート:2025 年初 11% から 50%+ へ、プラットフォーム最大単一用途カテゴリ。
結論の再確認:請求の数字は、どの評測ランキングよりも正直です。週間ランキングは OpenRouter ルーティング戦略を調整する最高頻度・最低コストのシグナル源です。
06 六段階 OpenRouter 週間ランキング追跡とルーティング実装チェックリスト
- 毎週月曜にランキング確認:openrouter.ai/rankings を開き、Top 10 モデルの週 Token と前週比を記録します。新規ランクインまたは前週比 >30% のモデルは 1 時間のスモークテストを優先します。
- 「デフォルト」と「アップグレード」ルートを分離:80% の Agent ステップは DeepSeek-V4-Flash または Sonnet 4.6 へ。二度失敗または high-risk タスクのみ V4-Pro / Opus へ昇格します。
- Token 表とドル表を対照:財務報告ではベンダー Token シェアと revenue シェアを同時にスクリーンショットし、「用量第一」と「予算最大」の混同を避けます。
- 発表会ではなくシーンで選定:Agent/バッチ → Flash 帯;企業複雑推論 → Opus;マルチモーダル → Gemini Flash。Hy3、Owl Alpha など新高增速モデルに注目します。
- spend limit と週報を設定:OpenRouter プロジェクト Key に月次上限を設定し、毎週用量をエクスポートして週間ランキング変化と突合し、自社ルートが市場に遅れていないか検証します。
- 7×24 ホストをデプロイ:API Key、ルーティング設定、launchd ユニットを専用 Mac に書き込みます。ノート PC の蓋を閉じると長時間 Agent が中断するため、裸金属 macOS 常駐が必要です(OpenClaw リモート Mac トラブルシュート参照)。
週間ランキングだけ見てもルートを変えても、「誰が Agent を走らせるか」は解決しません。個人 Mac はシャットダウンで断流します。オーバーセル VPS は非公式 macOS であることが多く、Metal と TCC が保証されず、SSH ジッターが多段ツールループを中断します。チーム共有マシンではキーローテーションと CLI バージョン統一も困難です。
Cursor Agent、OpenClaw Gateway、iOS CI を同時に走らせるチームには、JEXCLOUD 多地域裸金属 Mac がより安定した本番ホストです。専用 Apple Silicon、正規 macOS、120 秒デリバリー、月単位の柔軟レンタル。モデル請求は OpenRouter、マシンとルートは分離できます。仕様は 料金ページ、接続は ヘルプセンターをご覧ください。