AI Agent OpenRouter 2026.07.01

OpenRouter 2026年6月ランキング完全解説: 中国モデルがトラフィック主導、下半期の賭け方

2026年6月はAI業界の転換点となりました。Claude Fable 5が輸出規制により全世界で停止し、OpenAIとAnthropicがIPO意向を示し、OpenRouter上の中国発モデルトラフィックが約61%に達しました。本記事はベンチマーク宣伝ではなく、数百万開発者の実Token呼び出し量に基づく6月ランキングを、会社別・モデル別の二軸で完全に分解します。

AIエンジニアと技術意思決定者向けに、①週次Token量による会社ランキング、②日次Token量Top 10、③米国モデルシェアの70%→30%急落、④用量王者と品質王者(Claude Opus 4.8)の分離、⑤シーン別選定速查表、⑥Q3 2026リリース予測と五大マクロトレンド、⑦6ステップのモデル無関係アーキテクチャを提示します。データ出典:OpenRouter Rankings、Artificial Analysis Intelligence Index、SWE-bench Pro(2026-06-30時点)。

01 2026年6月のOpenRouterランキングは何を測っているのか?

OpenRouterはAnthropic、Google、OpenAI、DeepSeek、腾讯、小米、MiniMax、Moonshotなど数百エンドポイントを単一APIに束ねる世界最大級のLLMゲートウェイです。ランキングは有料・無料を問わず実際のToken消費量で並べ替えており、プレスリリースやベンチマークのチェリーピッキングではなく、開発者が本番環境で継続課金しているモデルを直接反映します。

OpenRouterデータの信頼性(2026年6月)
指標 内容
対象ユーザー米国・欧州・インド・東アジアを含むグローバル開発者
計測単位週次・日次Token呼び出し量(入力+出力)
MMLUとの差単発Q&A品質ではなく、Agent多段実行・ツール呼び出しの実運用を反映
6月の特異点中国発オープン/超低価格MoEがTop 10の過半数を占有
  • 課題一:旗艦一本足打法のコスト爆発。Claudeで1時間コーディングすると約10ドル、DeepSeekなら50セント未満——サンディエゴの開発者の実測が示すように、経済学がランキングを動かしています。
  • 課題二:Fable 5停止後の品質空白。6月中旬に全世界停止したFable 5は品質指数100/100でしたが、現時点で最強の利用可能ClaudeはOpus 4.8です。
  • 課題三:「最強モデル」という問いの陳腐化。Q3にGPT-6、Claude Opus 5、Gemini 4、DeepSeek V5が集中リリース予定で、三か月後の首位は今日と異なる可能性が高いです。

02 会社別ランキング:週Token量と市占率(2026年6月)

以下はOpenRouter週次Token統計に基づく会社ランキングです。中国発ベンダーがTop 8中5社を占め、合計シェアは約46%(表内中国企業の合算)に達します。

OpenRouter 会社別ランキング(週Token量、2026年6月)
順位 会社 本社 週Token量 市占率
1DeepSeek中国5.13T17.6%
2Anthropic米国4.34T14.8%
3Google米国3.66T12.5%
4OpenAI米国2.46T8.4%
5小米 (Xiaomi)中国2.42T8.3%
6MiniMax中国2.37T8.1%
7腾讯 (Tencent)中国2.36T8.1%
8阿里 Qwen中国1.26T4.3%

DeepSeek単独で17.6%を占め、V4 FlashとV4 Proの二刀流が効いています。Anthropicは品質ブランドで14.8%を維持していますが、OpenAIは8.4%まで後退——GPT-5.6シリーズのリリース後も、OpenRouter上の実トラフィックは中国MoEに押されています。

03 モデルTop 10:日次Token量ランキング(2026年6月)

モデル単位では中国発がTop 4を独占し、Claudeファミリーが品質防衛線として3枠を確保しています。

OpenRouter モデルTop 10(日次Token量、2026年6月)
順位 モデル ベンダー 日次Token 主要特性
1DeepSeek V4 FlashDeepSeek619BMoE 284B/13B活性、1Mコンテキスト、極低API単価
2Hy3 Preview腾讯451BオープンMoE、Agent/推論、効率約40%向上
3MiniMax M3MiniMax447B$0.60/M入力、オープンウェイト、自ホスト可
4MiMo-V2.5小米327B高コスパ日常コーディング
5DeepSeek V4 ProDeepSeek300B旗艦MoE、複雑Agent向け
6Claude Opus 4.7Anthropic263Bレガシー旗艦、段階的4.8移行中
7Claude Opus 4.8Anthropic~200B品質指数61.4で首位、長コンテキスト最強
8Claude Sonnet 4.6Anthropic178B本番デフォルト、無料枠あり
9Gemini 3 Flash PreviewGoogle156Bマルチモーダル、低レイテンシ
10Kimi K2.6Moonshot~150B1Mコンテキスト、Agent Swarm

この表が示すのは「誰が最も賢いか」ではなく「誰が本番で最も使われているか」です。Top 4はいずれも入力単価がOpus 4.8($5.00/M)の1/8~1/30帯に収まります。

04 最大の構造変化:米国モデルシェアが70%から30%へ

Bloombergが引用したOpenRouter・Exponential Viewの時系列データは、一年で地図が書き換わったことを示しています。

米国モデル(Google+OpenAI+Anthropic)Tokenシェア推移
時点 米国3社合計シェア 中国モデル獲得分
2025年6月約70%
2026年6月約30%+40ポイント

40ポイントは「中国開発者の国産支持」ではありません。OpenRouterユーザーはグローバルに分布しており、米国・欧州・インドの開発者がDeepSeek、小米、MiniMaxを選んでいます。理由は三つに集約されます:価格(MiniMax M3は$0.60/M、Opus 4.8の1/8)、十分な品質(日常タスクで旗艦の80~90%)、オープンウェイト(自ホストでデータ主権を確保)。

これは能力の物語ではなく、経済学の物語です——少なくとも95%の日常ワークロードに限れば。

05 用量第一と品質第一は別物:Claude Opus 4.8の位置づけ

多くの報道が混同している点を明確にします。Token量ランキングの王者ベンチマーク品質の王者は2026年6月時点で一致していません。

品質層:Artificial Analysis Intelligence Index(2026年5月末)
モデル 総合品質指数 SWE-bench Pro 備考
Claude Opus 4.861.4(#1)69.2%長コンテキスト・Agentで圧倒的
GPT-5.559–6063.1%エコシステム・ツール呼び出し速度
Gemini 3.1 Pro57高難度推論
Qwen 3.7 Max57中国発クローズド最上位
Claude Sonnet 4.680.8%(Verified)指示追従・ライティング

20タスクの実測ではOpus 4.8が16勝、GPT-5.5が5勝、Gemini 3.1 Proが4勝——特に長コンテキストでは「別カテゴリ」と評されるケースが多いです。一方、MiniMax M3は用量3位でありながら品質指数は旗艦より低い——しかし日常コーディング補助・翻訳・要約では旗艦の80~90%で十分というのが開発者の実判断です。

引用可能データ(公開ソース、デプロイ前に再検証してください):

  • MiniMax M3 API:入力$0.60/M、Claude Opus 4.8($5.00/M)の約1/8
  • DeepSeek V4 Flash API:入力~$0.14/M(キャッシュヒット~$0.028/M)、出力~$0.28/M、1Mコンテキスト
  • Anthropic State of AI Agents 2026:Claude API呼び出しの約44%が数学・コンピュータタスク

06 シーン別最適モデル速查表(2026年6月版)

ユースケース別推奨モデル(2026年6月)
シーン 推奨モデル 代替 選定理由
複雑コード / 長時間AgentClaude Opus 4.8DeepSeek V4 Pro品質指数#1、長コンテキスト無双
日常プログラミング補助DeepSeek V4 FlashMiMo-V2.5極高コスパ、高速
超低価格APIMiniMax M3Hy3 Preview$0.60/M、オープンウェイト
超長コンテキストKimi K2.6DeepSeek V4 Flash1Mウィンドウ、競争力ある価格
GoogleエコシステムGemini 3.5 FlashGemini 3 Flash PreviewWorkspaceネイティブ統合
リアルタイムWeb検索Grok 4.3GPT-5.5X/Twitterリアルタイムコンテキスト
自ホスト / オンプレGLM 5.2Kimi K2.6トップオープンウェイト
画像生成(文字描画)ChatGPT Images 2.0AI生成画像の文字レンダリング最強

推奨戦略はデュアルモデルルーティングです。約80%をV4 FlashまたはSonnet 4.6に流し、2回失敗または高リスクタグ時のみOpus 4.8へエスカレーションします。ダラスの開発者の実例:複雑タスクに月$500(Claude+ChatGPT)、日常90%に月$200(MiniMax+Kimi+MiMo)——複雑度でルートし、コストで最適化するのが2026年の標準プレイブックです。

07 Q3 2026予測:モデル大爆発と五大マクロトレンド

Q3 2026はAI史上最多のフロンティアリリースが集中する四半期になる見込みです。

Q3 2026 高確度リリース予測
モデル ベンダー 予想時期 核心アップグレード
GPT-6OpenAI2026年8–9月1.5Mコンテキスト(噂)、Agent強化
Claude Opus 5Anthropic2026年9月前後長時間Agent全面刷新、MCP更新
Gemini 4Google2026年Q3動画・音声マルチモーダル飛躍
DeepSeek V5DeepSeek2026年Q3オープンウェイト、~1Tパラメータ
GLM 5.2智谱 Z.aiリリース済トップオープンウェイト、強コーディング

五大マクロトレンド

  1. 「最強モデル」という問いの終焉。90日間に5社がフロンティアを投入すれば、ワークロード別最適解しか残りません。最難5%はクローズド旗艦、残り95%は中国オープンウェイト——という二層市場が固定化します。
  2. 中国モデルシェアは個人開発者で70%超も、企業調達は30%未満が上限。米国議会の監視、データレジデンシー、サプライチェーンセキュリティがエンタープライズの天井になります。
  3. Agent性能が唯一の調達指標。SWE-bench Pro、OSWorld-Verified、長時間タスク完了率がMMLUを置き換えています。
  4. IPO圧力が価格体系を再編。OpenAIとAnthropicの6月IPO意向は、マージン圧力とFlash帯の拡大を加速し、結果的に中国競合の価格戦を正当化します。
  5. ローカルモデルが2027年中にSWE-bench 80%突破。32GB消費者GPUで旗艦級コーディングアシスタントが現実的になり、ルーチンAPI市場の根幹が揺らぎます。

権威ソース:OpenRouter RankingsArtificial AnalysisAnthropic State of AI Agents 2026

08 6ステップ:モデル無関係アーキテクチャとJEXCLOUD

6月の本質は「中国が勝った」ではなく、モデル層の利益が急速に圧縮されていることです。最も価値あるスキルは「最強モデルを選ぶ」ことではなく、「アプリを書き換えずにモデルを切り替えられるアーキテクチャを構築する」ことです。

  1. ワークロード棚卸し:過去30日間のAgentステップ数、ツール呼び出し回数、マルチモーダル有無を記録します。ステップ20超またはリトライ頻発ならOpus/V4 Pro枠を確保します。
  2. Token支出試算:日次ボリュームにOpenRouter実効単価(キャッシュ読み取り含む)を乗じます。Flash帯は旗艦の5~20倍安いことが多いです。
  3. 統合ゲートウェイ登録:OpenRouterでプロジェクトキーを作成し、デフォルトをV4 FlashまたはSonnet 4.6に設定、月次支出上限を設けます。
  4. デュアルモデルルーティング構成:Cursor、Claude Code、OpenClawで「単純編集」と「複雑リファクタ」を別model IDにマップし、2回失敗で自動エスカレーションします。
  5. ツール呼び出しストレステスト:10以上のツール定義を持つフィクスチャRepoで50ループ実行し、JSON/XMLパース失敗率を追跡します。
  6. 7×24ホスト展開:APIキー、Skills、launchdユニットをバージョン管理し、Gateway/CLIを専用Mac上で常時稼働させます(OpenClawリモートMac参照)。

APIルーティングだけでは「誰がAgentを24時間動かすか」は解決しません。個人Macはスリープで停止し、共有VPSはmacOS/Metal/TCC保証が弱く、SSHジッターが多段ツールループを破壊します。Cursor Agent、OpenClaw Gateway、iOS CIを一体運用するチームには、JEXCLOUD多地域ベアメタルMacが安定した本番ホストです。専用Apple Silicon、実macOS、約120秒プロビジョニング、月次弾性契約——API課金はOpenRouter、インフラはJEXCLOUDという分離が2026年の最適解です。詳細はJEXCLOUD 料金ページをご覧ください。