OrcaRouter
OrcaRouter:スマートLLMルーティング&ガバナンスプラットフォーム
OrcaRouterとは何ですか
OrcaRouterはAIゲートウェイ(人工知能ゲートウェイ)であり、OpenAI互換の単一エンドポイントを通じて200以上の言語モデルにプロンプトをルーティングします。プロバイダーをハードコーディングする代わりに、実行時に各リクエストを評価し、品質とコストの目標に基づいて最適なモデルを選択します。また、すべての呼び出しに対してトークンの追加料金(トークンマークアップ)が一切かからないことを保証します。継続的に学習するモデルが各プロンプトを埋め込み(embedding)、利用可能なモデルと比較スコアリングし、2026年6月時点の公開RouterArenaリーダーボードで75.5%のルーティング精度を達成しています。上流プロバイダーがレート制限やエラーを返した場合、システムはクライアントがタイムアウトを検出する前に50ミリ秒未満で正常なモデルにフェイルオーバーします。OrcaRouterはさらに、コンテンツフィルタリングのガードレール(guardrails)、マルチステップAIワークフローを保護するエージェントファイアウォール(agent firewall)、全トラフィックのプロンプト動作と費用を追跡する可観測性ツール(observability tooling)も備えています。
OrcaRouter はどのように機能しますか
ユーザーは OpenAI 互換のエンドポイントを通じて OrcaRouter API にプロンプトを送信します。ルーターは各プロンプトをリアルタイムで評価・埋め込みし、200 以上のフロンティアモデルまたはオープンソースモデルの中から最適なものにルーティングします。トークンマークアップは一切かかりません。プロバイダーがレート制限やエラーを返した場合、OrcaRouter は応答が開始される前に 50 ミリ秒以内に健全なモデルへフェイルオーバーします。3 つのルーティング目標が利用可能です:品質基準を満たす最も安価なモデル、最高品質、またはその両方のバランス。
OrcaRouter の利点
OrcaRouter は、OpenAI 互換の単一エンドポイントを通じて 200 以上のモデルにアクセスできるようにし、複数のプロバイダ API を管理する必要をなくします。全モデルでトークンマークアップはゼロで、リクエストごとに直接コスト削減を実現します。RouterArena リーダーボードで 75.5% の精度を誇る適応型ルーティングエンジンが、品質とコストの目標に基づいてプロンプトごとに最適なモデルを選択します。自動 50 ミリ秒未満のフェイルオーバーがアップストリームプロバイダの障害を隠蔽します。組み込みのガードレールとエージェントファイアウォールがゲートウェイレベルでセーフティレイヤーを追加します。ゲートウェイはアプリケーションとモデルプロバイダの間に追加のホップを挟むため、直接 API 統合と比較してアーキテクチャの複雑さが増します。
OrcaRouter の長所と短所
メリット
- 200以上の全モデルでトークンマークアップ無料
- 75.5%のルーティング精度でRouterArenaをリード
- 50ms未満の自動フェイルオーバー
- 内蔵ガードレールとエージェントファイアウォール
- 単一エンドポイントで200以上のモデルに対応
デメリット
- 新しいプロダクトでコミュニティが小規模
- 新しいAPIエンドポイントへの移行が必要
- ルーティングによりリクエストあたり若干のレイテンシが発生
- 単純な利用では直接プロバイダーより価格が高い場合あり
OrcaRouter のコア機能
アダプティブスマートルーティング
OrcaRouter は各プロンプトを埋め込みで評価し、実際のトラフィックからオンライン学習するモデルを通じてルーティングし、各リクエストを最適なモデルに自動的に送信します。
ルーティング精度のトップ
本ルーターは公開 RouterArena リーダーボードで 75.5% の精度を記録し、GPT-5、Azure、Martian、NotDiamond を抑えて 2026 年 6 月時点で首位です。
トークンマークアップゼロ
200 以上の全モデルがプロバイダーの公表価格で請求され、トークンマークアップは一切発生しません。ルーティングは全ティアで無料です。
1 エンドポイントで 200+ モデル
OpenAI 互換の単一エンドポイントで、Anthropic、Google、Alibaba Cloud、Moonshot などのプロバイダーが提供する 200 以上のモデルにアクセスできます。
自動フェイルオーバー
プロバイダーがレート制限に達した場合や 5xx エラーを返した場合、OrcaRouter は応答が始まる前に 50 ミリ秒未満で 200 以上の選択肢から正常なモデルに再試行します。
設定可能なルーティング目標
ワークスペースは Cheapest、Balanced、Quality、Adaptive などのルーティングモードを設定でき、各モードは異なる優先順位に最適化されています。
ガードレール
プロンプトインジェクション検出、機密データブロック、トピック施行ポリシーがすべてのリクエストで実行され、悪用とデータ漏洩を防止します。
エージェントファイアウォール
API キーガバナンスとモデルアクセス制御により、各エージェントやサービスがゲートウェイを通じてアクセスできるモデルと機能を制限します。
可観測性
組み込みダッシュボードが、ルーティングされた全トラフィックのリクエスト量、レイテンシ、コスト、モデル使用状況、障害率を追跡します。
ルーティング as Code
ルーティングロジックは CEL 式を含むバージョン管理された YAML で表現でき、クライアント側の変更や再デプロイなしで数秒でデプロイできます。
ロードバランシング
トラフィックはコスト、レイテンシ、可用性を最適化するためにプロバイダーとモデル間で分散され、単一の上流プロバイダーに過剰な負荷がかかるのを防ぎます。
OrcaRouter の使用例
- [スタートアップ]:単一エンドポイントで200以上のLLMにアクセス。複数のAPIキーやプロバイダー統合を管理する必要はありません。
- [エンジニアリングチーム]:プロンプトを自動的に最適なモデルにルーティング。手動調整なしで品質とコストのバランスを実現します。
- [エンタープライズセキュリティチーム]:一元化されたガバナンスレイヤーから、すべてのAI使用におけるガードレールとエージェントファイアウォールポリシーを適用します。
- [運用チーム]:上流プロバイダーがレート制限やダウン時に、自動的な50ms未満のフェイルオーバーでサービス継続性を維持します。
- [ファイナンスチーム]:品質要件を満たす最も安価なモデルを選択するインテリジェントルーティングにより、AI支出を最大40%削減します。
OrcaRouter の FAQ
OrcaRouter とは?
OrcaRouter は AI ゲートウェイであり、OpenAI 互換の単一エンドポイントを通じて 200 以上の言語モデルにプロンプトをルーティングします。実行時に各リクエストを評価し、品質とコストの目標に基づいて最適なモデルを選択します。内蔵のガードレール、エージェントファイアウォール、可観測性ツールを備えています。すべてのプランでトークンのマークアップは一切かかりません。
OrcaRouter の料金体系は?
OrcaRouter はアップストリームプロバイダーの公表トークン単価をそのまま請求し、トークンごとのマークアップは一切追加しません。収入はトークンコストの値上げではなく、オプションの有料サブスクリプションから得られます。無料の Hacker プランでは、200 以上のモデル、自動フェイルオーバー、基本の可観測性を含むフルゲートウェイを利用できます。Team プランは月額 499 ドルで、最大 10 席、コンプライアンス適用、監査レポート、無制限の API キー、優先サポートを追加します。Enterprise プランでは、プライベートまたはオンプレミスデプロイ、99.99% のアップタイム SLA、専用インフラストラクチャ、カスタム料金を提供します。
OrcaRouter ではどのようなモデルが利用できますか?
OrcaRouter は OpenAI、Anthropic、Google Gemini、DeepSeek、xAI Grok、Alibaba Qwen、Moonshot Kimi、MiniMax などのプロバイダーから 200 以上のモデルへのアクセスを提供します。モデルカタログは最先端モデルとオープンソースモデルの両方をカバーしています。すべてのモデルは OpenAI 互換の単一エンドポイントからアクセス可能で、プラットフォームはネイティブの Anthropic および Google Gemini プロトコルサーフェスも直接アクセス用に公開しています。
アダプティブルーティングの仕組みは?
各プロンプトは埋め込み化され、利用可能なモデルに対してリアルタイムでスコアリングされます。継続的に学習するモデルが、ワークスペースの設定目標に基づいてリクエストを最適なプロバイダーにルーティングします。ユーザーは Cheapest、Balanced、Quality、Adaptive などのルーティングモードを選択できます。このルーターは公開 RouterArena リーダーボードで 2026 年 6 月時点で 75.5% の精度でトップに立ち、GPT-5、Azure、Martian、NotDiamond を上回っています。
OrcaRouter はプロバイダーの障害にどう対応しますか?
アップストリームプロバイダーがリクエストをレート制限したり 5xx エラーを返したりすると、OrcaRouter は 200 以上のモデルプールから正常なモデルに自動的にフェイルオーバーします。このフェイルオーバーはクライアントがタイムアウトする前の 50 ミリ秒未満で完了します。このプロセスはエンドユーザーには透過的であり、クライアント側のリトライロジックは一切必要ありません。
どのようなセキュリティとガバナンス機能がありますか?
OrcaRouter はすべてのリクエストに対して、プロンプトインジェクション検出、機密データブロッキング、トピック強制適用のガードレールを備えています。エージェントファイアウォールは API キーガバナンスとモデルアクセス制御を提供し、各エージェントやサービスが到達できるモデルと機能を制限します。すべてのプランは同一のガードレールとエージェントファイアウォールの下で動作します。Team および Enterprise プランでは、規制要件に対応するコンプライアンス適用と監査レポートが追加されます。
Hacker、Team、Enterprise プランの違いは?
Hacker プランは無料で、フルゲートウェイ(200 以上のモデル、自動フェイルオーバー、基本の可観測性)と単一ワークスペースを含みます。Team プランは月額 499 ドルで、最大 10 のチーム席、無制限の API キー、コンプライアンス適用とレポート、優先サポートを追加します。Enterprise プランは Team のすべてに加え、プライベートまたはオンプレミスデプロイ、99.99% のアップタイム SLA、専用インフラストラクチャ、専用サポートを提供します。Hacker プランはクレジットカード不要で開始できます。
OrcaRouterの使用方法
- orcarouter.ai でアカウント登録してワークスペースを作成し、ルーティングゲートウェイダッシュボードの全管理機能にアクセスします。
- ダッシュボード設定ページで API キーを生成し、OrcaRouter ゲートウェイ経由の全リクエストを認証します。
- 既存の OpenAI SDK クライアントの base_url を https://api.orcarouter.ai/v1 に変更します。その他のクライアントコードとパラメーターは変更不要です。
- model パラメーターを "orcarouter/auto" に設定すると、プラットフォームが各プロンプトを評価し、最適なプロバイダーに自動ルーティングします。
- ワークスペースごとにルーティング目標を設定し、最低コスト、最高品質、またはそのバランスを優先できます。
- 標準の OpenAI SDK 形式でリクエストを送信すれば、ゲートウェイがインテリジェントルーティング、自動フェイルオーバー、ガードレールをそのまま処理します。
