OrcaRouter のコア機能
OrcaRouterはAIゲートウェイです。単一エンドポイントで200以上のモデルにプロンプトをルーティングし、マークアップは一切かかりません。アダプティブルーティング、ガードレール、エージェントファイアウォール、可観測性を備えています。
OrcaRouter のコア機能
アダプティブスマートルーティング
OrcaRouter は各プロンプトを埋め込みで評価し、実際のトラフィックからオンライン学習するモデルを通じてルーティングし、各リクエストを最適なモデルに自動的に送信します。
ルーティング精度のトップ
本ルーターは公開 RouterArena リーダーボードで 75.5% の精度を記録し、GPT-5、Azure、Martian、NotDiamond を抑えて 2026 年 6 月時点で首位です。
トークンマークアップゼロ
200 以上の全モデルがプロバイダーの公表価格で請求され、トークンマークアップは一切発生しません。ルーティングは全ティアで無料です。
1 エンドポイントで 200+ モデル
OpenAI 互換の単一エンドポイントで、Anthropic、Google、Alibaba Cloud、Moonshot などのプロバイダーが提供する 200 以上のモデルにアクセスできます。
自動フェイルオーバー
プロバイダーがレート制限に達した場合や 5xx エラーを返した場合、OrcaRouter は応答が始まる前に 50 ミリ秒未満で 200 以上の選択肢から正常なモデルに再試行します。
設定可能なルーティング目標
ワークスペースは Cheapest、Balanced、Quality、Adaptive などのルーティングモードを設定でき、各モードは異なる優先順位に最適化されています。
ガードレール
プロンプトインジェクション検出、機密データブロック、トピック施行ポリシーがすべてのリクエストで実行され、悪用とデータ漏洩を防止します。
エージェントファイアウォール
API キーガバナンスとモデルアクセス制御により、各エージェントやサービスがゲートウェイを通じてアクセスできるモデルと機能を制限します。
可観測性
組み込みダッシュボードが、ルーティングされた全トラフィックのリクエスト量、レイテンシ、コスト、モデル使用状況、障害率を追跡します。
ルーティング as Code
ルーティングロジックは CEL 式を含むバージョン管理された YAML で表現でき、クライアント側の変更や再デプロイなしで数秒でデプロイできます。
ロードバランシング
トラフィックはコスト、レイテンシ、可用性を最適化するためにプロバイダーとモデル間で分散され、単一の上流プロバイダーに過剰な負荷がかかるのを防ぎます。
OrcaRouter の使用例
- [スタートアップ]:単一エンドポイントで200以上のLLMにアクセス。複数のAPIキーやプロバイダー統合を管理する必要はありません。
- [エンジニアリングチーム]:プロンプトを自動的に最適なモデルにルーティング。手動調整なしで品質とコストのバランスを実現します。
- [エンタープライズセキュリティチーム]:一元化されたガバナンスレイヤーから、すべてのAI使用におけるガードレールとエージェントファイアウォールポリシーを適用します。
- [運用チーム]:上流プロバイダーがレート制限やダウン時に、自動的な50ms未満のフェイルオーバーでサービス継続性を維持します。
- [ファイナンスチーム]:品質要件を満たす最も安価なモデルを選択するインテリジェントルーティングにより、AI支出を最大40%削減します。
