FlashLabs株式会社は、AIインフェレンスゲートウェイ「OrcaRouter」において、複数のLLMを並列実行して知性を統合する新機能「Model Fusion(モデルフュージョン)」の提供を開始しました。
OrcaRouter Model Fusionが解決する単一モデル依存の課題
現在の生成AI市場では、高性能なフロンティアモデルへの依存が続いています。単一モデルには得意・不得意があり、最高峰のモデルほどAPIコストが高騰し、レイテンシも増大するという課題がありました。
FlashLabs株式会社は、この限界を突破するため「Model Fusion」を日本市場に投入しました。1つのプロンプトに対してClaude、GPT、Gemini、Llama等の複数モデルを同時実行し、「判定器(Arbiter)」が最良の回答を選択します。あるいは複数の知見を合成して、一つの優れた回答を生成します。
OrcaRouter Model Fusionの主要機能と技術仕様
Model Fusionの中核となるのは「並列ファンアウト+アービター」の構成です。同一プロンプトを複数モデルへ並列送信し、アービターが最良解を返します。アービター戦略は「best_of_n / synthesize / majority / first / tests_pass」の5種類から選択が可能です。
効率化の観点では「選択的ファンアウト(難易度ゲート)」が機能します。コードやツール利用、難易度0.3以上のプロンプトでのみパネルを起動し、定型処理は安価な単一モデルへ振り分けます。「hi」のような軽い入力にパネル費用を払わない設計です。
複数回答の処理においても、平均化・希釈を行わず、最も強い1つの回答をそのまま(verbatim)返す「薄めない合議」を採用しています。
上記の融合ロジックは、新開発の「Routing DSL(YAML形式)」によって、約12行のコードで独自パネルの構築・所有が可能です。
利用可能なモデルは以下の通りです。
- Anthropic Claude Opus 4.8 API
- OpenAI GPT 5.5 API
- Gemini 3.5 FlashAPI
- MiniMax M3 API
- DeepSeek V4 Pro API
- Qwen3.7 Max API
- Z.AI GLM5.2 API
OrcaRouter全体では200以上のLLMを統合しており、Model Fusionはこの基盤上で複数モデルの並列合議を可能にする機能として位置づけられています。これら全モデルは単一エンドポイントから呼び出せる設計です。
OrcaRouter Model Fusionが企業にもたらす3つの価値
Model Fusionが企業にもたらす価値は、「知性の合成」「コストパフォーマンス」「信頼性」の3点に整理できます。事実確認が重要なタスクや複雑な推論、高度なプログラミングにおいて、フロンティアモデル単体を超える成果をもたらす設計です。
コスト面では、高価な最上位モデルを1回呼び出す代わりに、安価で高速な複数のモデルをFusionさせることで、推論コストを最大70%削減できます。特定のAIプロバイダーに障害が発生した場合でも、Fusion構成内の他のモデルが自動的にカバーするため、ビジネス継続性も確保されます。
FlashLabs株式会社 代表取締役 細井 洋一氏は、「これからのAI活用は、どのモデルを使うかという「選択」の時代から、複数の知性をどう組み合わせるかという「構成(コンポーズ)」の時代へと移行します」と述べました。日本企業がコストの壁に阻まれることなく、世界最高水準のインテリジェンスを活用できる社会を目指す、との方向性を示しました。
OrcaRouterおよびModel Fusionの概要
| 項目 | 詳細 |
|---|---|
| 日本独占販売 | FlashLabs株式会社 |
| 所在地 | 東京都千代田区 |
| 代表者 | 細井 洋一 |
| 対象サービス | OrcaRouter(AIインフェレンスゲートウェイ) |
| 新機能名 | Model Fusion(モデルフュージョン) |
| 開発元 | Continuum AI(米国) |
| アービター戦略 | best_of_n / synthesize / majority / first / tests_pass |
| コスト削減効果 | 推論コスト最大70%削減 |
| 対応モデル数 | 200以上 |
| 手数料 | トークン上乗せ手数料0% |
| 導入方法 | Base URLの1行書き換えのみ |
| 難易度ゲート閾値 | 難易度0.3以上のプロンプトでパネル起動 |
| カスタム定義 | Routing DSL(YAML形式)約12行で構築可能 |
trends編集部の一言
推論コストを最大70%削減しながら「Fable 5」級の性能に匹敵あるいは上回ることを可能にするという数値のインパクトは、AI活用コストの課題が続く企業にとって見逃しにくい発表です。
マーケティング業界の文脈に置き換えると、精度の高いモデルを毎回呼び出すとAPIコストがかさみ、用途を絞り込まざるを得ない状況は業界横断で語られてきたテーマでした。「複数の安価なモデルを組み合わせて高性能に近づける」という発想は、業界全体として注目されてきた方向性と言えます。
マーケティング業務の文脈では、ABテスト用コピーの大量生成や複数シナリオの同時検討など、品質と量を両立させたい場面でこうした構成の価値は高まるでしょう。「どのモデルを選ぶか」から「どう組み合わせるか」へという細井 洋一氏の言葉が示す方向性は、業界全体としてAI導入フェーズの転換点を象徴する動きと読み取れます。
References
- ^ PR TIMES. 「OrcaRouterにてLLMの知性を融合する「Model Fusion」を国内提供開始 ― 複数モデルの並列実行で、Fable5並みの推論性能を実現 | FlashLabs株式会社のプレスリリース」. https://prtimes.jp/main/html/rd/p/000000044.000138449.html, (参照 26-06-19).
※上記コンテンツの内容やソースコードはAIで確認・デバッグしておりますが、間違いやエラー、脆弱性などがある場合は、コメントよりご報告いただけますと幸いです。
ITやプログラミングに関するコラム
【Git】remote設定を変更する方法
【VBA】コメントアウトを設定する方法
マークダウンで改行する方法
【CSS】notで複数の件を除外する方法
x86とx64の違いを分かりやすく解説
GitLabとGitHubの違いを解説
パソコンのメモリの目安を用途別に選ぶ方法
Linuxで環境変数を確認する方法
CapsLockキーを解除する方法
UbuntuのIPアドレスを確認する方法
ITやプログラミングに関するニュース
AITORAがAI検索での競合比較を可視化、対策レポートをモニター価格月額10万円〜で提供
株式会社MIXIが「Romi(Lacatanモデル)」の選べる声を全4種類に拡大、キャラ変との組み合わせが広がる
藤枝市役所が国産LLM「Sarashina」活用の窓口AI実証事業で総務省採択、ソフトバンクと協定締結
Hanji株式会社がAIチューター「Knock」に赤入れ添削機能を追加、数十秒〜1分程度で大学入試レベルまで対応
KozotaiがAIネイティブ会計ソフト「KOZOTAI」を正式リリース、自然言語入力だけで仕訳から決算書まで一貫処理
NTT西日本株式会社が大阪・福岡に次世代AI対応型データセンターを新設、西日本のAIインフラ強化へ
パテント・インテグレーション株式会社が「サマリア」の弁理士法対応を強化、利用規約改訂と注意喚起機能を追加
アステリアキャンバスがAI業務プラットフォーム「Bakusoku.AI」を提供開始、最短3分で業務ソフトウェアを自動生成
合同会社DMM.comが「DMMキャラトーク」を提供開始、1,000以上のパターンのキャラクターと1対1でトーク
株式会社アスレバがゴリラセールスAI商談を正式リリース、顧客の検討熱度が高い瞬間にAIが商談化を自動化
