FlashLabs株式会社は、2026年6月10日(火)、次世代AI推論ゲートウェイ「OrcaRouter」において、Anthropicの最新AIモデル「Claude Fable 5」のAPI提供を開始しました。
Claude Fable 5とOrcaRouterが支援するAIコスト最適化
企業のAI活用が急速に進む中、200以上のLLMモデルから最適なモデルを選択する必要が生じています。単一の高性能モデルをすべての処理に使用すると、定型処理にも高コストを支払い続けることになり、AI原価が急増する課題がありました。
一方で、手作業によるモデル選択は、新モデルのリリースごとにルールが陳腐化し、保守負担が開発チームに残ります。FlashLabs株式会社は、Anthropicが2026年6月10日(火)に一般公開した「Claude Fable 5」を「OrcaRouter」経由で提供することによって、「品質を守りながらコストを削減する」という課題の解決を支援します。
「Claude Fable 5」は、Anthropicが開発した5世代目のAIモデルです。ソフトウェアエンジニアリングや知識労働、ビジョン、科学研究など、ほぼすべてのベンチマークで最高水準の性能を発揮します。これまで限定提供されていたMythos級の最高性能を、悪用防止の強固な保護機能を備えた形で一般向けに初めて提供するバージョンとなっています。
価格は、入力100万トークン当たり $10、出力100万トークン当たり$ 50で、Mythos Previewと比較して50%以上割引です。Claude API経由でモデル名「claude-fable-5」として利用できます。
OrcaRouterの仕組みと主な特徴
OrcaRouterは、15社以上のプロバイダーに対応する適応型推論ゲートウェイです。主な対応プロバイダーは、以下の通りです。
- OpenAI
- Anthropic
- xAI
- Meta
- Mistral
- DeepSeek
- Alibaba
- Moonshot
- ByteDance
合計200以上のLLMへのAPI呼び出しを、ひとつのエンドポイント・ひとつのAPIキー・ひとつの請求書に統合します。LLMルーティングを「コンテキスト・バンディット問題」として定式化し、Embedding強化LinUCBアルゴリズムを採用しました。
OrcaRouterの適応型推論ゲートウェイにより、プロンプトごとの難易度を自動判定します。難しい推論はClaude Fable 5へ、定型処理は軽量モデルへ自動振り分けすることによって、AI推論コストを最大70%削減しながら品質を維持できます。
オフラインの人間評価データとオンラインのバンディットフィードバックを統合することによって、初期段階から高精度なルーティングを提供しつつ、実トラフィックから継続的に学習する設計です。
導入面での主な特徴は次の3点です。
- OpenAI互換APIにより既存コードを1行変更するだけで導入可能
- Base URLとAPIキーの書き換えのみでOpenAI SDKコードが無改修で動作
- 5分で移行完了、マークアップ手数料0%
再設計も調達サイクルも書き直しも不要なため、既存システムを持つ企業でも「OrcaRouter」経由でClaude Fable 5の性能を活用できます。
OrcaRouterで利用できる主なモデルは、以下の通りです。
- Anthropic Claude Fable 5 API
- Anthropic Claude Opus 4.8 API
- OpenAI GPT 5.5 API
- Gemini 3.5 Flash
- MiniMax M3
- DeepSeek V4 Pro API
- Qwen3.7 Max
上記以外にも200以上のLLMに対応しており、用途やコストに応じて柔軟に選択できます。
Claude Fable 5 API(OrcaRouter経由)の概要
| 項目 | 詳細 |
|---|---|
| 提供企業 | FlashLabs株式会社 |
| 対象サービス | Claude Fable 5 API(OrcaRouter経由) |
| 提供開始日 | 2026年6月10日(火) |
| 入力価格 | 100万トークン当たり $10 |
| 出力価格 | 100万トークン当たり$ 50 |
| 割引率 | Mythos Preview比で50%以上割引 |
| モデル名 | claude-fable-5 |
| 対応LLM数 | 200以上 |
| コスト削減効果 | AI推論コストを最大70%削減 |
| 導入時間 | 5分 |
trends編集部の一言
AI推論コストを最大70%削減しながら品質を維持できるという数値は、AI活用の予算を持つ組織にとって無視しにくい水準です。業界全体としては、コンテンツ生成や分析レポートの自動化にLLMを活用する動きが定着しつつあり、「高性能モデルを毎回呼ぶとコストが膨らむ」という課題は業種を問わず共通のテーマになってきました。
「難しい推論はフロンティアモデルへ、定型処理は軽量モデルへ」というルーティングの考え方は、マーケティング業界の文脈にも置き換えられます。ターゲティングロジックの複雑な部分だけ高精度モデルを使い、定型の文章生成は安価なモデルに任せる運用に近い発想です。業界全体としては、用途ごとにモデルを使い分けるコスト最適化の設計は、実務上の示唆を含む動向として注目されています。
既存コードを1行変更するだけで導入できる点は、開発リソースが限られる組織にとって参入障壁を下げる設計です。Anthropicが一般公開したClaude Fable 5をゲートウェイ経由で即日提供できた点からも、Continuum AIとの提携関係の深さがうかがえます。今後の円建て請求や国内データセンターでのルーティング対応など、日本企業向けの環境整備にも注目しておく価値があるのではないでしょうか。
References
- ^ PR TIMES. 「FlashLabs、Anthropic最新モデル「Claude Fable 5」APIをOrcaRouterで提供開始 ― Mythos級の高性能を月額サブスクで最大10%ボーナスクレジット付き | FlashLabs株式会社のプレスリリース」. https://prtimes.jp/main/html/rd/p/000000041.000138449.html, (参照 26-06-12).
※上記コンテンツの内容やソースコードはAIで確認・デバッグしておりますが、間違いやエラー、脆弱性などがある場合は、コメントよりご報告いただけますと幸いです。
ITやプログラミングに関するコラム
【Git】remote設定を変更する方法
【VBA】コメントアウトを設定する方法
マークダウンで改行する方法
【CSS】notで複数の件を除外する方法
x86とx64の違いを分かりやすく解説
GitLabとGitHubの違いを解説
パソコンのメモリの目安を用途別に選ぶ方法
Linuxで環境変数を確認する方法
CapsLockキーを解除する方法
UbuntuのIPアドレスを確認する方法
ITやプログラミングに関するニュース
大塚商会が建設業向け生成AIアシスタントテンプレートの提供を開始、数時間を要した入札事前調査を大幅に短縮へ
無料LLMO診断ツールがAI引用されやすいページかを約30秒でスコアリング、7観点×35シグナルで改善優先度まで可視化
CADDiがAstemoの子会社Astemo Hanoiに導入、情報探索工数の削減と付加価値業務へのリソースシフトを支援
まるちゃが外部企業へ提供開始、丸紅グループで月間アクティブユーザ10,000名以上が活用した生成AI基盤をSaaSで提供
ジンベイGenOCRが信頼度ハイライト機能をリリース、AIが認識に迷った箇所を自動で可視化し確認工数削減を支援
ElevenLabsがGoogleのAIウォーターマーク技術「SynthID」に対応、音声AIコンテンツの来歴確認を支援
exaBase 生成AIが「Claude Fable 5」の提供を開始、悪用リスクへの自動応答セーフガードを設定
Gunosyがハイパーローカル記事生成システムを開発、AIエージェントによる地域情報の取得から記事作成・配信までを効率化
株式会社AtsumellがKakusillを「プロウィズ」へ導入、要件言語化の支援で外部人材活用を加速
ホワイトリンクが病院・クリニック向けSEO支援サービスを提供開始、Google検索・AI検索・MEOを横断して集患を支援
