FlashLabs株式会社は、AIルーティングゲートウェイ「OrcaRouter」において、「Firewall」および「Guardrails」機能の提供を開始しました。
OrcaRouterが守るべき領域:AIエージェントが「ソーシャルエンジニアリング」の標的になる時代
AIは、単に質問に答えるだけではなく、メールを読み、ツールを使い、自律的に行動する権限を持つようになりました。この進化は同時に、攻撃者にとっての新たな「攻撃面(アタックサーフェス)」を生み出しています。
かつて人間が標的となっていたソーシャルエンジニアリングは、今やAIエージェントに向けられています。2025年に報告された「EchoLeak(CVE-2025-32711)」では、ユーザーが何もクリックせずとも、AIが受信したメールの指示に従って機密データを外部へ送信するゼロクリックでのデータ漏洩が現実のものとなりました。
「AI Threat Report 2026」によれば、本番環境のLLMアプリケーションを完全に侵害するまでの平均時間はわずか42秒です。さらに、AI関連の侵害を報告した組織の97%が、適切なアクセス制御を欠いていました。こうしたAI関連脅威の深刻化を背景に、FlashLabs株式会社はこれまでエンタープライズ向けに提供していた高度なセキュリティ機能を、すべての開発者が無料で利用できるよう開放することを決定しました。
OrcaRouter Firewall & Guardrailsの主な機能
「OrcaRouter Firewall & Guardrails」は、コンテンツ面とアクション面の両方から防御を行う構成です。主な機能は以下の通りです。
- プロンプトインジェクション対策:モデルの指示を上書きしようとする悪意ある入力を検知・遮断
- PII(個人情報)検知・マスキング:氏名・住所・クレジットカード番号などの漏洩を防止
- シークレット・APIキーブロック:認証情報の意図しない流出をゲートウェイで阻止
- ツール呼び出しの制御:許可されていないツールやMCP(Model Context Protocol)サーバーへのアクセスを遮断
- ネットワーク・エグレス制限:信頼できないホストへのデータ送信をデフォルトで拒否
- コスト・キャップ:エージェントごとの支出上限を設定し「Denial-of-Wallet」攻撃を防止
Guardrailsはプロンプト(入力)とレスポンス(出力)のすべてをリアルタイムでスクリーニングし、FirewallはAIエージェントが行う「行動」そのものを監視・制御します。HarmBench、JailbreakBenchやNVIDIAのgarakなど、世界標準の評価指標を用いて80以上のレッドチーム・コーパスによる継続的な検証が行われています。
導入にあたってアプリケーションのコード改修は必要ありません。既存のOpenAI SDK等を利用している場合、エンドポイントURLを変更するだけで導入が完了します。2026年8月2日から全面施行されるEU AI法(EU AI Act)において、求められる透明性や堅牢性、サイバーセキュリティの要件を、ゲートウェイ層で満たすことも可能です。
FlashLabs株式会社 代表取締役 細井 洋一氏は、今回の提供開始にあたって次のように述べています。「モデルの入力そのものがプログラミングである以上、従来のWAFではプロンプトインジェクションを防ぐことは不可能です。OrcaRouterは、リクエストの経路上で『判定』と『制御』をミリ秒単位で行うことで、開発者が安心してAIエージェントを社会実装できるインフラを提供します。」
OrcaRouter Firewall & Guardrailsの概要
| 項目 | 詳細 |
|---|---|
| 提供企業 | FlashLabs株式会社 |
| 所在地 | 東京都千代田区 |
| 代表者 | 細井 洋一 |
| 対象サービス | OrcaRouter |
| 機能カテゴリ | AIルーティングゲートウェイのセキュリティ機能 |
| 価格 | 完全無料(OrcaRouterの全ユーザーが対象) |
| 主な機能 | Guardrails(プロンプト・レスポンスのスクリーニング) Firewall(ツール呼び出し制御・エグレス制限・コストキャップ) |
| 検証基準 | HarmBenchやJailbreakBench、NVIDIAのgarakほか80以上のレッドチーム・コーパス |
| 対応モデル数 | 200以上のLLMモデル |
| 公式サイト | https://www.flashlabs.ai/ |
trends編集部の一言
本番環境のLLMアプリケーションが平均42秒で完全侵害されるという数値は、改めて目を引きます。マーケティングの現場でも、生成AIを業務フローに組み込む動きが加速していますが、「AIが自律的に行動する」という状況が攻撃面の拡大と表裏一体であることは、あまり意識されていないのではないでしょうか。
「EchoLeak(CVE-2025-32711)」のようなゼロクリック型の脅威は、ユーザーの操作ミスを前提としない攻撃です。業界全体として、AIエージェントの導入議論がセキュリティ設計を後追いしている構図が鮮明になりつつあります。エンドポイントURLの変更だけで導入できる設計は、セキュリティ担当者だけでは、なく開発者全体に届きやすい入口として、注目しておく価値がありそうです。
EU AI法(EU AI Act)への準拠支援を無料機能として、組み込んでいる点も、2026年8月2日の全面施行を控えた時期に興味深い判断です。マーケティング業界の文脈に置き換えると、規制対応コストの吸収をプロダクトで解決するアプローチは、今後の業界における市場参入や採用の障壁を下げる戦略として注目されます。
References
- ^ PR TIMES. 「AIエージェントの脆弱性を突く「ソーシャルエンジニアリング」の脅威から企業を守る「AI Firewall & Guardrails」をOrcaRouterにて無料で提供開始 | FlashLabs株式会社のプレスリリース」. https://prtimes.jp/main/html/rd/p/000000052.000138449.html, (参照 26-06-21).
※上記コンテンツの内容やソースコードはAIで確認・デバッグしておりますが、間違いやエラー、脆弱性などがある場合は、コメントよりご報告いただけますと幸いです。
ITやプログラミングに関するコラム
【Git】remote設定を変更する方法
【VBA】コメントアウトを設定する方法
マークダウンで改行する方法
【CSS】notで複数の件を除外する方法
x86とx64の違いを分かりやすく解説
GitLabとGitHubの違いを解説
パソコンのメモリの目安を用途別に選ぶ方法
Linuxで環境変数を確認する方法
CapsLockキーを解除する方法
UbuntuのIPアドレスを確認する方法
ITやプログラミングに関するニュース
クラウドワークス アカデミーが法人向け「AI活用研修」を提供開始、助成金活用で46,000円から受講可能
エルサイトがMCP接続に対応、ChatGPTやClaudeへの自然言語指示でチャットデータの確認・集計が可能に
ChatSenseがスライドマスターのみのPPTXファイルをテーマ登録可能に、社内共通テンプレートを自動生成に活用
Gausium(高仙ロボット)がAI清掃ロボットの小売導入効果を公開、清掃人件費40%減と顧客滞在時間15%向上を実証
T-4OOが「参考文書を参照した翻訳」機能を追加、対訳不要で業務資料の訳文資産を活用可能に
株式会社ProVisionが「AIシステム品質検証」の提供を開始、生成AI・AIエージェントの出力品質とリスクを可視化
エルグラムがChatGPT向けアプリを公開、AIとの対話でInstagram運用データの分析・レポート作成に対応
nocoがAIカスタマーサポートシステム「ヘルプドッグ」をオートウェイに導入、FAQやチャットボット、フォームを一元管理
Tokyo Artisan IntelligenceがAI人流解析「NIGIWAI」を提供開始、北九州市の実証から全国へ
株式会社BridgeがLLMOコンサルティングサービスを提供開始、SEOとPRを統合しAI時代のブランド設計を支援
