OrcaRouter Firewall & Guardrailsが無料提供開始、AIエージェント攻撃をゲートウェイで防御

公開：2026年6月21日更新：2026年6月21日

CodeCampが提供するDX人材育成が可能なプログラミングやITが学べる公開講座

FlashLabs株式会社は、AIルーティングゲートウェイ「OrcaRouter」において、「Firewall」および「Guardrails」機能の提供を開始しました。AIエージェントを標的とした攻撃を遮断するこれらの機能を、完全無料で利用できます。同社のセキュリティリサーチチーム「OrcaRouter Security Research」が公開した年次レポート『AI脅威レポート2026』が提示するコントロールアーキテクチャを、そのまま製品として、実装した機能です。

OrcaRouterが守るべき領域:AIエージェントが「ソーシャルエンジニアリング」の標的になる時代
OrcaRouter Firewall & Guardrailsの主な機能
OrcaRouter Firewall & Guardrailsの概要
trends編集部の一言
References

OrcaRouterが守るべき領域:AIエージェントが「ソーシャルエンジニアリング」の標的になる時代

AIは、単に質問に答えるだけではなく、メールを読み、ツールを使い、自律的に行動する権限を持つようになりました。この進化は同時に、攻撃者にとっての新たな「攻撃面（アタックサーフェス）」を生み出しています。

かつて人間が標的となっていたソーシャルエンジニアリングは、今やAIエージェントに向けられています。2025年に報告された「EchoLeak（CVE-2025-32711）」では、ユーザーが何もクリックせずとも、AIが受信したメールの指示に従って機密データを外部へ送信するゼロクリックでのデータ漏洩が現実のものとなりました。

「AI Threat Report 2026」によれば、本番環境のLLMアプリケーションを完全に侵害するまでの平均時間はわずか42秒です。さらに、AI関連の侵害を報告した組織の97%が、適切なアクセス制御を欠いていました。こうしたAI関連脅威の深刻化を背景に、FlashLabs株式会社はこれまでエンタープライズ向けに提供していた高度なセキュリティ機能を、すべての開発者が無料で利用できるよう開放することを決定しました。

Python研修一覧はこちら

目的に合うPython研修を一覧形式から探したい方は、ぜひご利用ください。

Python研修を比較する

Java研修一覧はこちら

目的に合うJava研修を一覧形式から探したい方は、ぜひご利用ください。

Java研修を比較する

PHP研修一覧はこちら

目的に合うPHP研修を一覧形式から探したい方は、ぜひご利用ください。

PHP研修を比較する

新入社員研修

目的に合う新入社員研修を一覧形式から探したい方は、ぜひご利用ください。

新入社員研修を比較する

全ての研修からも探したい方はこちら

OrcaRouter Firewall & Guardrailsの主な機能

「OrcaRouter Firewall & Guardrails」は、コンテンツ面とアクション面の両方から防御を行う構成です。主な機能は以下の通りです。

プロンプトインジェクション対策:モデルの指示を上書きしようとする悪意ある入力を検知・遮断
PII（個人情報）検知・マスキング:氏名・住所・クレジットカード番号などの漏洩を防止
シークレット・APIキーブロック:認証情報の意図しない流出をゲートウェイで阻止
ツール呼び出しの制御:許可されていないツールやMCP（Model Context Protocol）サーバーへのアクセスを遮断
ネットワーク・エグレス制限:信頼できないホストへのデータ送信をデフォルトで拒否
コスト・キャップ:エージェントごとの支出上限を設定し「Denial-of-Wallet」攻撃を防止

Guardrailsはプロンプト（入力）とレスポンス（出力）のすべてをリアルタイムでスクリーニングし、FirewallはAIエージェントが行う「行動」そのものを監視・制御します。HarmBench、JailbreakBenchやNVIDIAのgarakなど、世界標準の評価指標を用いて80以上のレッドチーム・コーパスによる継続的な検証が行われています。

導入にあたってアプリケーションのコード改修は必要ありません。既存のOpenAI SDK等を利用している場合、エンドポイントURLを変更するだけで導入が完了します。2026年8月2日から全面施行されるEU AI法（EU AI Act）において、求められる透明性や堅牢性、サイバーセキュリティの要件を、ゲートウェイ層で満たすことも可能です。

FlashLabs株式会社代表取締役細井洋一氏は、今回の提供開始にあたって次のように述べています。「モデルの入力そのものがプログラミングである以上、従来のWAFではプロンプトインジェクションを防ぐことは不可能です。OrcaRouterは、リクエストの経路上で『判定』と『制御』をミリ秒単位で行うことで、開発者が安心してAIエージェントを社会実装できるインフラを提供します。」

OrcaRouter Firewall & Guardrailsの概要

項目	詳細
提供企業	FlashLabs株式会社
所在地	東京都千代田区
代表者	細井洋一
対象サービス	OrcaRouter
機能カテゴリ	AIルーティングゲートウェイのセキュリティ機能
価格	完全無料（OrcaRouterの全ユーザーが対象）
主な機能	Guardrails（プロンプト・レスポンスのスクリーニング） Firewall（ツール呼び出し制御・エグレス制限・コストキャップ）
検証基準	HarmBenchやJailbreakBench、NVIDIAのgarakほか80以上のレッドチーム・コーパス
対応モデル数	200以上のLLMモデル
公式サイト	https://www.flashlabs.ai/

OrcaRouter Firewall & Guardrailsの詳細はこちら

Python基礎・実践(Django)

企業・法人向けのPython研修では、基礎から応用まで体系的に学べます。

Python研修の詳細

DX社員研修

企業・法人向けのDX研修では、実務に繋がるリスキリングでITレベルを向上させます。

DX研修の詳細

Javaエンジニア育成研修

企業・法人向けのJavaエンジニア育成研修では、Javaの基礎から応用まで確実に習得できます。

Java研修の詳細

新卒・新入社員向け研修

企業・法人に新入社員・新卒社員に向けたプログラミング研修を提供しています。

新入社員研修の詳細

コードキャンプのIT研修を全て見る

trends編集部の一言

本番環境のLLMアプリケーションが平均42秒で完全侵害されるという数値は、改めて目を引きます。マーケティングの現場でも、生成AIを業務フローに組み込む動きが加速していますが、「AIが自律的に行動する」という状況が攻撃面の拡大と表裏一体であることは、あまり意識されていないのではないでしょうか。

「EchoLeak（CVE-2025-32711）」のようなゼロクリック型の脅威は、ユーザーの操作ミスを前提としない攻撃です。業界全体として、AIエージェントの導入議論がセキュリティ設計を後追いしている構図が鮮明になりつつあります。エンドポイントURLの変更だけで導入できる設計は、セキュリティ担当者だけでは、なく開発者全体に届きやすい入口として、注目しておく価値がありそうです。

EU AI法（EU AI Act）への準拠支援を無料機能として、組み込んでいる点も、2026年8月2日の全面施行を控えた時期に興味深い判断です。マーケティング業界の文脈に置き換えると、規制対応コストの吸収をプロダクトで解決するアプローチは、今後の業界における市場参入や採用の障壁を下げる戦略として注目されます。

References

^ PR TIMES. 「AIエージェントの脆弱性を突く「ソーシャルエンジニアリング」の脅威から企業を守る「AI Firewall & Guardrails」をOrcaRouterにて無料で提供開始 | FlashLabs株式会社のプレスリリース」. https://prtimes.jp/main/html/rd/p/000000052.000138449.html, (参照 26-06-21).

※上記コンテンツの内容やソースコードはAIで確認・デバッグしておりますが、間違いやエラー、脆弱性などがある場合は、コメントよりご報告いただけますと幸いです。