株式会社アガタは、社内文書AI検索サービス「RAG+AIチャットボット」の応答処理を約1.9倍に高速化したことを発表しました。
株式会社アガタが「最悪条件の実測値」を測定方法ごと公開する理由
AIサービスの応答速度は、好条件下での公称値が示されることが一般的です。実際の混雑時にどこまで遅くなるのかは、導入してみないと分からないという状況が、導入企業の不安要素の一つとなってきました。
株式会社アガタは、全利用者が同一瞬間にリクエストを送信し続ける「人工的な最悪条件」で測定し、測定条件・方法とともに、数値を公開します。実際の利用環境がこの条件より厳しくなることは原理的にないため、この数値は「最低保証に近い実力値」として位置づけられています。
RAG+AIチャットボットの60名同時アクセス時実測結果と回答品質
測定は、全クライアントが同一瞬間に質問を送信し続ける閉ループ方式で実施されました。各条件とも60秒間×複数回実測し、全測定を通じてエラー率0%を記録しています。実測結果は以下の通りです。
- 30名同時:応答開始 中央値386 ms、95パーセンタイル827 ms
- 60名同時:応答開始 中央値560 ms、95パーセンタイル3,314 ms
利用者が少ない時間帯や単独利用時の応答開始は中央値0.15秒前後であり、体感としては、ほぼ瞬時に回答が始まります。回答品質については、質問ガイドライン準拠の評価において回答有効率96%(全25問中24問が妥当、うちガイドライン準拠質問では95.7%)を確認し、目標の92%を上回りました。
回答文が書き出されていく速さについては、人が黙読する速度(毎秒およそ15〜20文字程度)を基準として、比較されています。同社の実測では毎秒およそ60〜101文字(黙読の約4〜6倍の速さ)で表示され、単独利用時には毎秒500文字以上に達しました。60名同時利用の混雑時でも、人が読む速度を上回るペースを保っています。
RAG+AIチャットボットにおける技術改善と高速化の内容
今回の高速化は、2つの独立した改善によって実現しました。1つ目は再ランク処理へのFP8量子化(8ビット浮動小数点演算)の適用です。
質問と文書の関連度を精密に並べ替える再ランク処理速度を約2倍に高速化し、処理時間は63msから29msに短縮されました。適用にあたっては、量子化前後で回答品質が同等であることを実測により確認しています。
2つ目は推論エンジンの更新です。最新世代の推論エンジンを採用し、AIモデルの演算をデータセンターのGPU世代に合わせて最適化しました。最初の回答が返り始めるまでの時間(応答開始 / TTFT)が従来比約17%短縮(単独利用時:178msから148ms)され、回答が書き出される速さも約1.9倍(280文字/秒から524文字/秒)に向上しました。
本サービスは、AIモデルや検索エンジン、データベース、サーバーまで全レイヤーを自社で運用しています。この垂直統合の設計により、深いレベルでの性能改善を継続的に実施し、追加費用なく顧客に還元できます。今回の高速化を実現した技術的背景については、技術者向けの詳細記事が同日公開されています(技術記事はこちら)。
RAG+AIチャットボットのオープンウェイトモデルと自社データセンターによる供給継続性
クラウド経由で提供される外部AIサービスは、提供企業の方針変更や規制の変化によって、利用する側ではコントロールできない事情で利用できなくなる可能性を常に抱えています。業務の根幹をそうしたAIに依存する場合、技術的な性能とは別に「使い続けられるか」という継続性のリスクが生じます。
株式会社アガタの「RAG+AIチャットボット」は、Apache License 2.0のオープンウェイトAIモデルを採用した構成です。モデルの重みを富岡再エネデータセンター内に保有し、同センターの閉域で動作させる設計です。特定ベンダーのサーバーやAPIに依存しないため、外部の都合でサービスが止まることが原理的にありません。
サービスの稼働環境は、環境省の「ゼロエミッション化・レジリエンス強化促進事業」を活用した再エネ電源活用の自社所有データセンターです。敷地内の太陽光発電所と大容量蓄電池を組み合わせ、再生可能エネルギー由来の電力を最大限活用しています。自社GPUサーバー上で完結する閉鎖型設計により、顧客データが外部クラウドへ送信されることはありません。
代表取締役の勅使河原有佑氏は次のようにコメントしています。「性能の数字は、お客様が一番厳しい日に体験する数字でなければ意味がありません。
当社は、最も混雑する最悪条件での実測値を、測定方法ごと公開することにしました。電気から、サーバー、AIまで。すべてを自社で持っているからこそ、改善を重ね、その成果を価格据え置きでお客様に還元し続けられます。そして、お客様が導入したAIが、外部の都合で止まることもありません。」
RAG+AIチャットボットの料金・提供条件
料金体系および提供条件は以下の通りです。今回の性能向上分は料金据え置きで既存顧客に還元されました。
| 項目 | 詳細 |
|---|---|
| 基本料金 | 40,000円/月(税抜) |
| 初期費用 | 初期費用ゼロ(2年契約) |
| 文書データ | 最大100MBまでのRAG化込み |
| アカウント | 1アカウント=同時利用1名(社内共有可・複数アカウント取得可) |
| リクエスト上限 | 1分間に10回/1時間に100回/1日500回(月約15,000回相当) |
| 先行提供枠 | 500アカウント(受付中) |
| 無料デモ | 2週間の無料デモ体験を実施中 |
| 会社名 | 株式会社アガタ |
| 所在地 | 群馬県富岡市黒川1269-4 |
| 代表者 | 勅使河原有佑 |
| 設立 | 2015年10月 |
| 公式サイト | https://agata-corp.com/ | https://tomioka-dc.agata-corp.com/ |
trends編集部の一言
60名が同一瞬間にリクエストを送り続けるという「最悪条件」でエラー率0%を維持した点は、数字のインパクトとして強く残ります。業界全体としては、AIサービスの「公称値と実際の乖離」は導入検討時の共通の不安であり、測定条件と生データをセットで公開するアプローチは、その不安に正面から応答するものです。同種サービスでは性能数値のみを公開するケースが一般的だが、測定方法ごと開示するこの設計思想は、ベンダー選定の新たな判断軸として市場に一石を投じるアプローチと言えます。
企業のITツール選定の現場でも、実際の混雑時の挙動が分からないまま導入を余儀なくされるケースは少なくありません。外部依存のリスクを意識し始めた組織の間では、今後こうした「最低保証に近い実力値」の開示や自社データセンターによる供給継続性の設計への関心が高まる傾向が見られます。
References
- ^ PR TIMES. 「株式会社アガタ、「RAG+AIチャットボット」の応答速度を約1.9倍に高速化 — 60名同時アクセス・最悪条件での実測値と測定方法を公開 | 株式会社アガタのプレスリリース」. https://prtimes.jp/main/html/rd/p/000000015.000125274.html, (参照 26-06-18).
※上記コンテンツの内容やソースコードはAIで確認・デバッグしておりますが、間違いやエラー、脆弱性などがある場合は、コメントよりご報告いただけますと幸いです。
ITやプログラミングに関するコラム
【Git】remote設定を変更する方法
【VBA】コメントアウトを設定する方法
マークダウンで改行する方法
【CSS】notで複数の件を除外する方法
x86とx64の違いを分かりやすく解説
GitLabとGitHubの違いを解説
パソコンのメモリの目安を用途別に選ぶ方法
Linuxで環境変数を確認する方法
CapsLockキーを解除する方法
UbuntuのIPアドレスを確認する方法
ITやプログラミングに関するニュース
AITORAがAI検索での競合比較を可視化、対策レポートをモニター価格月額10万円〜で提供
株式会社MIXIが「Romi(Lacatanモデル)」の選べる声を全4種類に拡大、キャラ変との組み合わせが広がる
藤枝市役所が国産LLM「Sarashina」活用の窓口AI実証事業で総務省採択、ソフトバンクと協定締結
Hanji株式会社がAIチューター「Knock」に赤入れ添削機能を追加、数十秒〜1分程度で大学入試レベルまで対応
KozotaiがAIネイティブ会計ソフト「KOZOTAI」を正式リリース、自然言語入力だけで仕訳から決算書まで一貫処理
NTT西日本株式会社が大阪・福岡に次世代AI対応型データセンターを新設、西日本のAIインフラ強化へ
パテント・インテグレーション株式会社が「サマリア」の弁理士法対応を強化、利用規約改訂と注意喚起機能を追加
アステリアキャンバスがAI業務プラットフォーム「Bakusoku.AI」を提供開始、最短3分で業務ソフトウェアを自動生成
合同会社DMM.comが「DMMキャラトーク」を提供開始、1,000以上のパターンのキャラクターと1対1でトーク
株式会社アスレバがゴリラセールスAI商談を正式リリース、顧客の検討熱度が高い瞬間にAIが商談化を自動化
