RAG+AIチャットボットが応答処理を約1.9倍に高速化、株式会社アガタが60名同時アクセス時の最悪条件実測値を公開

RAG+AIチャットボットが応答処理を約1.9倍に高速化、株式会社アガタが60名同時アクセス時の最悪条件実測値を公開

公開: 更新:
CodeCampが提供するDX人材育成が可能なプログラミングやITが学べる公開講座

株式会社アガタは、社内文書AI検索サービス「RAG+AIチャットボット」の応答処理を約1.9倍に高速化したことを発表しました。再ランク処理の高速化や推論エンジンの更新などの性能改善によって、応答処理全体の高速化と生成速度の向上を実現したものです。60名が同一瞬間にアクセスし続けるという厳しい条件下での実測値を、測定方法とともに公開しています。



株式会社アガタが「最悪条件の実測値」を測定方法ごと公開する理由

AIサービスの応答速度は、好条件下での公称値が示されることが一般的です。実際の混雑時にどこまで遅くなるのかは、導入してみないと分からないという状況が、導入企業の不安要素の一つとなってきました。

株式会社アガタは、全利用者が同一瞬間にリクエストを送信し続ける「人工的な最悪条件」で測定し、測定条件・方法とともに、数値を公開します。実際の利用環境がこの条件より厳しくなることは原理的にないため、この数値は「最低保証に近い実力値」として位置づけられています。


Python研修一覧はこちら

目的に合うPython研修を一覧形式から探したい方は、ぜひご利用ください。

Python研修を比較する

Java研修一覧はこちら

目的に合うJava研修を一覧形式から探したい方は、ぜひご利用ください。

Java研修を比較する

PHP研修一覧はこちら

目的に合うPHP研修を一覧形式から探したい方は、ぜひご利用ください。

PHP研修を比較する

新入社員研修

目的に合う新入社員研修を一覧形式から探したい方は、ぜひご利用ください。

新入社員研修を比較する

全ての研修からも探したい方はこちら

RAG+AIチャットボットの60名同時アクセス時実測結果と回答品質

測定は、全クライアントが同一瞬間に質問を送信し続ける閉ループ方式で実施されました。各条件とも60秒間×複数回実測し、全測定を通じてエラー率0%を記録しています。実測結果は以下の通りです。

  • 30名同時:応答開始 中央値386 ms、95パーセンタイル827 ms
  • 60名同時:応答開始 中央値560 ms、95パーセンタイル3,314 ms

利用者が少ない時間帯や単独利用時の応答開始は中央値0.15秒前後であり、体感としては、ほぼ瞬時に回答が始まります。回答品質については、質問ガイドライン準拠の評価において回答有効率96%(全25問中24問が妥当、うちガイドライン準拠質問では95.7%)を確認し、目標の92%を上回りました。

回答が書き出されていく速さについては、人が黙読する速度(毎秒およそ15〜20文字程度)を基準として、比較されています。同社の実測では毎秒およそ60〜101文字(黙読の約4〜6倍の速さ)で表示され、単独利用時には毎秒500文字以上に達しました。60名同時利用の混雑時でも、人が読む速度を上回るペースを保っています。

RAG+AIチャットボットにおける技術改善と高速化の内容

今回の高速化は、2つの独立した改善によって実現しました。1つ目は再ランク処理へのFP8量子化(8ビット浮動小数点演算)の適用です。

質問と文書の関連度を精密に並べ替える再ランク処理速度を約2倍に高速化し、処理時間は63msから29msに短縮されました。適用にあたっては、量子化前後で回答品質が同等であることを実測により確認しています。

2つ目は推論エンジンの更新です。最新世代の推論エンジンを採用し、AIモデルの演算をデータセンターのGPU世代に合わせて最適化しました。最初の回答が返り始めるまでの時間(応答開始 / TTFT)が従来比約17%短縮(単独利用時:178msから148ms)され、回答が書き出される速さも約1.9倍(280文字/秒から524文字/秒)に向上しました。

本サービスは、AIモデルや検索エンジン、データベースサーバーまで全レイヤーを自社で運用しています。この垂直統合の設計により、深いレベルでの性能改善を継続的に実施し、追加費用なく顧客に還元できます。今回の高速化を実現した技術的背景については、技術者向けの詳細記事が同日公開されています(技術記事はこちら)。


Python基礎・実践(Django)

企業・法人向けのPython研修では、基礎から応用まで体系的に学べます。

Python研修の詳細

DX社員研修

企業・法人向けのDX研修では、実務に繋がるリスキリングでITレベルを向上させます。

DX研修の詳細

Javaエンジニア育成研修

企業・法人向けのJavaエンジニア育成研修では、Javaの基礎から応用まで確実に習得できます。

Java研修の詳細

新卒・新入社員向け研修

企業・法人に新入社員・新卒社員に向けたプログラミング研修を提供しています。

新入社員研修の詳細

コードキャンプのIT研修を全て見る

RAG+AIチャットボットのオープンウェイトモデルと自社データセンターによる供給継続性

クラウド経由で提供される外部AIサービスは、提供企業の方針変更や規制の変化によって、利用する側ではコントロールできない事情で利用できなくなる可能性を常に抱えています。業務の根幹をそうしたAIに依存する場合、技術的な性能とは別に「使い続けられるか」という継続性のリスクが生じます。

株式会社アガタの「RAG+AIチャットボット」は、Apache License 2.0のオープンウェイトAIモデルを採用した構成です。モデルの重みを富岡再エネデータセンター内に保有し、同センターの閉域で動作させる設計です。特定ベンダーのサーバーやAPIに依存しないため、外部の都合でサービスが止まることが原理的にありません。

サービスの稼働環境は、環境省の「ゼロエミッション化・レジリエンス強化促進事業」を活用した再エネ電源活用の自社所有データセンターです。敷地内の太陽光発電所と大容量蓄電池を組み合わせ、再生可能エネルギー由来の電力を最大限活用しています。自社GPUサーバー上で完結する閉鎖設計により、顧客データが外部クラウドへ送信されることはありません。

代表取締役の勅使河原有佑氏は次のようにコメントしています。「性能の数字は、お客様が一番厳しい日に体験する数字でなければ意味がありません。

当社は、最も混雑する最悪条件での実測値を、測定方法ごと公開することにしました。電気から、サーバー、AIまで。すべてを自社で持っているからこそ、改善を重ね、その成果を価格据え置きでお客様に還元し続けられます。そして、お客様が導入したAIが、外部の都合で止まることもありません。」

RAG+AIチャットボットの料金・提供条件

料金体系および提供条件は以下の通りです。今回の性能向上分は料金据え置きで既存顧客に還元されました。

項目 詳細
基本料金 40,000円/月(税抜)
初期費用 初期費用ゼロ(2年契約)
文書データ 最大100MBまでのRAG化込み
アカウント 1アカウント=同時利用1名(社内共有可・複数アカウント取得可)
リクエスト上限 1分間に10回/1時間に100回/1日500回(月約15,000回相当)
先行提供枠 500アカウント(受付中)
無料デモ 2週間の無料デモ体験を実施中
会社名 株式会社アガタ
所在地 群馬県富岡市黒川1269-4
代表者 勅使河原有佑
設立 2015年10月
公式サイト https://agata-corp.com/ | https://tomioka-dc.agata-corp.com/
RAG+AIチャットボットの詳細はこちら

trends編集部の一言

60名が同一瞬間にリクエストを送り続けるという「最悪条件」でエラー率0%を維持した点は、数字のインパクトとして強く残ります。業界全体としては、AIサービスの「公称値と実際の乖離」は導入検討時の共通の不安であり、測定条件と生データをセットで公開するアプローチは、その不安に正面から応答するものです。同種サービスでは性能数値のみを公開するケースが一般的だが、測定方法ごと開示するこの設計思想は、ベンダー選定の新たな判断軸として市場に一石を投じるアプローチと言えます。

企業のITツール選定の現場でも、実際の混雑時の挙動が分からないまま導入を余儀なくされるケースは少なくありません。外部依存のリスクを意識し始めた組織の間では、今後こうした「最低保証に近い実力値」の開示や自社データセンターによる供給継続性の設計への関心が高まる傾向が見られます。

References

  1. ^ PR TIMES. 「株式会社アガタ、「RAG+AIチャットボット」の応答速度を約1.9倍に高速化 — 60名同時アクセス・最悪条件での実測値と測定方法を公開 | 株式会社アガタのプレスリリース」. https://prtimes.jp/main/html/rd/p/000000015.000125274.html, (参照 26-06-18).

※上記コンテンツの内容やソースコードはAIで確認・デバッグしておりますが、間違いやエラー、脆弱性などがある場合は、コメントよりご報告いただけますと幸いです。

ITやプログラミングに関するコラム


ITやプログラミングに関するニュース

ブログに戻る

コメントを残す

コメントは公開前に承認される必要があることにご注意ください。

企業・法人向けのIT・プログラミング・生成AI研修を探す、比較する - IT・プログラミングを知って学べるコネクトメディア CodeCampが提供するDX人材育成が可能なプログラミングやITが学べる公開講座 - IT・プログラミングを知って学べるコネクトメディア コードキャンプが提供する無料で学べるプログラミングスクール講座 - IT・プログラミングを知って学べるコネクトメディア コードキャンプDX人材育成研修 - IT・プログラミングを知って学べるコネクトメディア 3.5日の研修で、年間1,600時間の削減効果が見込まれる。東京きらぼしフィナンシャルグループのDX人材育成事例 - IT・プログラミングを知って学べるコネクトメディア 配属3ヶ月で30%の生産性向上を実現するいよぎんコンピュータサービスの新人研修に迫る - IT・プログラミングを知って学べるコネクトメディア 金融業界の業務効率化を加速するニッセイアセットマネジメントの生成AI×GAS活用研修事例 - IT・プログラミングを知って学べるコネクトメディア 【製造業のDX人材育成事例】デジタル人材の即戦力化を実現する、日本ガイシ株式会社の異動者向オンボーディング研修 - ITやプログラミングを知って学べるコネクトメディア フューチャーアーキテクト株式会社が実現した新入社員向けIT研修プログラムでタスクフォース制度が主体的な学びと成長を生み出す - IT・プログラミングを知って学べるコネクトメディア コードキャンプDX人材育成研修 - IT・プログラミングを知って学べるコネクトメディア コードキャンプIT・プログラミング研修事例/【IT新入社員研修】オンラインとオフラインの最適バランスを実現したFutureOneの導入事例 - IT・プログラミングを知って学べるコネクトメディア コードキャンプIT・プログラミング研修事例/【新入社員研修】柔軟なハイブリッド型Java研修で実現した新卒20名の成長と成果|サークレイス株式会社 - ITやプログラミングを知って学べるコネクトメディア コードキャンプIT・プログラミング研修事例/現場により近いところにデジタルを根付かせるDX基礎講座研修|株式会社ブリヂストン - ITやプログラミングを知って学べるコネクトメディア コードキャンプIT・プログラミング研修事例/業務の効率化・DX推進に向けたIT人材育成への第一歩|株式会社カナエ - ITやプログラミングを知って学べるコネクトメディア 企業・法人向けのIT・プログラミング研修 - ITやプログラミングを知って学べるコネクトメディア

新着記事

対象者別で探す

子供(小学生・中学生・高校生)向け
プログラミング教室検索する

子供(小学生・中学生・高校生)がロボットやプログラミング言語を学ぶことができるオフラインからオンラインスクールを検索、比較することが可能です。

子供(小学生・中学生・高校生)
プログラミング教室検索する

ITやプログラムなどの
最新情報を検索する

日々、新しいITやプログラミング言語の情報が流れていきますが、特定の情報を時系列でニュースやコラムを確認することができます。

ITやプログラムなどの
最新情報を検索する