VerbexのSTT・TTS APIが外部提供を開始、コールセンターや電話応対AIに向けた音声AIインフラとして展開

公開：2026年6月21日更新：2026年6月21日

CodeCampが提供するDX人材育成が可能なプログラミングやITが学べる公開講座

株式会社Verbexは、音声対話AIのコア技術であるSTT（Speech to Text／音声認識）とTTS（Text to Speech／音声合成）を、単独の「Verbex STT・TTS API」として、外部提供を開始しました。これまで同社の音声対話AIプラットフォームの中核として活用されてきた技術を、APIとして独立させたものです。企業、開発者、SIer、BPO事業者、AIエージェント開発企業が、自社サービスや業務システムに音声認識・音声合成機能を組み込めるようになりました。

Verbex STT・TTS APIの概要
Verbex STT APIとVerbex TTS APIの機能と特徴
想定ユースケースとVerbex STT・TTS APIの概要
trends編集部の一言
References

Verbex STT・TTS APIの概要

生成AIやAIエージェントの普及により、AIの活用はテキストチャットにとどまらず、音声を通じてやり取りする領域へと広がっています。コールセンター、電話応対、店頭端末、業務アプリケーション、ロボット、IoT機器など、さまざまな領域で音声AIへの需要が高まってきました。

一方で、音声AIの体験品質はLLMだけでは決まりません。人の発話を正確に認識するSTT、AIの応答を自然な音声に変換するTTS、そしてリアルタイムに処理する低遅延性が、音声AIの実用性を大きく左右します。

特に電話応対やコールセンターのような実運用環境では、電話回線特有の音質や周囲の雑音、住所や氏名、商品名、数字の認識精度などが課題となります。汎用的な音声技術だけでは、こうした課題への対応が難しいとされてきました。Verbex STT・TTS APIは、こうした実運用上の課題に対応するために開発・改善されてきた技術です。

Python研修一覧はこちら

目的に合うPython研修を一覧形式から探したい方は、ぜひご利用ください。

Python研修を比較する

Java研修一覧はこちら

目的に合うJava研修を一覧形式から探したい方は、ぜひご利用ください。

Java研修を比較する

PHP研修一覧はこちら

目的に合うPHP研修を一覧形式から探したい方は、ぜひご利用ください。

PHP研修を比較する

新入社員研修

目的に合う新入社員研修を一覧形式から探したい方は、ぜひご利用ください。

新入社員研修を比較する

全ての研修からも探したい方はこちら

Verbex STT APIとVerbex TTS APIの機能と特徴

Verbex STT APIは、電話応対や会話音声をテキスト化する音声認識APIです。問い合わせ内容や注文内容、顧客情報など、人の発話をAIや業務システムが処理しやすいテキストデータに変換します。

電話回線特有の音質や雑音環境、日本語における氏名や住所、商品名、数字といった業務利用で重要となる認識課題への対応を強化しています。

Verbex TTS APIは、テキストを自然な音声に変換する音声合成APIです。AIエージェントの応答、電話の自動応答、FAQ回答、予約受付、案内音声など、さまざまな音声インターフェースに利用できます。

業務利用における聞き取りやすさと自然な日本語の抑揚、リアルタイム対話に適した応答速度を重視した設計です。コールセンターや電話応対だけではなく、アプリ、Webサービス、店頭端末、ロボット、IoT機器などへの組み込みにも対応します。

Verbex STT・TTS APIの主な特徴は次の5点です。

リアルタイム音声対話AIで培った実運用品質
日本語の電話応対・業務会話への特化対応
低遅延なリアルタイム処理
CRM、CTI、PBX、LLMなど既存システムとの柔軟な連携
閉域接続・プライベートクラウド・オンプレミスを含むセキュリティ対応

特にセキュリティ面では、クラウド型のAPI提供に加え、金融機関、大企業、公共機関、BPO事業者など厳格な要件を持つ組織での活用も想定した複数の提供形態に対応しています。

想定ユースケースとVerbex STT・TTS APIの概要

項目	詳細
提供企業	株式会社Verbex
サービス名	Verbex STT・TTS API
カテゴリ	音声認識・音声合成API
主な想定用途	コールセンター・コンタクトセンター運営電話応対AI・音声AIエージェント構築 SIer・BPO・AI開発企業向けソリューション開発アプリ・Webサービス・IoT・ロボットへの組み込み
提供形態	クラウド型API・閉域接続・プライベートクラウド・オンプレミス
主な対応領域	日本語電話応対・業務会話に特化
特許	日本を含む25カ国で56件保有
企業ミッション	声で世界をつなぐ
WEBサイト	https://jp.verbex.ai/

Verbex STT・TTS APIの詳細はこちら

Python基礎・実践(Django)

企業・法人向けのPython研修では、基礎から応用まで体系的に学べます。

Python研修の詳細

DX社員研修

企業・法人向けのDX研修では、実務に繋がるリスキリングでITレベルを向上させます。

DX研修の詳細

Javaエンジニア育成研修

企業・法人向けのJavaエンジニア育成研修では、Javaの基礎から応用まで確実に習得できます。

Java研修の詳細

新卒・新入社員向け研修

企業・法人に新入社員・新卒社員に向けたプログラミング研修を提供しています。

新入社員研修の詳細

コードキャンプのIT研修を全て見る

trends編集部の一言

日本を含む25カ国で56件の特許を保有するという事実は、音声AI領域における研究開発の蓄積の厚さを示すものです。音声AI市場全体としては、「LLMさえあれば音声AIが実現できる」という前提が見直されつつある段階にあり、STT・TTSを独立したAPIとして切り出す動きはその流れを象徴しています。

認識精度や応答速度、自然な抑揚という三つの要素を実運用で積み上げてきた技術基盤をAPIとして提供するアプローチは、業界全体としての音声AI導入ハードルを下げる動きとして注目しておく価値があるでしょう。

バングラデシュと日本のシリアルアントレプレナーが組む国際チームという構成も、アジア発の音声AIスタートアップとして独自のポジションを生み出しています。金融や自治体、医療など厳格なセキュリティ要件が求められる領域での展開が今後どう進むか、引き続き動向を追いたいところです。

References

^ PR TIMES. 「Verbex、リアルタイム音声対話AIを支える独自音声認識・音声合成モデルをAPIとして提供開始 | 株式会社Verbexのプレスリリース」. https://prtimes.jp/main/html/rd/p/000000016.000172103.html, (参照 26-06-21).

※上記コンテンツの内容やソースコードはAIで確認・デバッグしておりますが、間違いやエラー、脆弱性などがある場合は、コメントよりご報告いただけますと幸いです。