Twilio Japanは2025年8月29日、開発者向けイベント「CX Innovation Night Part 2」を開催した。
TwilioはCPaaS(Communication Platform as a Service)市場の先駆けとして、音声・メール・動画などの通信機能を統合したコミュニケーション基盤を提供してきた。現在はこれにデータやAIを組み合わせ、あらゆる顧客接点において快適でパーソナライズされた体験を実現することを目指している。
既存の電話やチャットボットを手軽に“AI化”するTwiio
イベントでは、Twilio Japan プリンシパルソリューションアーキテクトの中村光晴氏が登壇し、TwilioとAI連携の最新状況を紹介した。
Twilio Japan プリンシパルソリューションアーキテクトの中村光晴氏
中村氏はまず、音声通話をAIで扱うには必ずテキスト化が必要であり、その処理を「Twilio内部で行う」か「外部AIサービスに渡す」かの2つのアプローチがあると説明した。
製品別に整理すると次のようになる。「Elastic SIP Trunking」は、既存のPBXや電話システムをSIPでAIプラットフォームに接続し、会話データの分析や自動応答を可能にする。音声データをWebSocket経由でリアルタイムにAIへ送信するのが「Media Stream」だ。AI側で文字起こしや解析を行い、CRM連携やアラート発報など即時処理に利用できる。また、「Programmable Voice Virtual Agent」ではWebSocketを通じてグーグルの会話エージェント「Dialogflow CX」と連携し、自然対話による音声IVR(自動応答)やオペレーターとのハイブリッド対応を実現する。
Twilio製品ごとのAIによるリアルタイム音声・テキスト認識のアプローチ
一方、Twilio内部で音声のテキスト化から合成までをパッケージとして提供するのが「ConversationRelay」だ。STT/TTSや会話オーケストレーション機能が組み込まれており、開発者はWebSocketひとつでLLMに接続可能になる。テキストベースであるが音声認識機能も含まれており、「開発者は本来必要なLLMの調整やプロンプト設計に専念できる」(中村氏)ことが大きな利点だという。
「ConversationRelay」の特徴
さらに、Twillioは「AI Assistant」を現在デベロッパープレビューとして提供。FAQ応答や一次受付を自然言語で自動化できる。TwilioのAPIを既存の電話やチャットに組み込むことで、短期間でAI応対を立ち上げられるのが特徴だ。
中村氏は、こうした機能を活用してAI音声ボットがピザの電話注文を受け付け、適切に案内するデモも披露した。中村氏は、「このデモのように顧客体験の改善にトライし、その結果をフィードバックしてほしい」と開発者に呼びかけた。