カギは設計技術とデータ保護では、企業が音声AIを活用するにあたっては何が課題となるのか。
城田氏が指摘するのが“画面レス”のインターフェース設計技術だ。従来のIT活用は画面表示を前提としていたが、音声操作のシーンではそれがない。「ユーザーが命令するだけで完結する処理なら問題ないが、何度か機械と会話する場合にはインターフェースをきちんと設計していないと使われなくなる」。
解決策となり得るのが、ユーザーの状況や文脈(コンテキスト)の活用だ。誰がどんな場面で話しているのか、どのような業務が進行中なのかといった周辺情報が、利用者の意図をより正確に把握し、自然な会話を行う助けになる(図表)。
図表 VUI(音声ユーザーインターフェース)
一方、亦賀氏はベンダー側の姿勢にも変化を求める。問題とするのは、取得した会話データの扱いだ。
アマゾンやグーグル等は、AIの音声認識・言語解析技術の向上のために利用するとしているが、その扱いには曖昧さも残る。「ベンダー側はそこをクリアにしておくべき」と同氏は指摘する。
マイクロソフトがWindows10に音声AIアシスタントのCortanaを導入したことで、音声AIは黙っていてもオフィス内に浸透していく。さらに、前述のように多様なサービス/デバイスに音声認識技術が浸透すれば、ビジネス現場での会話は次々とクラウド上に吸い上げられていくことになる。情報漏えいや不正利用の可能性はゼロではない。
匿名性が保たれるような処理を行った上でデータを利用するなど、セキュリティとプライバシー保護に配慮した仕組みづくりが重要だ。