自宅や外出先のカフェ、サテライトオフィスなど、会社以外の場所からWeb会議システムを使って会議に参加する─。今や当たり前となりつつある光景だが、現実には遠隔コミュニケーションに適した静かな場所の確保が難しく、生活音や音楽、周囲の話し声などの環境音により相手の声が聞き取りづらいことが少なくない。
また、オフィスの会議室に専用端末を設置し、複数人が参加してWeb会議を行う場合も、ノートPCのキーボードを叩く音や紙の資料をめくる音、咳払いやくしゃみといった雑音をマイクが拾ってしまい、会議の妨げになることがしばしばある。
ブイキューブが2019年11月19日に国内独占販売を開始した米KrispTechnologiesのノイズキャンセリングアプリケーション「Krisp(クリスプ)」は、こうしたWeb会議における「音」の課題を解決するものだ。
人の声と騒音を確実に識別Krispは、マイクやスピーカーなどのハードウェアから入力された音を人の声と騒音に分解し、人の声のみを送受信することで、環境音などのノイズを軽減する。
技術の核となるのが、「krisp NetDNN」と呼ばれる積層ニューラルネットワークモデルだ。5万人の音声および2万種類のノイズを計2500時間分学習させることで、人の声と騒音を確実に識別することを可能にしている。
一般的なノイズキャンセル機能は、騒音の位相と逆の位相を持つ音を生成し、互いに打ち消し合うことで騒音を消す仕組みを採用する。
この仕組みの場合、エアコンの音や犬の鳴き声、外を走っているクルマの音といった「定常的なノイズ(定常騒音)」は検知・処理することができる。しかし、サイレンや叫び声のように、高い周波数の音や突発的な音についてはノイズとして認識しないため、あまり効果がない。これに対し、Krispは膨大な学習データを基に「叫び声であれば、子供の泣きわめいている声は騒音として消去し、大人が驚いて発している大声は音声として残すというように判断することが可能」とKrisp Technologies Co-Founder兼CEOのデービット・バグダサリアン氏は説明する。
(左から)ブイキューブ 代表取締役社長の間下直晃氏、
Krisp Technologies Co-Founder兼CEOのデービット・バグダサリアン氏
Krispは、デバイスにアプリをダウンロードしセットアップした後、メニューバーの「ノイズを消す」というトグルボタンをオンにすれば利用を始められる。話者のマイクから他の参加者に伝わるノイズと、他の参加者からスピーカーを通じて伝わってくるノイズの双方に対応し、通話を中断することなくリアルタイムにクリアな音声を実現する。
音声の検出・処理はすべてデバイス上でローカルに行われ、クラウドやサーバーに送信したり保存しないため、音声データが外部に漏えいする心配もないという。
「Krisp」は、メニューバーの「ノイズを消す」というトグルボタンをオンにするだけで、
話者のマイクから他の参加者に伝わるノイズと、他の参加者からスピーカーを通じて伝わってくる
ノイズの両方を消去する
バグダサリアン氏らがKrispの開発に着手したのは2016年のこと。翌年には会社を設立し、スタートアップが新製品を投稿する米国のサイト「Product Hunt(プロダクトハント)」にKrispを出品したところ、大きな反響を呼び、2018年の年間最優秀製品に選ばれた。それを受けて、2019年6月から正式にサービスの提供を開始した。
Krispは、法人向けプラン「KrispTeams」と個人向けプランの2種類が用意されており、それぞれ月額3.33米ドル、6.67米ドルで利用できる。1アカウントにつき3端末まで使うことも可能だ。
本格開始からまだ半年余りにもかかわらず、法人向けプランの導入企業はグローバルですでに約3000社に上る。マイクロソフト、インテル、セールスフォース・ドットコムなど有力企業も多い。
Krispはシスコシステムズ「CiscoWebex」やZoom Video Communications「Zoom」、マイクロソフト「Skype for Business」といったWeb会議システムだけでなく、音声通話サービスなど600以上のコミュニケーションアプリと連携。ビジネスプロセス・アウトソーシング(BPO)コールセンタープロバイダーの米Sitelでは、在宅コールセンター業務の騒音対策に活用されているほか、法人向けクラウドプロバイダーの米Vonageが販売パートナーとなっている。
一方、個人向けプランはテレワークが盛んな米国だけでなく、世界150カ国以上、3万人を超えるユーザーに利用されているという。