SiriやAlexaといった対話型AIは、今やすっかり日常生活の一部となった。人間とコンピュータの関係を劇的に変えたこのAI技術は音声認識や機械学習、ディープラーニングなど様々なテクノロジーによって実現されている。なかでも核となる技術が「自然言語処理(NLP)」だ。
NLPとは、人間が日常的に使っている自然言語をコンピュータに分析・処理させる技術だ。その応用範囲は急速に広がっている。
例えば、医療分野では電子カルテの入力支援や記載内容のチェックに活用され、コールセンターでは音声認識と組み合わせて会話内容のテキスト化や感情分析、自動応答などに使われている。
学術・研究機関やコンサルティング業界は文献検索や特許情報処理に、金融・保険業界でも文書検索や財務分析などにNLPを活用したアプリケーションを利用し、業務の自動化・効率化を図っている。広告分野では、ユーザーのプロフィールやSNSへの投稿内容から性別・年齢、家族構成や趣味嗜好を分析したり、マーケティング分析に活用しようとする取り組みもある。
こうした業務文書の検索・解析、自動応答や感情分析といった使い方は、上記以外にも幅広い業界・企業で需要が見込まれる。ビジネス現場でのNLP活用は、今後ますます広がっていくだろう。
自然言語処理技術の発展により、対話型AIの活用が広がっている
NLP研究にブレイクスルーをもたらしたもの
NLPの活用範囲がビジネス領域で広がっている背景にあるのが、処理精度の飛躍的な向上だ。精度が低ければ結局、処理された結果を人間がチェックする作業が発生してしまう。そのため従来は、ある程度のエラーが許容できる作業に留めるなど、NLPの用途は限られていた。
これを打開する契機となったのが、グーグルの「BERT」「T5」、OpenAIが開発した「GPT-3」といった高度な言語モデル(単語の出現確率をモデル化したもの)の登場だ。
例えば、2018年に発表され、NLP研究にブレイクスルーをもたらしたとされるBERT(Bidirectional Encoder Representations from Transformers)は、NLP向けの事前学習手法を大きく変えた点において、その功績を高く評価されている。
それ以前のモデルでは、解きたいタスクごとに大量の教師データを必要としていたのに対し、BERTは「教師なし事前学習」によって、大量の自然文を使って汎用的な言語モデルを構築することを可能にした。この事前学習済みモデルをチューニングすることで、より簡単かつ短時間で言語モデルを作り、多様な用途に高性能なNLPを利用することができるようになったのだ。
BERTの学習済みモデルは様々なタスクに応用可能であり、これが公開されることで対話型AIの普及が加速することが期待される。
そのため、日本でも京都大学や東京大学、情報通信研究機構などがBERTの日本語版事前学習済みモデルを公開。この汎用モデルをベースに、医療・ヘルスケアや製造業、金融など業界特有の専門用語や表現方法に対応できる「ドメイン特化型モデル」の開発が進んでいる。