SPECIAL TOPICNTTとLINEが牽引する日本の自然言語処理、この2社がリーダーである理由とは

私たちの生活・ビジネスに深く浸透し始めた自然言語処理(NLP)。今や医療・金融、コールセンターなど様々なビジネス現場でもNLPを活用したアプリケーションが当たり前に使われるようになった。このNLP研究と実用化をリードしているのがNTTグループとLINEだ。

40年超の歴史持つ「NTTの自然言語処理研究」
そして、日本のNLP研究をリードしている会社の1つが、NTTグループだ。40年以上にわたり、日本語を対象としたNLP技術の研究を続けてきている。

国内外における言語処理関連の学会では学術系の研究機関が大半を占めるなか、NTTも多くの研究成果を発表。同社は2018年頃からNVIDIAとAIプラットフォームを活用した研究開発を進めてきており、GPUコンピューティングに関する取り組みに対してNVIDIAからサポートを行っている。

さらにクローズアップされるのが、世界最大級の日本語辞書(コーパス)と、世界最高水準の意味解析技術や文法に基づく語順変換技術を有していることだ。

コーパスとは、自然言語の文章を構造化して大規模に集積したものである。

簡単に言えば、本や雑誌、新聞等のメディア、Webサイト/ブログ等で使われている話し言葉を文字化し、コンピュータで検索や分析ができるようにデータベース化したものだ。いかなる言語を扱う場合でも、その言語のコーパスが不可欠であり、その意味でNLP研究のまさに大本となる。

言語モデルの学習には、大規模なコーパスを利用することが求められる。最新の研究では、NLPモデルの性能は、モデルのサイズとトレーニングに使用されるデータ量が多ければ多いほど向上することがわかっている。つまり、世界最大級の日本語コーパスを保有していることが、NTTグループがNLP研究の分野でリーダーシップを発揮している理由なのだ。

また、NTTグループはNLPと関連性の深い音声認識・音声感情認識・応答対話の技術も幅広くカバーしている。これらの技術とノウハウは、統計的機械翻訳プラットフォームや、テキスト解析/対話エンジンに利用可能な音声解析処理APIとして広く利用されている。

NTTグループがNLPの最新動向を紹介
そのNTTグループは現在、ビジネス領域でのNLP活用をさらに推進するため、どのような取り組みを行っているのか。この3月、NTTグループ3社の最新動向を深く理解できる機会がやってくる。2022年3月21日から開催されるバーチャルカンファレンス「NVIDIA GTC 2022 Spring」だ。

3月21日に開幕する「NVIDIA GTC 2022 spring」では、NLPも重要テーマの1つ
多数のAI関連セッションが行われる「NVIDIA GTC 2022 spring」。
自然言語処理(NLP)も重要テーマの1つだ

NVIDIAが世界規模で開催するGTCでは、日本から20以上のセッションが行われる予定である。そのうち、実に5つがNLP関連のセッションであり、NTTグループからはNTT、NTTデータ、NTTレゾナントの3社が登壇する。

さらに、高速かつ高精度な音声認識技術を開発しているLINEと、それを技術面で支援するNVIDIAも「高負荷な推論処理にまつわる課題」と、その解決に向けた取り組みを紹介する。

以下、各社の取り組みと、GTCでの発表内容を紹介しよう。

NTTは音声音響処理AI、画像映像処理AI、自然言語処理AIを1つの“知識集約型AI”に統合した「MediaGnosis」を開発している。これが実現すれば、まるで人の考えるようにマルチメディア情報を処理することが可能になり、例えばAIによる感情分析も可能になるという。

下記のセッションで、このMediaGnosis開発の裏話と将来の可能性について紹介する。

【セッション タイトル】
Think and Grow Like Humans: Next-generation Media-processing AI ‘MediaGnosis’ [S41388]

NTTデータは、汎用言語モデルのBERTを、特定の業務領域(ドメイン)向けに最適化する「ドメイン特化BERT技術」の開発を進めてきている。

特定の業界で話され、また読み書きされる言語は、我々が日常生活で用いる言葉とは異なり、専門用語が多用されたり、表現方法も独特だったりする。そのため、一般的なNLPモデルやAIでは対応しきれないケースが多い。

そこで必要とされるのが、ドメイン特化のBERT技術だ。業界特有の語句を含む文章への対応が可能になるこの技術の概要とユースケースなどについて、下記のセッションで紹介する。

【セッション タイトル】
ビジネスの世界で使える自然言語処理技術 ~ 特定ビジネスデータへの最新活用事例ご紹介 [S41393]

NTTレゾナントは、パーソナライズされた対話型AIを企業が簡単に開発できるようにするAPIサービス「AI suite」を開発した。その技術的バックグラウンドやAPIを効果的に活用する事例、そして将来ビジョンについて下記セッションで説明する。

【セッション タイトル】
Introducing the API Platform “AI Suite”, which Supports Personalized AI Services in a Multimodal Environment [S41578]

RELATED ARTICLE関連記事

SPECIAL TOPICスペシャルトピック

スペシャルトピック一覧

NEW ARTICLES新着記事

記事一覧

FEATURE特集

WHITE PAPERホワイトペーパー

ホワイトペーパー一覧
×
無料会員登録

無料会員登録をすると、本サイトのすべての記事を閲覧いただけます。
また、最新記事やイベント・セミナーの情報など、ビジネスに役立つ情報を掲載したメールマガジンをお届けいたします。