「40年以上の自然言語処理研究のノウハウを結集した」。NTTの島田明社長は、NTT版LLM「tsuzumi」をこう紹介した。
島田明社長(左)と執行役員 研究企画部門長 木下真吾氏
NTTが2024年3月より商用開始するtsuzumiは、同社の自然言語処理技術を活かした高い言語性能が特徴だという。なかでも日本語については、生成AIのベンチマーク「Rakuda」でGPT-3.5をはじめ、国内外のLLMを大きく上回った。英語についても、世界トップクラスのLLaMa 7Bと同程度の性能を実現する。今後は、フランス語やドイツ語、中国語、韓国語など多言語への拡充を予定している。
世界トップクラスの日本語性能を特徴とする
LLMは大規模化が進んでいるが、tsuzumiは軽量であることも特徴だ。パラメータサイズが0.6Bの超軽量版は、GPT-3(175B)の約1/300、パラメータサイズが7Bの軽量版は約1/25となっている。
軽量化のメリットとして、執行役員 研究企画部門長の木下真吾氏は「学習コストや推論コストを低減できる」と説明した。大規模なLLMの学習には膨大な電力を消費するが、軽量化により消費電力も抑えられるという。
軽量化により、学習コストが約1/300(超軽量版)に低減される
また、tsuzumiは精度やコストなど要件の違いに合わせて、3つのチューニング方法から選択することができる。これにより、業界ごと、あるいは組織ごとのカスタマイズを低コストで実現するという。
3つのチューニング方法を提供する
さらに、国産LLMとしては初めて、言語だけでなく、図表読解などマルチモーダルに対応。例えば、言語による質問に加えて、文書画像を提示しながら質問することができる。これにより、請求書や仕様書など画像付き文書を用いる業務やRPA業務にも活用することが可能だ。
将来的には、聴覚への対応も予定している。木下氏によると「子供の電話相談に優しい声で応対するといったことができる」という。