NTT製LLM「tsuzumi 2」に新モデル、図表付きビジネス文書の理解に強み

NTTが日本語能力に特化して独自開発するLLM「tsuzumi 2」をアップデートした。ビジネス文書に多く見られる「文字+図表」の理解力を向上させた「Visionモデル」をリリースする。tsuzumi 2は、1GPU・40GBメモリで動作する軽量さが売りで、今回の強化により、モデルサイズが数倍以上のGPT-5やLlama2 Scout109Bなどと遜色ない図表入り文書の理解力を獲得したという。

2023年10月の初期バージョン提供開始、2024年3月の商用化を経て、段階的に進化を続けてきたNTTの「tsuzumi」。軽量さと日本語理解力を売りとするこの大規模言語モデル(LLM)は、2025年10月に「tsuzumi 2」へと進化した(関連記事:NTTの独自LLM「tsuzumi」がアップグレード 3つの強化ポイントとは)。

それから約半年。2026年5月19日に発表したのが、「文字+図表」の理解力を高めた新モデル「tsuzumi 2 Vision」だ。NTT サービスイノベーション総合研究所 人間情報研究所 上席特別研究員の西田京介氏は記者説明会で、「従来のテキスト処理能力に加えて、ビジョン機能(画像理解機能)を新たに搭載したこと」が最大の特徴だと説明した。

Visionモデルの概要

Visionモデルの概要

tsuzumi 2の利用形態は「オンプレミスが約6割」

tsuzumiとその進化版であるtsuzumi 2は、OpenAIのChatGPTなどと比べて、「軽量」であることを強みとしてきた。tsuzumi 2は1GPU、40GBメモリで動作可能であり、それでいて「他社の最新・最先端モデルに匹敵する日本語指示遂行能力を備えている」(西田氏)。

より小さなコンピューティング能力でも軽快な動作が可能なことから、tsuzumi 2の利用形態としては「オンプレミスあるいはプライベートクラウド環境」が多いと同氏。外部にデータを出せない「機微情報を扱う業務での利用に適して」おり、実際、問い合わせの約6割が金融や医療、公共といった分野からのオンプレミス運用を求めるケースだという。

西田氏は、今回のVisionモデルの開発・提供には、こうした利用形態が背景にあると話した。

続きのページは、会員の方のみ閲覧していただけます。

関連リンク

RELATED ARTICLE関連記事

SPECIAL TOPICスペシャルトピック

スペシャルトピック一覧

NEW ARTICLES新着記事

記事一覧

FEATURE特集

WHITE PAPERホワイトペーパー

ホワイトペーパー一覧
×
無料会員登録

無料会員登録をすると、本サイトのすべての記事を閲覧いただけます。
また、最新記事やイベント・セミナーの情報など、ビジネスに役立つ情報を掲載したメールマガジンをお届けいたします。