ソフトバンク、通信業界向け生成AIの安全な学習を実現する「合成データ生成基盤」を構築

2026.03.17

ページタイトルとURLがコピーされました

ソフトバンクは2026年3月17日、通信業界向けの生成AI基盤モデル「Large Telecom Model」（LTM）において、通信ネットワークの運用などに関する機密性の高い情報を保護しながら高精度な学習を可能にする「合成データ生成基盤」を構築したと発表した。

LTMは、ソフトバンクが保有するネットワークデータや管理・運用ノウハウ、標準仕様書などのパブリックデータ、シミュレーションデータなどを学習した生成AIモデル。ただ、学習データに機密性の高い情報が含まれるため、セキュリティの観点から、モデルやデータの活用範囲が限定されるという課題があったという。

そこでソフトバンクは、合成データ生成ツール「NVIDIA NeMo Safe Synthesizer」をLTMのデータ処理プロセスに導入し、これを大規模なネットワークデータに適用することで、情報の複雑な相関関係を維持しながら、機密情報を含まない安全な合成データセットを生成することを可能にした。

具体的には、特定データを削除・変更してもモデルが学習・出力する内容に実質的な影響を及ぼさないことを数学的に保証する「差分プライバシー技術」により、個々のネットワーク機器に紐づく固有データなどを含む希少で機密性の高い情報がAIモデル内部にそのまま記憶されるリスクに、定量的な上限を設けているという。

また、特定のデータが学習に使われたかを推測する攻撃である「MIA（Membership Inference Attack）」の成功率が、無作為に推測した際の確率と統計的に同水準に収まることを確認。加えて、一般的な属性から基地局の位置情報などの機密属性を推測する攻撃である「AIA（Attribute Inference Attack）」への耐性も評価し、機密情報の推定が困難であることを確認した。