NTTドコモは、10月14日17時頃から発生した通信障害について説明会を開催した。
通信障害の影響は全国に及び、音声通話とパケット通信サービスが利用しづらい状況が続いた。4G/5Gについては翌10月15日の午前5時5分に回復したが、3Gについては現在も復旧対応が続いている。
発生事象の時系列
障害はなぜ発生したか
障害が発生した原因については以下の通り。
ドコモは10月14日未明、IoTサービスを提供する加入者/位置情報サーバーを、旧設備から新設備に切り替える工事を実施していた。
切り替え後、新設備の加入者/位置情報サーバーで不具合が発生。そこで旧設備に切り戻しを行った。その際、IoT端末へ位置登録を促したところ、位置登録信号再送のトラフィックが大量発生して輻輳が発生した。位置登録のトラフィックがどのくらい発生するかは事前に計算し、耐えられると判断していたが、実際には耐えられなかったという。
NTTドコモ サービス運営部長の引馬章裕氏は「IoT端末の位置登録を、いくつかのグループに分散して旧設備に移す作業手順を取っていたが、旧設備側の処理能力を見誤っていた。一度に推定20万台のIoT端末から位置登録信号が来たことが今回の事象の発端になった」と説明した。
発生事象
なお、「新設備の方は仮想化されているが、旧設備は仮想化されていなかった。20万台のIoT端末の位置登録は、新設備であれば耐えられると考えている」(常務執行役員 ネットワーク本部長の小林宏氏)。
(左から)NTTドコモ 常務執行役員 ネットワーク本部長 小林宏氏、
代表取締役副社長 田村穂積氏、サービス運営部長 引馬章裕氏