KDDIは2024年1月25日、LTEのモバイルコアネットワークにおいて、AIを活用した障害検知システムの運用を開始したと発表した。
KDDIは2022年7月に発生した通信障害を受け、通信障害が社会へ与える影響の甚大さを改めて認識するとともに、再発防止に向けた改善と高いネットワーク品質を目指す取り組みを進めており、その一環として本運用を実施している。
これまでの障害を検知するシステムでは、障害を判断する一定の基準値(固定しきい値)を設定して障害を検知していたが、昼間に多く使われ、夜間に減少するトラフィック量など、時間帯や平日・休日の違いで値が大きく変動するパターンでは固定しきい値を設定することが難しく、このようなパターンのデータでの障害検知が課題だった。
今回運用を開始したシステムは、過去のパフォーマンスデータのパターンを学習して、予測値を生成する。この予測値と実測値を比較し、大きく乖離がある場合に異常が発生しているものとして障害検知の判断に活用する。また、過去のパフォーマンスデータには、時間帯や平日・休日などの時系列データに関連する属性も含まれており、これらのデータを使ってより精度高く予測する仕組みを具備している。
本システムの仕組み
例えば、音声接続成功率など、正常時は一定の値となるパフォーマンスデータに対しては固定しきい値を用いて基準値を設定することで異常を検知することができるが、トラフィック量など、時間帯や平日・休日などで傾向のあるパフォーマンスデータに対しては効果的な基準値を設定することができなかった。同システムでは、時間帯や平日・休日などの属性を含めたパフォーマンスデータを分析することで、祝日を考慮したパターンとなる予測値を自動的に生成するといったことができるようになる。
本システムによる監視対象の拡大
これにより監視対象のパフォーマンスデータ数を固定しきい値だけの適用に比べ6倍に拡大、異常を検知できる可能性を大幅に高めることで、障害の大規模化の予防につなげることができるという。