前回までは、ネットワークインフラからのTelemetry情報の収集にフォーカスしてお伝えしました。
→ 第1回:SNMPの課題とTelemetry登場の背景
→ 第2回:Telemetryの使い方[初級編]
この先は、「収集したデータをいかにして課題解決に向けて活用できるか」を検討する必要があります。例えば、収集したデータの可視化や、異常の検知、さらには異常の検知をトリガーとした通知やネットワーク機器の設定変更自動化などです。
このような使い方を実現するためには、Telemetry情報の発信源となるネットワーク機器やTelemetry情報の収集側となるTelemetryコレクターに加えて、様々なコンポーネントの連携を考える必要があります。
今回は、Telemetryを用いて得られるデータを使って自律型ネットワークを作ることを例に挙げます。その中で、必要なコンポーネントを紹介しつつ、SNMPではなくTelemetryを使うことで得られるメリットを紹介します。
自律型ネットワークの全体像今後目指すべきネットワーク像として、障害からの復旧や最適化を自動的に行う“自律型ネットワーク”を例に挙げます(図表1)。
図表1 将来的な全体像
このような自律型ネットワークに、大きく分けて①ネットワーク機器、②データ収集基盤、③ワークフローエンジンの3つのコンポーネントがあります。
これらのコンポーネントの中で、
・ネットワーク機器からデータを収集する
・収集したデータから機器の状態を分析して、ワークフローエンジンにインプットする
・適切な状態になるようなコンフィグをネットワーク機器に投入する
・コンフィグ修正後のネットワーク機器のデータを収集基盤に送信する
というClosed loopを回すことで、常に現在の状況を監視し、人間の手を介さず最適なネットワークを維持することができます。
また、収集したデータから障害や機器故障の予兆が検知できれば、障害の未然防止や、機器の予防交換のようなプロアクティブな対応をとることができます。
単に定期的な機器の予防交換だと、まだ使える機器を交換してしまったり、交換する前に機器が故障してインフラやサービスに影響が出てしまったりといったことが考えられます。しかし、機器の故障の予兆を検知し、故障までの猶予期間がわかれば、余裕を持った計画的な機器交換を行うことができます。
Telemetryを使ったデータ収集基盤を用意し活用することで、このようにサービスの継続性や保守の観点で、「Time Based Maintenance」の保全方式から「Condition Based Maintenance」に変えることが可能と考えられます(図表2)。
図表2 機械学習を用いた将来の値の予測