企業ネットワーク最前線

次世代ネットワーク監視「Telemetry」徹底解説(最終回)

Telemetryの使い方[実践編]

文◎井上勝晴、HADI SHAIKH ZAKER、片野祐(ネットワンシステムズ) 2018.08.23

  • bookmark
  • Teitter
  • 印刷

本連載では、ネットワークインフラの監視における「次世代SNMP」の位置づけとして注目を集める「Telemetry」について、具体的な使い方も交えながら解説します。最終回は「Telemetryの使い方(実践編)」として、実環境への適用を想定したTelemetryデータ収集基盤の全体像やネットワークインフラの可視化、ビッグデータ解析による予兆検知をご紹介します。

“ちょっとした異常”も検知今までのネットワーク監視運用では、静的な閾値による監視と通知がメインでした。しかし、最近では機械学習を利用して、閾値を人間が指定することなく、いつもの状態を学習してモデル化し、通常時と異なる振る舞いをしたときに検知することも可能になっています。

図表3のように、閾値を用いた監視では検知できなかったような“ちょっとした異常”も検知できる可能性が出てきます。従来に比べてより早く機器の異常に気がつける可能性があるのです。

機械学習と聞くとハードルが高いと感じる方もいるかもしれません。しかし、最近ではプログラムを書くことなく機械学習ができるツールが出てきているため、比較的容易に使い始めることができます。

 

図表3 機械学習を用いた異常検知
図表3 機械学習を用いた異常検知


Telemetryを使うメリットこの自律化ネットワークに、SNMPではなくTelemetryを使うメリットをあらためて挙げてみます。

■機器にかかる負荷の削減
第1回で説明した通り、Telemetryはサブスクリプション方式(購読/配信型)を採用しているため、ネットワーク機器の処理が軽くなります。

SNMPでは、ネットワーク機器がリクエストを受ける毎に辞書形式を調べてレスポンスを返していますが、これに対してTelemetryでは、予め求められた情報をSubscriber(購読者)へ定期的に配信するだけなので、負荷がかかりにくいのです。

また、エンコーディングの面でも、より動作の軽いGPB(Google Protocol Buffers)を使用することができるというメリットがあります。Telemetryデータを小サイズで高速・シンプルに送信することができるため、よりリアルタイムに近い間隔でのデータ取得が必要であり、Subscriberが複数存在する場合でも、負荷や応答時間はそれほど変わらずTelemetry情報の発信(Push)性能を維持することができます。

■運用管理負荷の削減
こちらも第2回で説明した通り、機器のステータスを取得する時のモデルとして、ベンダー独自のモデルに加えて、OpenConfigで策定された共通データモデルが利用可能になります。

特に、OpenConfigモデルの利用によって運用の統一化につながるため、機器ベンダーに依存しない環境が構築できます。ネットワークが大規模になるにつれて管理機器が増えていくため、運用の統一化は特に重要になる点です。

■粒度の細かいデータの取得
Telemetryは、よりリアルタイムに近い間隔でネットワーク機器の情報を取得できるため、現実に近い状態を監視することができます。

例えば、SNMPを使って10分間隔で情報を取得していた場合、前回のデータ取得時から10分間のデータが平滑化されてしまいます(図表4)。10Mbpsという帯域情報が得られても、それが「1分間に10Mbpsの状態が10分間続いていた」のか、それとも「特定の1分間にのみ100Mbpsが発生していた」のかを判断することができません。

 

図表4 SNMPでデータを取得した場合
図表4 SNMPでデータを取得した場合


これに対して、数秒間隔でのデータ取得にも耐えられるTelemetryであれば、マイクロバーストのような一瞬のトラフィックの急増も追うことができるため、実際のネットワーク状況を把握することが可能になります(図表5)。

 

図表5 Telemetryでデータを取得した場合
図表5 Telemetryでデータを取得した場合


また、取得したデータを使ってビッグデータ解析を行う、例えば機械学習を行うという場面でも、Telemetryで取得できるデータはSNMPよりも適していると言えます。

機械学習を行う際には大量のデータが必要になります。機械学習によってカウンター値の将来予測をしようと考えた場合、粒度の細かい時系列のデータを使った方が、多くの場合、精度が良くなります。

やりたいことによっては、数分間のデータの平均値を見たり、トレンドを把握するために移動平均を取ってならしたデータを使って分析することも考えられますが、粒度の細かいデータを取得していれば、どちらの場合も、そのデータを加工することで意図したデータにすることができます。

見たい指標によって、データの取り扱いは変わりますが、加工元のデータがないと加工もできないため、できるだけ多くのデータを収集しておくことが推奨されます。

スペシャルトピックスPR

intel1906
extreme1906
nttcom1906sp

>> 今月の月刊テレコミュニケーション

月刊テレコミュニケーション【特集】5G時代のエッジ革命
 <Part1> 楽天の5G×MEC革命  <Part2> スマートシティとエッジコンピューティング <Part3> エッジコンピューティングでクルマはどう進化する? <Part4> ローカル5Gと相乗効果も  製造業で進むエッジ活用 <Part5> 五感をエッジデータ化  ヒト視点のエッジコンピューティング <Part6> エッジ運用の課題と対策  <コラム> 5GでエッジAIはさらに進化する

●[インタビュー] サイバーディフェンス研究所 名和利男氏「5Gへの攻撃で国家に大打撃  DX時代は通信がアキレス腱」 ●Wi-Fi 6の使い道を徹底解説 ●セキュリティ人材不足はシェアして解消 ●ビル制御システムはNWで守る ●見えてきた“90GHz帯”5Gの可能性 ほか

>>詳しい目次を見る

ホワイトペーパー

スペシャルトピックス

エクストリーム ネットワークス5万人利用のNWをわずか2名で運用
IT管理者に嬉しいWi-Fi 6対応AP

エクストリームのWi-Fi 6対応APならAI自動RF管理など機能が満載だ。

ネットスカウトシステムズNWを隅々まで可視化してDDoS対策
ボリューム型もL7攻撃も防ぎ切る!

世界最大級の監視システムATLASで全世界のDDoS攻撃を防ぎ続ける!

Synology話題の「メッシュWi-Fi」を選ぶならSynology

ハード性能に加えてソフト機能も充実! ビジネスにも活用できる。

Cloudian HyperStore企業のGDPR遵守を強力サポート!
EB級ストレージを安価に自社構築

Amazon S3と同等のオブジェクトストレージを自社で構築・運用できる

NEC UNIVERGE SVシリーズクラウドとの連携を容易に実現!
新NEC UNIVERGE SVシリーズ

新端末を組み合わせることで、通話にとどまらない充実した機能

インテルキャリア網もクラウドネイティブへ
5G革命を推進するインテル

インテルが5G時代の新NW実現に向けた取組みを加速させている。

エクストリームネットワークスWi-FiとIoTをAIが自動で管理
10万人のスタジアムに搭載

「Smart OmniEdge」がネットワークエッジのトラブルから解放する!

NTTコミュニケーションズeSIMを本格提供! 垂直統合で企業のIoT活用を支えるNTT Com

国内MVNO初のリモートプロビジョニング対応eSIMサービスも提供開始

サクサキャリア網の利用で高い通話品質
スマホ2台までお試し導入も!

サクサのビジネスホンなら、スマホ内線が途切れない! 使い勝手も◎!
NTTコムウェアスマホ内線で高い通話品質を実現!

交換機開発のノウハウを活かしたNTTコムウェアのクラウドPBXは、高い安定性や優れた通話品質が特徴

アクセスランキング

tc1904

「通信」の力でビジネスを進化させるbusinessnetwork.jp

Copyright(c) 2018 RIC TELECOM Co.,Ltd. All Rights Reserved. 記事の無断転載を禁じます