ネットワークインフラの監視における「次世代SNMP」の位置づけとして、「Telemetry」(テレメトリ)が大きな注目を集めています。これは、AI(人工知能)に代表されるビッグデータ解析アプローチを、ネットワークにも適用可能にするものです。本連載では、このTelemetryについて、具体的な使い方も交えながら3回にわたって解説していきます。
これまでネットワーク機器の監視・制御プロトコルとして使われてきた「SNMP」に代わる新たな技術として、近年、「Telemetry」が注目を集め始めています。ICTシステムのリアルタイムな可視化・分析が求められるようになり、そのために、データのリアルタイム取得が必要になってきたことがその背景にあります。
第1回となる今回は、SNMPによるネットワーク監視にはどのような課題があるのか、そして、Telemetryが必要とされる理由とその基本的な仕組みを紹介します。
Telemetry登場の背景まず、Telemetryという言葉の定義を説明します。
これは、①遠隔(Remote)を意味する「Tele」と、②測る(Measure)を意味する「Metry」の、2つの単語からなる造語です。ITインフラの監視という目的において、Telemetryは「次世代SNMP」と捉えることができます。
Telemetryが注目を集めるようになった背景は、グーグルに代表されるHyper Scale Player(超大規模データセンター事業者)が、SNMPによるデータセンターの運用に限界を感じている点にあります(図表1)。
Hyper Scale Playerは、非常に大規模なデータセンターを構築し運用しています。その規模感は、例えばグーグルでは「400万行に及ぶ設定情報」「1カ月当たり3万行の設定変更」「800万のObject ID【OID】にもなる監視対象」というものです。
また、こうした事業者では、ホワイトボックススイッチも積極的に採用しています。ホワイトボックススイッチの活用は、ネットワーク機器コストの削減につながりますが、一方で機器の機能不足等から、ネットワークの可用性を低下させるリスクもあります。
そこで、このような環境下でも効率的な運用を実現するための新たな手法が求められるようになりました。例えば、いま流行りになりつつありますが、ネットワークをインテント・ドリブン型(目的主導型)に移行することや、ワークフローをより洗練化するといった取り組みが進んでいます。
Telemetryは、これらを実現する技術として考案されたと言ってもいいかもしれません。つまり、ネットワークリソースをリアルタイムで把握可能にし、そこで得られたビッグデータを活用するものなのです。
これにより、障害の発生等に迅速に対処し、可用性を高めることが可能になります。