データセンター運用者を悩ませ続けるデータの肥大化。この問題は、5Gによるモバイルデータの増大や、AI/IoTの本格普及によってますます深刻化していく。
特に顕著なのが、データサイエンスの分野だ。統計やAI分析、機械学習等の技術を駆使するにあたり、扱うデータ量も学習モデルのサイズも飛躍的に増大している。COVID-19感染拡大や気候変動といった地球レベルの事象を分析する際のデータ量は実に数百TBにも達するという。
データサイエンスは今後、企業活動も含めて社会のあらゆる場面で活用される。「これに対応することが、IT業界の共通問題になる」と、エヌビディア ソリューションアーキテクチャ&エンジニアリング部 シニア ソリューション アーキテクトの大西宏之氏は話す。
このような時代を迎えて、データセンターネットワークはどのように進化していくべきか。その方向性は、実はすでに示されている。大量データを処理し続けてきたハイパースケーラー、つまりGAFAMが採用する「オープンネットワーキング」だ。
汎用のCPUやASICを搭載したホワイトボックススイッチと、オープンなネットワークOSを組み合わせることでコスト低減と拡張性の向上を狙うのが、その第1の目的だ。データ量の肥大化とともにスイッチのノード数、光トランシーバーの数が増大していくなか、そのコストを抑え、かつ、マルチベンダー化によって製品選択の幅を広げることができる。
コスト削減の観点では特に、通常はスイッチベンダーの純正品を用いる光トランシーバーを、サードパーティ製品に代えることで目覚ましい効果が得られる。台数にもよるが、ネットワークコストの半分以上を占めるトランシーバーの費用を半減できるケースも珍しくない。
加えて、LinuxベースのOSを採用することで、オープン化を加速させるもう1つのモチベーションが生まれた。運用自動化だ。
「Linuxで使える有償およびオープンソースのツールの中から、ニーズに合うものを自由に採用できる。特にサーバーの世界で進化している強力な自動化ツールが使えるようになる。AnsibleやChef等を使ってインフラ全体を自動化し、TCOを下げることが可能だ」(大西氏)
これと並行して、大規模データセンターではネットワーク構成の変革も進んできた。図表1・中段の「IPファブリック(IP Clos)」だ。
コア/アグリゲーション/アクセスの3階層モデルから脱却し、Spine-Leafのシンプルな2階層モデルでネットワークを構成。その間を、経路情報を交換する標準プロトコルであるBGPやVxLAN-EVPNを使って運用するこのモデルは、国内でも採用が広がっている。標準技術を使用するためマルチベンダー構成でも問題が起きにくく、安定性の高いネットワークが構築・運用できる。
そして、最近ではその先の姿も見えてきている。背景にあるのが、マイクロサービスアーキテクチャの普及だ。コンテナ化された複数のサービスがAPIを介して連携するようになれば、「サーバーもBGP等の標準プロトコルを話せたほうが都合がよい」(同氏)。
図表1の右側のように、オープンソースのルーティングプロトコルであるFRRoutingをサーバーに配し、コンテナネットワークに適した「フルL3ファブリック」を採用する事業者も出てきているという。
こうした流れのなかで採用が広がったのが、LinuxベースのOSである「Cumul us Li nux」だ。国内でもYahoo! JapanやLINE等が採用している。
提供元のCumulus Networksは2020年にエヌビディアが買収。エヌビディアは同時期にスイッチメーカーのMellanox Technologiesも買収している。オープン化に際しては、スイッチとOSのサポートが分断され、トラブルの切り分けが難しくなることが不安視されるが、2社の買収によって「オープン化のメリットを享受しつつ、従来と同等レベルのサポートを提供できる体制ができた」と大西氏は語る。
ただし、マルチベンダー化のメリットはどうしても損なわれる。それもあって、Cumulus Linuxに代わり台頭してきたのが、オープンソースの「SONiC」である。こちらもLinuxベースのOSで、もともとはマイクロソフトがAzureデータセンター用に開発したものだ。当初は、Azure 以外で使うには機能が不足していたが、オープンソース化された後に多くのユーザー/ベンダーが開発に参画。機能の拡充が進み、アリババやテンセント、LinkedIin等の超大手にも採用が広がった。
2021年にはガートナーが、200台を超えるスイッチを運用する大規模データセンターネットワークのうち40%が、2025年までに実稼働環境でSONiCを利用するようになるとの予測を発表している。