第1回 モバイルクラウドへの道はBig Dataへの道


テラからペタヘ、膨張を続けるのが「Big Data」


 「いつでもどんな状況にあってもネットワークにつながることができる」という環境はさまざまな流行語を用いて理解されてきました。「Ubiquitous」(ユビキタス)、「FMC」(Fixed Mobile Convergence)などの言葉が浮かびますが、最近ではモバイルブロードバンド環境やスマートフォンの普及が顕著となり「モバイルクラウド」への関心が高まりつつあります。

 モバイルクラウドは、「いつでもどんな状況にあってもネットワークにつながることができる」環境が前提であるため、実現すれば急激な利用者の増加とWebサービスの多様化が期待できます。これは喜ばしいことなのですが、クラウドを運営する事業者やWebサービス事業者にとっては頭の痛い問題を抱えることになります。携帯電話やスマートフォンからのアクセスが増えるため、常にシステムダウンの恐怖と戦い、設備投資にも備えておく必要があります。一定の規模を超えると、システムの抜本的な見直しも行わなくてはなりません。

 事業者側の設備投資を余儀なくする最大の要因は、アクセス増に伴って溜まり続けるデータ量にあり、それが余りに大きいものとなるため、業界では「Big Data」と呼ぶようになりました。

 Big Dataとは、一言で言えば通信事業者やWebサービス事業者のもとに、際限無しに集まり続ける利用者のログやメッセージなどです。モバイルクラウドでは、利用頻度が大幅に高まることが予想され、管理すべきデータの桁が2つから3つくらい上がるまで爆発的に増加していくと見られています。これは、市場が拡大するという良い面と、抜本的な対策が必要になるというネガティブな面の両面を持ち合わせる一大事であり、業界関係者の間であえて「Big」を付けて呼ぶようになりました。

 Big Dataを説明するには、Twitterがわかりやすい事例となるでしょう。瞬く間に拡がったTwitterは、いうまでもなく携帯電話メールのSMS(ショートメッセージ)の文字数から決めたと言われる140文字以内のコミュニケーションです。昨年末くらいからでしょうか、日本でも多くの人が利用を開始していますが、このTwitterが1日に処理するデータ量は、この4月のTwitterの開発者会議「Chirp」の時点で1日あたり7TB(テラバイト)と発表され、半年後の10月に開催された「Hadoop World 2010」では1日あたり12TBと報告されました(図1)。すでにGB(ギガバイト)の単位を飛び超え、一定期間データを蓄積するとなれば、その単位はTBのさらに上のPB(ペタバイト)に達するでしょう。

(図1)

Twitterの開発者会議「Chirp」

Twitterの開発者会議「Chirp」

Hadoop開発者、利用者の会議「Hadoop World 2010」

Hadoop開発者、利用者の会議「Hadoop World 2010」

 莫大なデータを処理するだけのサーバー設備は、サービスを停止するまで永続的に保持し、かつ市場の拡大に対応して拡張していかなければなりません。今後、Twitterのような魅力的なWebサービスを展開しようとするならば、抜本的な対策として当初から数10テラバイト級のBig Dataに備えておくことが不可欠だといわれています。

Big Dataは、Webサービス事業者向けビジネスの金鉱脈


 このようなBig Dataへの対応は、通信やWebサービス業界にとっては新たな金鉱脈です。このBig Dataを、なるべくコストをかけずに、円滑に管理していきながらいかに新しい富を生み出すかは、まさにアイデアと技術力次第というわけです。

 ここで重要なことは、ベンチャー企業が受け入れられる程度にコストを抑えたソリューションでなければならないという点です。すでに米国では、導入コストやライセンス料が抑えられるオープンソース系の開発環境やOS、データベースを組み合わせるソリューションが主流となっており、国内でもその流れに沿ったソリューションが展開されると見ています。このような新しい技術の動向に真剣に目を向けてみてはどうでしょう。

 たとえば、今や約1億という加入者がいる日本の携帯電話通信事業も、古くからこのBig Dataの問題に直面してきました。彼らは幸いにも豊富な経営資源を投入して解決することができましたが、Twitterのような新しいタイプのWebサービス提供企業の多くはスタートアップして間もないベンチャー企業ですから、多くの資金をつぎ込むことはできません。そのため、現在Big Dataを処理する技術の主流は、オープンソース系のソフトと汎用PCを使って処理を分散・並列化する方向に向かっており、ここに世界中の英知が集まり始めています。

 この処理方法は、クラウドを支えるサーバーでの技術と同じであり、Big Dataを制することはクラウドを制するといっても過言ではありません。こうした分散処理環境においてBig Dataを扱うためのデータベースやシステムを、あまりコストをかけずに提供することが求められているからこそ、我々Geminiの出番もあるというわけです。

12次ページへ
page top