コンテナベースでアプリケーションを開発すれば、ほかのクラウドサービスなどのコンテナ環境に移動することは容易になった。一方データは、いったんクラウドに蓄積すると、そこから動かすことはあまりない。いかに多くのデータを自社のクラウドに誘引できるかは、クラウドベンダーのビジネスを大きく左右する。オンプレミスの「SQL Server」で多くの実績を持つマイクロソフトは、Azure上でどのようなデータベースサービスを提供することで、ユーザーのデータを呼び込もうとしているのだろうか。
(取材・文/谷川耕一  編集/日高 彰)

 大量のデータをクラウドとオンプレミスの間で行き来させるには、手間も時間もかかる。また、多くのクラウドサービスではデータを格納するコストよりも、取り出すコストのほうが高く設定されている。つまり、ユーザー側が一度クラウドに入れたデータを移動させる理由はほぼない。

 このような構造があるため、各クラウドベンダーはユーザー企業の事業の根幹にあるデータを獲得すべく、データベースサービスに力を入れている。大手クラウドベンダーであり、同時に既存製品のSQL Serverで膨大な数のユーザーを抱えるマイクロソフトも、Azure上にさまざまなデータベースサービスを展開し、多様なニーズに応えようとしている。
 

データベースでもオープンソースを重要視する

 マイクロソフトはWindows OSで評判の良くない更新作業について、より良い顧客体験を提供できるよう日々努力している。そのために世界で12億ほどのWindowsユーザーのPC利用状況データ、たとえば更新時のネットワーク速度や時間などの情報を集め、分析し更新作業の最適化に取り組んでいる。その効果もあり、更新タイミングがユーザーの作業をあまり邪魔しないようになるなど改善の兆しも見える。

 ユーザーから集められた膨大なデータは、AzureのSQL DatabaseやSynapse Analyticsに蓄積されているかと思いきや、Azure上で動作はしているものの、オープンソースデータベースであるPostgreSQL(VeniceDB)が使われているという。これには、2019年に買収したシタスデータ(Citus Data)による、PostgreSQLを大規模に拡張する技術を用いている。Citusの技術を活用することで、CPUコア数2800、ノード数100以上のクラスターを構成しているのだ。

 Citusの開発チームはマイクロソフトのオープンソースソフトウェアの開発チームに組み込まれ、統合後も引き続きPostgreSQLのオープンソースコミュニティに貢献を続けている。ほかのクラウドベンダーもオープンソースのデータベースを利用したデータベースサービスを展開しているが、多くの場合ソースコードに手を入れ独自化している。一方マイクロソフトは、オリジナルのソースコードには手を入れていないのが特徴だ。ソースコードをフォークして独自開発しないため、ベンダーロックインも防げると主張する。

 オープンソースのリレーショナルデータベースでは、MySQLや、ほかではあまり見られないMariaDBもAzureのフルマネージドサービスとして展開している。「Cache for Redis」や「Managed Instance for Apache Casandra」もあり、多様な選択肢が用意されている。既にマイクロソフトはLinuxやJava、Dockerなどさまざまなオープンソース技術に対応し、開発コミュニティへの貢献も積極的に行っている。SQL Serverという自社の商用製品があるデータベース領域でも、そのスタンスは変わらないのだ。