南米アマゾンの大規模な森林火災のニュースを目にした時、一瞬、アマゾン・ドット・コムやAWSが何かトラブルを起こして炎上したのかと思ったのはIT専門紙の作り手としての職業病のようなものか。そうこうしているうちに、8月23日にはAWSの東京リージョンで大規模障害が起こってしまった。
既にこの件については報道やAWS側からの発信に加え、ユーザーやパートナー企業などからも多くの情報が世に出ている。ざっくりと振り返れば、東京リージョンの特定のアベイラビリティゾーン(AZ)で、冷却装置の管理システムの障害によりデータセンターのサーバーがオーバーヒートし、仮想サーバーの「EC2」やRDBのマネージドサービス「RDS」、ブロックストレージの「EBS」が使用不能になったり、極端にパフォーマンスが低下したという障害だ。
AWSのクラウドインフラは、リージョン(地域)単位で世界中に整備されていて、一つのリージョンは複数のAZから成る。AZとは、複数のデータセンターで構成されるクラウドインフラのロケーションの単位だ。AWSはいずれのリージョンでも、複数のAZを自然災害などの影響を受けない十分に離れた場所に配置しているという。東京リージョンには四つのAZがあり、その一つが障害の発生源になったわけだ。
上記の範囲に限らず障害があったという声や、マルチAZ構成でも障害の影響を受けたという情報もあり、詳細な検証は必要であろう。しかし、よもや週刊BCNの読者に今回の障害をもって「クラウドはだからダメなんだ」と考える人はいないだろう。当日夜には大部分が復旧したというアナウンスもAWSから出たが、スマートフォン決済アプリの「PayPay」で支払いや入金ができなくなるなど、世間の注目が大きいサービスに影響が出たこともあって、一般紙の報道などでは「クラウドのもろさ」をことさら強調する論調が目立ったのは困ったことだと思う。クラウドサービスの利用にあたって想定しておくべき範囲のリスクでもあろう。
そもそもこうした障害のリスクはクラウドに限らずあり、システムの重要度や特性に応じてどのようなアーキテクチャー、インフラ、運用方法を選択するかは全ての企業が考えなければならないこと。これはもはや経営戦略そのものだ。今回のAWSの大規模障害を思考停止の言い訳にするのではなく、自社のテクノロジー戦略に冷静に向き合う契機とする姿勢こそ建設的だ。
週刊BCN 編集長 本多 和幸
略歴

本多 和幸(ほんだ かずゆき)
1979年6月生まれ。山形県酒田市出身。2003年、早稲田大学第一文学部文学科中国文学専修卒業。同年、水インフラの専門紙である水道産業新聞社に入社。中央官庁担当記者、産業界担当キャップなどを経て、2013年、BCNに。業務アプリケーション領域を中心に担当。2018年1月より現職。