2020.03.18 ｜ Writer：NTT東日本アベ

AWSにおける可用性の基本

社内のさまざまな領域でデジタル化が加速するのに伴い、システムの可用性に対する要求が高まっています。

特に、基幹システムのようにシステムの停止が事業運営に多大な影響を及ぼす場合、システムの可用性を維持することはとりわけ重要となります。

Amazon Web Services (AWS)をはじめとする主要なクラウド事業者は、クラウド上で構築・運用されるシステムの可用性を高めるためのベストプラクティスに関する情報や、ベストプラクティスの実践をサポートするためのサービスを提供しています。

このコラムでは可用性について基礎的な知識を解説すると共に、クラウド上で構築・運用されるシステムの可用性を高めるための方法を紹介します。

可用性

可用性とは何か
稼動率とは何か
SLAとは何か
AWSがSLAを引き上げる背景

可用性を高めるための方法

負荷分散と死活監視
マルチAZ構成／マルチリージョン構成

おわりに

可用性

可用性とは何か

可用性は、システムが利用可能な状態を維持する能力を意味する言葉として用いられます。

ユーザーの観点からは、利用したいときにシステムを利用できる度合いと考えることもできます。

システムが利用できる時間が長いほど、システムの可用性は高くなります。

逆に、障害などが原因でシステムが停止した場合、システムが復旧するまでの間はシステムを利用できないため、システムの可用性は低下します。

可用性を評価するための指標としては、次に解説する「稼動率」がよく用いられます。

稼動率とは何か

稼動率は、対象とする期間においてシステムが稼動＝利用可能な状態を維持していた時間の割合を意味する言葉として用いられ、システムの稼動時間 ÷ 対象とする期間の長さで算出されます。

また、対象とする期間の長さはシステムの稼動時間と停止時間の和に等しいため、システムの稼動時間 ÷ (システムの稼動時間 + システムの停止時間)で稼動率を算出することもできます。

稼動率の単位にはパーセント(%)が用いられ、システムの稼動時間が長いほど、稼動率は100%に近づきます。

システムやサービスの稼動率として、例えば「99%」や「99.9%」と表記すると一見高そうに感じられますが、1年単位で考える場合は停止時間が87時間以下であれば稼動率99%を達成することができ、停止時間が8時間以下であれば稼動率99.9%を達成することができます。

なお、稼動率から停止時間を計算したい場合は、対象とする期間の長さと(1 - 稼動率)の積として停止時間を算出することができます。

稼動率は過去の実績に基づく指標であり、システムやサービスの可用性を評価する上で有用ですが、過去の稼動率から未来の稼動率を推測することは困難です。

そこで、次に解説する「SLA」が重要となります。

SLAとは何か

サービス水準合意(service level agreement: SLA)は、システムやサービスの提供者と利用者の間でサービス水準に関する合意形成を図るために結ばれる合意を意味する言葉として用いられます。

前に解説した稼動率は、クラウドサービスのサービス水準としてよく用いられる指標の一つであり、クラウド事業者は目標とする稼動率を上回るように最善の努力を尽くします。

SLAには、ある期間において目標とするサービス水準を達成できなかった場合に、その期間のサービス利用料の減額や返金など、ペナルティに関する規定が含まれることもあります。

クラウドサービスの利用者はシステムを計画・設計するにあたり、クラウド事業者によってSLAとして提示されるサービス水準を一つの基準として用いることができます。

AWSがSLAを引き上げる背景

AWSはWebサイトなどでサービス水準の引き上げを頻繁にアナウンスしています。

AWSがサービス水準を引き上げる背景として、オンプレミスで稼働している既存の基幹システムや勘定システムなどのクラウドへの移行を取り込みたい思惑があることが仮説の一つとして考えられます。

クラウドコンピューティングは技術のライフサイクルとしてはすでに成熟期にあり、これまでオンプレミスで構築・運用されていたこれらのシステムのクラウドへの移行が今後国内で増加することが予想されます。

移行先のクラウドを選定するにあたり、クラウド事業者が提示するサービス水準は重要な判断材料の一つであり、クラウド事業者が移行先として選ばれる見込みを高めるためにサービス水準を引き上げていることが推測されます。

可用性を高めるための方法

前段では可用性、稼動率、SLAについて解説しました。

はじめに述べたように、クラウド事業者はクラウド上で構築・運用されるシステムの可用性を高めるためのベストプラクティスに関する情報や、ベストプラクティスの実践をサポートするためのサービスを提供しています。以下、可用性を高めるための方法や、可用性を高めるために利用できるAWSのサービスを紹介します。上記の図を参考に読み進めてください。