ビッグデータ解析や障害からの復旧のためのデータ保管をサポートするAWS Storage Gateway

企業のIT利用によって、日々たくさんのデータが生成されています。蓄積されたデータを解析したり、障害発生時にシステムを復旧させたりするためにも、適切なデータ保管の仕組みが必要です。「AWS Storage Gateway」は、オンプレミス環境からAWSのクラウドストレージサービスを使ったデータ連携ができる仮想アプライアンスです。ここでは、その特徴と利用シーンについて紹介します。

標準的なストレージを扱うようにクラウドとデータ連携できるAWS Storage Gateway

ITを活用する企業にとって、データは重要な資産です。さまざまなシステムによって生成されるデータやログファイル、従業員が作成するファイルなど、企業が管理するデータは増加する傾向にあります。蓄積した大量のデータを解析して事業に活かしたり、何らかの障害発生時に速やかにシステムを復旧したりするために、適切なデータ保管の仕組みを構築する必要があります。

オンプレミス環境では、物理的なストレージ、テープなどを使ってデータを保管していると思います。物理的であるがゆえに、導入においては格納容量について入念に計画をする必要があります。また、データの可用性を考慮し、設置場所を分散するなどの配慮も必要となるでしょう。

一方、クラウドサービスであるAWSには「Amazon S3」や「Amazon S3 Glacier」など、さまざまなストレージサービスがあります。これらは、格納容量を気にせず無制限に保存できる拡張性を持ち、データは複数のデータセンターに自動複製され、データ転送はすべてSSL暗号化してやり取りされるため、堅牢性・情報セキュリティにおいても優れています。

オンプレミス環境から、AWSのストレージへバックアップをしたり、データ連携をしたりできる仮想アプライアンスサービスが、AWS Storage Gatewayです。データはAmazon S3やAmazon S3 Glacierのオブジェクトとして保管されるのですが、標準的なストレージプロトコルを利用するので、オンプレミスのシステム側でデータに手を加える必要はありません。

オンプレミス環境などからAWSのストレージサービスを活用できるAWS Storage Gateway

ファイル・ボリューム・テープのゲートウェイでさまざまな用途に対応

AWS Storage Gatewayの用途は、ビッグデータ解析処理のデータ保管場所、データ移行のための保管場所、災害からの普及に備えるバックアップ、オンプレミスのシステムからシームレスにAWSクラウドストレージを活用するなどさまざまです。これら実現するために、AWS Storage Gatewayには、「ファイルゲートウェイ」「ボリュームゲートウェイ」「テープゲートウェイ」の3つのゲートウェイタイプが用意されています。それぞれの特徴や利用シーンを見てみましょう。

ファイルをAWS上で活用できるファイルゲートウェイ

分散ファイルシステムおよびそのプロトコルであるNFS(Network File System)インターフェースにより、オンプレミスや仮想サーバ上のファイルデータをAmazon S3上のオブジェクトとして格納できるファイルストレージです。

S3とのデータのやり取りが遅延しないよう、ローカルキャッシュを利用します。AWS Storage Gatewayにファイルのリクエストがあった場合、まずはキャッシュを参照して応答します。目当てのファイルがキャッシュになければS3のオブジェクトを参照して対象のファイルを取得して応答します。なお、ファイルゲートウェイが接続するクライアントのIP アドレスの指定も可能です。

NFSプロトコルを使うため、既存のシステム側に改修の必要はない

オンプレミスからAWSへの災害時復旧を目的としたボリュームゲートウェイ 〜Gateway-Stored Volumes

オンプレミス環境のディスクデータをSnapshotとしてAmazon S3上に取得し、災害発生時にAWS側で復旧をするという用途に活用できます。インターフェースはSCSIプロトコルをTCP/IP上で使用する規格、iSCSI (Internet Small Computer System Interface)を使います。Snapshotは手動でもスケジューリングしても取得でき、差分のみの取得も可能です。ひとつのAWS Storage Gatewayにつき最大32個のボリュームストレージを作成できます。

プライマリデータはオンプレミスにあり、有事にAWS側でリカバリできるようにする仕組み

大容量ストレージを実現するボリュームゲートウェイ 〜Gateway-Cached Volumes

iSCSIプロトコルにより、S3をデータ保管領域とした大容量かつ堅牢性の高いボリュームとして活用できます。オンプレミスの仮想化環境および、AWSのEC2インスタンスからも利用でき、それぞれのリストアにも対応します。

プライマリデータはAWSにあり、アクセス頻度の高いデータはローカルキャッシュに保持

物理テープライブラリの代替として利用できるテープゲートウェイ

iSCSIによる仮想テープドライブと仮想メディアチェンジャーにより、物理テープライブラリ装置の代わりに仮想のテープライブラリを提供できます。VTL(Virtual Tape Library)対応のバックアップソフトウェアを利用することで、AWS Storage Gatewayを経由して、S3およびGlacierにバックアップデータを格納します。オンプレミス環境からもEC2インスタンス環境からもテープライブラリを作成できます。

オンラインテープはS3上に格納されます。バックアップソフトウェアなどの操作によって、仮想テープを取り出して、アーカイブをより安価なGlacier(Virtual Tape Shelf)に移動できます。アーカイブに格納するテープの本数、容量に制限はありません。

テープライブラリを仮想化。AWSなら3ヶ所以上のデータセンターに保管される

AWS Storage Gatewayによるデータ保管の階層化のメリットと注意点

AWS Storage Gatewayを使って、ローカルキャッシュ、S3、Glacierと複数のストレージサービスを組み合わせることで、データ保管を階層化し、より最適なデータ保管やバックアップを実現できます。たとえば、アクセス頻度の高いデータはキャッシュに保持し、利用頻度の低いオブジェクトはより価格の安いストレージに保管。ボリュームのSnapshotは変更があったブロックのみ転送して圧縮保管するなどの構成も考えられます。

データの利用頻度に応じて保管場所や保管方法を設定して利便性とコスト効率をアップ

複数のストレージサービスを使い分けて階層化した際に注意する点としては、キャッシュの性能です。キャッシュに保持していないデータは、バックエンドのサービスを参照することになりますので、回線帯域などの影響を受けます。あくまでもアーカイブを主目的としていますので、不特定多数がオンラインを通じて頻繁に参照したり、同一ファイルへ複数のクライアントからアクセスしたりといった用途には向いていません。

また、障害が発生してキャッシュの整合性が失われた場合など、復旧までの間に長時間のパフォーマンス劣化が発生する可能性もあります。

まとめ

AWSのストレージサービスであるAmazon S3やAmazon S3 Glacierは、容量を気にすることなく利用でき、なおかつ高い耐久性と情報セキュリティを備えています。これらのストレージサービスを、組織が利用するファイルやデータの保管先に指定できるのがAWS Storage Gatewayです。標準的なストレージプロトコルを利用しているため、組織内の既存のシステムに手を加えることなく、ビッグデータ解析のファイル保管や障害復旧のためのバックアップに利用できます。

ローカルキャッシュを備えているため、よく使うファイルにはすぐアクセスでき、安価なストレージサービスにはあまり使わないファイルをアーカイブしておくなど、階層化したデータ保管により、利便性とコスト効率を最適化できます。AWS Storage Gatewayを利用することで、保存容量を気にせず、かつコストを抑えたデータ保管運用を目指しましょう。

移行準備段階で知っておくべきAmazon Web Servicesの
サービスを学び、具体的にクラウド検討を考える!

Amazon Web Services(AWS)、Microsoft Azureの
導入支援サービスのご相談、お問い合わせをお待ちしております。

ページ上部へ戻る