COLUMN
AWSが提供するデータベースの種類をそれぞれのメリット・活用例とともに解説
クラウドに関する疑問・質問などございましたら、こちらよりお気軽にご相談ください。
AWSが提供するデータベースは、リレーショナルデータベースを始めNoSQLなど豊富な種類を展開しています。
用途に合わせたデータベースを構築することで、今まで活用しきれていなかったデータの活用やコスト削減、処理速度の向上が見込め、顧客へのサービスの質を高められます。しかしデータベースの種類が多いと、どのデータベースが自社にとって最適なのか分からない方もいるでしょう。
そこで今回は、AWSが提供するデータベースの種類の概要を紹介します。メリットや活用例も紹介しているので、AWSが提供するデータベースを検討している方は、ぜひ参考にしてください。
目次:
クラウドに関する疑問・質問などございましたら、こちらよりお気軽にご相談ください。
1.データベースとは?
データベースとは、コンピューターの中の膨大なデータを整理して保存したものを指します。データの種類に制限はなく、文書はもちろんファイルや画像など形式が違う場合も保存可能です。
データベースはデータを整理して保存する格納庫ですが、データベースだけでは、データの仕訳はできません。データベース管理システム(DBMS)と呼ばれるソフトウェアを利用して、データの取得や仕訳・格納がおこなわれています。
データベースは企業の規模を問わず活用されており、企業の顧客や社内情報を格納するなどの役割があるため、重要なシステムといえるでしょう。たとえば顧客の年代別に検索をかけたり、名前で検索をかけたりすればすぐに一覧を引き出せます。手作業でデータを探すと何時間もかかる作業であっても、データベースを活用していれば数秒で確認できるため、非常に大切なシステムです。
2.データベースの種類と特徴
データベースは大きく分けて4種類に分類でき、種類によって構造はもちろん、格納する方式が異なります。この章では、データベースの特徴や強み・弱みを解説します。
クラウドの導入をご検討の方はNTT東日本にお気軽にご相談ください。
2-1.階層型データベース
階層型データベースは、ツリー型にデータを関連付けして構成されています。1970年代から使用されており、初期のデータベースともいえるでしょう。
上層から下層へ下がるにつれ、枝分かれのように1対2や1対3と広がる構造になってデータが整理・格納されています。この上層を親レコード、下層を子レコードと呼びます。
階層型データベースの強みは、データ検索が早い点とデータの整合性を保ちやすい点です。ほかのデータベースの種類に比べ、シンプルな構造なのもメリットでしょう。
一方で弱みは、データが冗長化しやすい点と、階層構造について知見がないとうまく活用できない点です。たとえば、ひとつの子レコードが複数の親レコードと関係する場合、子レコードひとつに対し、親レコード2つの紐づけができません。そのためそれぞれの親レコードに同じ情報を子レコードとして登録しなければならず、入力の手間や柔軟性に欠ける点があるといえます。
2-2.ネットワークデータベース
ネットワークデータベースは、網の目のようにデータを関連付けして構成されています。子レコードが複数の親レコードと関係した場合、複数の親レコードと結びつけられるのが特徴です。したがって、重複してデータを登録する必要がありません。階層型データベースのデメリットを解消したデータベースといえるでしょう。
データを重複することなく有効に整理ができるため、複雑なデータだとしてもしっかり整理・格納できる点がメリットです。
一方デメリットとしては、プログラムがデータ構造の影響下にあるため、プログラムに関して知見がないと活用できません。
2-3.リレーショナルデータベース(RDBMS)
リレーショナルデータベースは、ExcelやGoogle スプレッドシートのようにテーブルで構成されていて、定番となっているデータベースです。
データレコードが行、フィールドが列で構成されており、視覚的にもわかりやすいのが特徴です。またテーブルは単品で使用も可能ですが、複数枚のテーブルも利用できるため、複雑な検索も実現できます。関連があるテーブルをつないで新たなデータテーブルを作成できるので、幅広いシーンで活用できるでしょう。
リレーショナルデータベースのいちばんの強みは、SQLでデータの操作が可能な点です。SQLは情報を処理する際に使用されるプログラミング言語で、データベースのなかでも主流のプログラミング用語です。すでにSQLの知識があれば、比較的すぐに導入しやすいといったメリットがあります。
一方でデメリットは、リレーショナルデータベースを拡張したい場合、知識はもちろん時間と労力が必要となる点です。処理能力についても、テーブルが複雑化しデータが膨大になれば、その分処理能力は遅くなります。
テーブル形式での格納のため、データ種類には制限があるのも弱みといえるでしょう。昨今は音声や画像データも主流になりつつありますが、リレーショナルデータベースはテキストデータを保存するデータベースであり、画像データや音声データを保存することは望ましくないのが現状です。
2-4.NoSQLデータベース
NoSQLデータベースは、リレーショナルデータベース以外のデータベースを指す総称です。具体的には、表以外の方法でデータを格納しているデータベースはNoSQLデータベースということです。
最近はアプリケーションやAI・ビッグデータなど、さまざまな用途で注目を浴びています。
NoSQLデータベースは、処理能力が早く拡張性が高いという特徴があり、先述したリレーショナルデータベースのデメリットを改善できているといえるでしょう。一方、複雑な処理を使えずSQLが使用できないといった弱みもあります。
NoSQLデータベースはおもに7種類あります。この章では、型ごとの特徴や強み・弱みについて解説していくので、自社に合うのはどの型かを検討してみてください。
2-4-1.キーバリュー型
キーバリュー型は識別情報をキーとし、内容をバリューとしてワンセットでデータを管理しています。シンプルな構造であるため、容量を多く必要とせず処理速度が早いのが特徴です。また内容であるバリューが増えると、キーがセットとして割り当てられます。データごとに内容は異なっても問題ありませんが、キーバリューのセットとして、キーは一つの意味しか持てません。
キーバリュー型のいちばんの強みは処理速度が早い点です。処理速度が早ければその分検索も早くなります。そのため一定の処理速度が求められるゲームや広告の技術などにも使用されています。
一方で、弱みはキーバリューの結合ができない点です。キーとバリューのワンセットしかできないため、複雑な検索処理には向いていないといえるでしょう。
2-4-2.ドキュメント型
ドキュメント型は、XMLやJSONのようにデータ形式で格納できる構成です。階層構造がなく、ひとつのキーにドキュメントが紐づく形で格納されています。ドキュメント型はおもに、コンテンツ管理プログラムやカタログなどに活用されています。
ドキュメント型の強みは、複雑なデータが扱えるだけでなくデータ量も多く格納できる点です。ドキュメントとしてそのまま複雑なデータを格納できるので使いやすいでしょう。そのほか、インデックスやクエリの作成も簡単です。
ドキュメント型の弱みは、SQLが使用できない点と更新しにくい点です。SQLが使えないと使い勝手が悪い、と感じる方にはおすすめできません。またドキュメント型の提供サービスによっては、ドキュメント型はトランザクションがないことから、ドキュメントをまとめて同じ定義で更新ができないといった点もデメリットといえるでしょう。
2-4-3.グラフ型
グラフ型というと、折れ線グラフや円グラフ・棒グラフをイメージする方もいるでしょう。しかしデータベースのグラフ型は、ノード・エッジー・プロパティの3つを使用してグラフ化した構造です。
日本よりも海外で人気があるデータベースで、ターゲットマーケティング・不正感知などに活用されています。他にも、SNSによくある「知り合いかも」の機能や、ネットショッピングなどの「あなたにおすすめ」などのトピックに使われています。
グラフ型はノード間の関係性を検索・管理するのに特化しており、メリットは構造がシンプルな分データが見やすく活用しやすい、処理速度が早いという点です。
一方グラフ型の弱みは、全体像を見られない点や開発ツールが必要な点です。グラフ描画ツールなどのグラフ型専用のツールが必要なので、導入時は開発ツールの検討も必要になります。またSQLは使用されておらず、CypherやGremlinが使用できます。
2-4-4.カラム型
カラム型は、列を軸にデータを格納する構成から「列指向データベース」とも呼ばれていて、おもに膨大なデータ処理やデータ分析ログなどに使用されています。データ分析やデータ集計に特化したデータベースで、一部のデータウェアハウスではカラム型を使用しているケースもあります。
カラム型の長所は、検索処理や分析に強い点です。そのほか、データを圧縮できるため膨大な量を保管できます。
カラム型のデメリットは、列ではなく行の追加や更新がしにくい点です。行を追加するとカラムにもひとつずつ設定が必要なため時間を要します。
2-4-5.インメモリ型
インメモリ型は、RAM(メインメモリ)にデータを保存できる構成です。メモリ向けに最適化されているため、処理能力が高く速度が早いのが特徴です。通常、RAMのデータは電源を落とすとデータが消えます。しかし、インメモリ型ではリスクを抑えられるよう、ログやスナップショットを用いて保存し、データの消滅に備えています。
一方でデメリットとしては、容量が限られていたり、メモリを大きくする際にコストがかかったりすることです。もちろんデータの消失も100%の保証ではないため、注意が必要です。
2-4-6.時系列型
時系列型は、分秒単位の膨大な時系列データを保存し続けられるデータベースです。特に金融取引や気温、時間を記録する必要のあるアプリケーションなどで活用されています。時系列を書き込み続ける以外に分析機能も備わっており、10分前と現在の比較なども書き込み続けながら分析が可能です。
時系列型は秒単位で高速な書き込みが可能なうえ、大量のデータ保存ができます。ただ時系列に特化しているため、用途が異なる場合は使用できません。
2-4-7.台帳型
台帳型は、保存したデータに対し変更や削除ができない仕様のデータベースです。データが改ざんされていないか、暗号技術によって常に監視されています。
変更してはならないデータに利用される場合がほとんどで、電子カルテや契約書などの保存に活用されます。台帳型を活用すれば改ざんされていない証拠にもなり、重要なデータを保存するには最適です。
ただし、データを変更する可能性があれば台帳型は使用できないため、利用用途が限定されています。
3.リレーショナルデータベースとNoSQLデータベースの違い
リレーショナルデータベースとNoSQLデータベースは、仕組みも含め大きく異なります。
一般的にNoSQLは、リレーショナルデータベースでできないことやデメリットを解決するために作られたデータベースです。そのためNoSQLは、自由度が高く特化したデータの格納が可能です。
おもな違いを下記の表で確認しましょう。
リレーショナル データベース |
NoSQLデータベース | |
---|---|---|
一貫性 | トランザクション処理をする | 限定的 |
言語 | SQL | データベースによって異なる |
おもな性能の上げ方 | スケールアップ | スケールアウト |
処理速度 | データ量によっては遅い | 種類によるが早い |
おすすめの利用ケース | 複雑なデータを取り扱う場合 |
|
一貫性をもった処理はトランザクション処理をするリレーショナルデータベースのほうが得意で、NoSQLは限定的です。
性能を上げる方法も異なります。リレーショナルデータベースの場合、データベースを大きくするスケールアップは一般的なため、性能を上げるにも上限があります。一方NoSQLはスケールアウトができるため、複数のデータベースを繋げることが可能です。
リレーショナルデータベースの場合は複雑なデータの取り扱いができますが、その分データ量が増えれば処理速度が落ちます。NoSQLデータベースはシンプルな構成のため複雑なデータの取り扱いはできませんが、処理速度が早く膨大なデータを取り扱うことはできます。
それぞれ違いがあるため、重きをおくメリットを考え最適なデータベースを選びましょう。
4.AWSが提供するデータベースの種類とメリット・活用例
AWSではデータベースを豊富に取り扱っています。この章ではAWSが提供するデータベースの種類とメリット、活用例をサービスごとに紹介します。データベースをどのように活用するのかイメージしながら、検討材料としてください。
AWSの導入をご検討の方はNTT東日本にお気軽にご相談ください。
4-1.リレーショナルデータベース
AWSではリレーショナルデータベースのサービスを3種類展開しています。用途が異なるため、特徴や活用例なども合わせて解説します。
4-1-1.Amazon Relational Database Service(RDS)
Amazon Relational Database Serviceは、インストールすることなくデータサービスを構築できるフルマネージドサービスです。
通常データベースを構築する際は、サーバーの準備やインストール・設定が必要ですが、Amazon Relational Database Serviceなら、インストールはもちろんパッチの適用やバックアップも自動で行ってくれます。拡張したい場合もワンクリックで完了できるので、構築の手間を省いてすぐに活用可能です。
Amazon Relational Database Serviceは、以下6つのデータベースエンジンから選べます。
- My SQL
- MariaDB
- Amazon Aurora
- Microsoft SQL server
- Postgre SQL
- ORACLE
そのほか、マルチAZに対応しているため可用性が高く、データ暗号化もしているためセキュリティも高いです。
活用例として、アプリケーションや顧客リスト・商品データの作成などがあげられます。
4-1-2.Amazon Aurora
Amazon Auroraは、MySQLと PostgreSQLに互換性があるマネージド型のリレーショナルデータベースエンジンです。マルチAZで、3つのAZを使用し6つのストレージにデータがコピーされています。一部のAZで障害が起きたとしても他のデータは無事であるため、耐障害性も優れているのが特徴です。
最大15台までスケールアウトできるので冗長性があり、パフォーマンスも兼ね備えています。OSSベースを利用しており、消費したデータ分のコストのみ課金されるため、商用の10分の1の価格で運用が可能です。
活用例としては、インターネットバンキングなどのオンラインサービスやアプリケーションゲーム、オンラインゲームなどが挙げられます。
4-1-3.Amazon Redshift
Amazon Redshiftは、分析用のデータウェアハウスサービスです。分析に必要なデータを一気に書き込み、読み出して分析するために使用されます。複雑な分析クエリにも対応しており、ログ分析や機械学習などに活用されています。
マネージド型のため、セットアップやパッチ適用・バックアップなどが全て自動で行われ、社内エンジニアの手間を省ける点にも注目です。
4-2.キーバリュー型
AWSでは、キーバリュー型のサービスも2つ展開しています。特徴が異なるため、詳しく見ていきましょう。
4-2-1.Amazon DynamoDB
Amazon DynamoDBは、サーバーレスで使用できるフルマネージド型のキーバリューデータベースです。フルマネージド型の特徴として、バックアップやスケールアップを自動で行うこと、期限切れの内容を自動的に削除することが可能です。
データベースは複数のリージョンにまたがって使用でき、セキュリティもデータ暗号化されています。最大の特徴は、無制限のスループットとストレージにより、1桁ミリ秒単位の読み書きも安定して行えるパフォーマンスであることです。またキーバリュー型ではありますが、ドキュメントデータも保存できるので柔軟性も高いといえるでしょう。
活用例は、Amazonのショッピングサイトをはじめ、通知サービスやバックエンド処理、ゲームや広告技術などが挙げられます。
4-2-2.Amazon Keyspaces(Apache Cassandra用)
Amazon Keyspacesは、OSSデータベースのApache Cassandraと互換性があるマネージド型のデータベースです。Apache Cassandraで使用されるクエリ言語APIコードやドライバー、開発者ツールをそのままAWS上で使えます。そのため現在Apache Cassandraを使用していて、AWS上で今後も使用したいときに便利なサービスです。
マネージド型のため、パッチ適用や管理、ソフトウェアのインストール運用、保守も全て不要なので、構築に専念できます。また、サーバーレスで使用した容量のみが課金されるため、コストパフォーマンスも良いサービスです。
1秒あたり数千のリクエストであっても対応できる無制限スループット・ストレージを使用しており、低レイテンシが必要なアプリや取引監視などに活用されています。3箇所のAZでデータが複製され可用性も高く、テーブルデータは継続バックアップされる仕様となっています。
4-3.ドキュメント型
複雑なデータを取り扱いたいときに便利なドキュメント型ですが、AmazonでもAmazon DocumentDBというサービスを取り扱っています。特徴を見ていきましょう。
4-3-1.Amazon DocumentDB
Amazon DocumentDBは、MongoDBと互換性があるドキュメント型データベースです。最大の特徴は高速パフォーマンスです。ペタバイト級のデータを利用できるため、1秒あたり数百万ものドキュメントデータを読み取れます。
また耐障害性として、3つのAZにまたがって6つのレプリカを作成します。そのため万が一障害が起きたとしても、書き込みも読み込みも問題なく継続可能です。
ショッピングサイトやPOS・アプリケーションなどに活用されるサービスです。
4-4.グラフ型
不正検知などで活用されるグラフ型ですが、Amazon Neptuneというサービスがあります。概要を説明します。
4-4-1.Amazon Neptune
Amazon Neptuneは、フルマネージド型のグラフデータベースです。数十億のリレーションシップを扱えるグラフデータに特化したサービスで、バックアップ管理は自動化されています。またリージョン内では3つのAZにまたがって、データの耐久性を確保できます。
GremlinやSPARQLにも対応しているため、グラフを活用している方にとっては使いやすいサービスといえるでしょう。
ターゲティングや不正パターンの検出・SNSなどに役立てられます。
4-5.インメモリ型
処理速度が早いデータベースのインメモリ型ですが、AmazonではAmazon ElastiCacheが提供されています。サービス概要をみていきましょう。
4-5-1.Amazon ElastiCache
Amazon ElastiCacheは、フルマネージドのインメモリ型キャッシュサービスです。ハードウェアもソフトウェアも不要なうえ、スケーラブルなのが特徴として挙げられます。
前章にてインメモリ型の場合、容量が足りなくなる可能性をデメリットとして挙げましたが、Amazon ElastiCacheなら982TiBまで対応可能です。バックアップやパッチの適用、設定は不要で、RedisやMemcachedと互換性があります。
1秒あたり数億回もの操作が可能なため、リアルタイム分析や機械学習などに活用されています。
4-6.時系列型
時系列に特化したデータベースは、Amazonでも提供されています。ここでは時系列型のAmazon Timestreamを紹介します。
4-6-1.Amazon Timestream
Amazon Timestreamは、時系列を記録するのに特化したサーバーレスの時系列型データベースです。
リレーショナルデータベースと比べると1,000倍も処理速度が早く、コストは90%削減できます。コストパフォーマンスが良い理由は、使用した分だけの従量課金制になっているためです。パフォーマンスを最適化するために、自動的にスケールアップやスケールダウンを行います。
IoTやDevOps・分析などのアプリケーションに活用されています。
4-7.台帳型
データが改ざんされないために使用される台帳型ですが、AmazonでもAmazon Quantum Ledger Database (QLDB)をサービス展開しています。特徴やメリットを見ていきましょう。
4-7-1.Amazon Quantum Ledger Database(QLDB)
Amazon Quantum Ledger Database(QLDB)は、フルマネージドの台帳型データベースです。変更内容は順序に沿って記録され、削除や変更ができないようになっています。
また、データの問い合わせをする際、SQL APIのように慣れているデータベース機能が使用できるため使いやすいサービスといえます。中央集権的な台帳サービスを探しているならAmazon Quantum Ledger Database(QLDB)が最適でしょう。
確認や検証時は暗号化ハッシュを使用するため、安全な出力ファイルを生成できるのもポイントです。基本的には金融関係や保険会社などで活用されています。
5.AWSでのデータベース構築ならぜひNTT東日本にご相談ください
NTT東日本ではクラウド導入・運用サービスを提供しています。現状の課題を把握したうえで最適なサービスを紹介し、導入運用・保守まで支援することが可能です。
紹介したとおり、AWSにはデータベースの種類が多様にあります。その他のAWSサービスも適材適所で使用しなければ、最高のパフォーマンスを得られません。どのようなデータベースを構築すればよいのか、自社の用途ではどのサービスが最適なのかが分からない場合もあるでしょう。
150社以上の実績を持つNTT東日本では、AWSのサービスを熟知したプロ集団が中立的に提案をしますので、気になる方は以下のページからご相談ください。
AWSでのデータベースについてまとめ
AWSのデータベースは、リレーショナルデータベースだけでなくNoSQLまで豊富な種類を提供しています。最適なデータベースを活用することで、業務の効率化はもちろん、顧客への快適なサービス提供が実現できます。
複雑なデータの取り扱いを検討しているのならリレーショナルデータベースを、自由度が高く速度を重視しているのであればNoSQLの中から最適なものを選びましょう。
またデータベースと他のAWSサービスをうまく組み合わせることで、より円滑にデータの活用ができます。NTT東日本では、AWSデータベースの導入・運用・保守まで支援が可能です。興味がある方はぜひ以下のページをご覧ください。
Amazon Web Services(AWS)および記載するすべてのAmazonのサービス名は、米国その他の諸国における、Amazon.com, Inc.またはその関連会社の商標です。
無料ダウンロード
自社のクラウド導入に必要な知識、ポイントを
この1冊に総まとめ!
あなたはクラウド化の
何の情報を知りたいですか?
- そもそも自社は本当にクラウド化すべき?オンプレとクラウドの違いは?
- 【AWS・Azure・Google Cloud】
どれが自社に最もマッチするの? - 情シス担当者の負荷を減らしてコストを軽減するクラウド化のポイントは?
- 自社のクラウド導入を実現するまでの具体的な流れ・検討する順番は?
初めての自社クラウド導入、
わからないことが多く困ってしまいますよね。
NTT東日本では
そんなあなたにクラウド導入に必要な情報を
1冊の冊子にまとめました!
クラウド化のポイントを知らずに導入を進めると、以下のような事になってしまうことも・・・
- システムインフラの維持にかかるトータルコストがあまり変わらない。。
- 情シス担当者の負担が減らない。。
- セキュリティ性・速度など、クラウド期待する効果を十分に享受できない。。
理想的なクラウド環境を実現するためにも、
最低限の4つのポイントを
抑えておきたいところです。
-
そもそも”クラウド化”とは?
その本質的なメリット・デメリット - 自社にとって
最適なクラウド環境構築のポイント - コストを抑えるための
具体的なコツ - 既存環境からスムーズにクラウド化を
実現するためのロードマップ
など、この1冊だけで自社のクラウド化のポイントが簡単に理解できます。
またNTT東日本でクラウド化を実現し
問題を解決した事例や、
導入サポートサービスも掲載しているので、
ぜひダウンロードして読んでみてください。
面倒でお困りのあなたへ
クラウドのご相談できます!
無料オンライン相談窓口
NTT東日本なら貴社のクラウド導入設計から
ネットワーク環境構築・セキュリティ・運用まで
”ワンストップ支援”が可能です!
NTT東日本が選ばれる5つの理由
- クラウド導入を
0からワンストップでサポート可能! - 全体最適におけるコスト効率・業務効率の改善を
中立的にご提案 - クラウド環境に問題がないか、
第3者目線でチェック
してもらいたい - 安心の24時間・365日の対応・保守
- NTT東日本が保有する豊富なサービスの組み合わせで
”課題解決”と”コスト軽減”を両立
特に以下に当てはまる方はお気軽に
ご相談ください。
- さまざまな種類やクラウド提供事業者があってどれが自社に適切かわからない
- オンプレミスのままがよいのか、クラウド移行すべきなのか、迷っている
- オンプレミスとクラウド移行した際のコスト比較を行いたい
- AWSとAzure、どちらのクラウドが自社に適切かわからない
- クラウド環境に問題がないか、第3者目線でチェックしてもらいたい
- クラウド利用中、ネットワークの速度が遅くて業務に支障がでている
クラウドを熟知するプロが、クラウド導入におけるお客さまのLAN 環境や接続ネットワーク、
クラウドサービスまでトータルにお客さまのお悩みや課題の解決をサポートします。
相談無料!プロが中立的にアドバイスいたします
クラウド・AWS・Azureでお困りの方はお気軽にご相談ください。