Azure Synapse Analyticsとは?データウェアハウスと分析を統合したサービスの特徴を解説

企業経営での意思決定に欠かせないデータ蓄積と分析。BIシステムに利用するデータの管理から、インサイトを得るためのデータ分析までを1つのプラットフォームに統合できれば効率的です。本コラムでは、DWH(データウェアハウス)とデータ分析を統合したプラットフォームである、Microsoftの「Azure Synapse Analytics 」とはそもそもどのようなサービスなのか、その特徴を解説します。

Azure Synapse Analyticsとは

Azure Synapse Analyticsとは、DWH(データウェアハウス)とビッグデータ解析を1つにまとめた分析プラットフォームです。「Azure SQL Data Warehouse」の後継サービスに当たります。
例えばこれまで、BIツールの利用やDWHの構築作業では、それぞれ独立したサービスを利用するため、手間がかかっていました。また、企業内で利用しているシステムが独立したものであった場合、データ分析のために各システムを連携させるという作業も大きな障壁となっていたのです。このような「手間」と「障壁」を省き、1つのプラットフォームとして提供されるのが「Azure Synapse Analytics」です。
収集されたデータがETL(抽出・変換・加工・書き出し)によって処理され、蓄積されたデータがAzure Synapse Analyticsへ結合されます。また、Azure Synapse Analyticsに機械学習の「Azure Machine Learning」とBIツールの「Power BI」を連携させれば、データ管理や分析、データサイエンスまでを直感的で使いやすいプラットフォームとして扱えるのです。
これにより、データエンジニア・データサイエンティスト・IT管理者・ビジネスアナリスト・データベース管理者の作業が、1つのプラットフォームで統合できることもメリットの1つに挙げられます。Azure Synapse Analyticsとは、あらゆるデータと結合し、さらにMLとBIツールを連携させて利用できるサービスといえます。

Azure Synapse Analyticsの特徴

それでは、Azure Synapse Analyticsの特徴を1つずつ見ていきましょう。

無限のスケール

Azure Synapse Analyticsでは、企業内の部署単位で収集したデータに加え、ビッグデータも含めたすべてのデータを無限のスケールで分析できます。通常、DWHとビッグデータが分散している状態を1つに統合することは困難でしょう。それは各システムによって動作が異なるからです。しかし、Azure Synapse Analyticsは、両者をシームレスに結合できるため、全データからの分析情報を取得できるのです。また、そのデータ容量はペタバイト規模で、リレーショナルおよび非リレーショナル双方のデータで大規模データへのクエリを発行できます。

使い慣れた言語の使用が可能

新しいサービスを利用するときに気になるのが、使用できる言語です。既存で利用している言語が使えなければ、新たにチューニングが必要となるでしょう。しかしAzure Synapse Analyticsでは、エンジニアが使い慣れた言語を使用できます。
使用できる言語には以下のようなものがあります。

  • T-SQL
  • Python
  • Scala
  • Spark SQL
  • .NET

などです。

BIと機械学習の統合

BIツールと機械学習(ML)は、そもそも個別のシステムです。しかし、Azure Synapse Analyticsならば、BIツールとMLを連携できます。DWHやビッグデータが結合したAzure Synapse Analyticsならば、大規模なデータから分析情報を発見しインサイトを得られます。また、Azureの「Power BI」と「Azure Machine Learning」を連携することで、BIや機械学習の開発時間の大幅な削減につながります。
さらにDynamics365やMicrosoft365、Open Data InitiativeなどのSaaSサービスに連携すれば、それぞれのツールへのスムーズなデータ適用を実現できます。

統合されたワークスペースとビジュアル環境

Azure Synapse Analyticsでは、統合されたワークスペースとビジュアル環境である「Azure Synapse Studio」を提供しています。Azure Synapse Studioは統合されたワークスペースで、データ準備・管理、データ ウェアハウスやビッグ データといったタスクを扱えます。
例えばデータエンジニアは、コーディングなしで管理画面をビジュアル環境で使用できます。データサイエンティストは、PoC(概念実証)を短時間で構築が可能です。データベース管理者はクエリの最適化を自動化できるというメリットがあります。また、ビジネスアナリストは、連携されたPower BIを使用して数分でダッシュボードを構築可能です。
このように、エンジニアやアナリストなどの各分野のプロフェッショナルは、統一されたワークスペースで作業することで効率的な分析が行えます。

リアルタイムでの分析情報取得

Azure Synapse Analyticsは、Azure Cosmos DB のAzure Synapse Linkを利用すれば、運用中のデータストアからリアルタイムで分析情報を取得できます。
そもそもAzure Synapse Linkは、HTAP(分析処理)機能を提供するサービスです。これを利用することにより、AzureデータベースとAzure Synapseの間でETLパイプラインなどの複雑な処理が必要なくなり、ライブデータも分析可能となります。
このようにAzure Synapse Analyticsは、BIツールやデータベースはもちろんその他の外部サービスと連携することで、効率的な分析環境を構築できることが特徴です。

自動化されたセキュリティとプライバシー機能

Azure Synapse Analyticsは、セキュリティ面でも高度なセキュリティとプライバシー機能があります。
例えば、Azure Synapseと連携する接続方式(ファブリック)は、サービス脅威の検出やデータの暗号化が自動化されています。ユーザーの実行コンテキスト(実行制御情報)は列レベルのセキュリティによるアクセス制御が可能で、その実行コンテキストを利用してデータベースのテーブルへのアクセスを行レベルのセキュリティで制御します。また、動的データマスキングにより、機密データのリアルタイムアクセスの安全を自動的に保護します。

まとめ

企業内の各部署が持つデータを、統合して分析することには手間がかかります。異なるシステムを連携しなければならないという手間や障壁は、経営の意思決定をおこなうための分析業務を困難なものにしていたのです。
しかし、あらゆるデータやBIツール、MLを連携できる統合プラットフォーム「Azure Synapse Analytics」は、分析業務を効率化することに役立ちます。各専門家がAzure Synapse Analyticsを利用することで、データをリアルタイムに共有しながら、必要な環境を同じプラットフォーム上で構築でき、分析作業の効率化と高速化が実現できるのです。
データや分析ツールが分散されていることで手間を感じているならば、データやツールを統合して利用できるAzure Synapse Analyticsを導入するのも1つの手段となるでしょう。

ネットワークからクラウドまでトータルサポート!!
NTT東日本のクラウド導入・運用サービスを確認してください!!

Amazon Web Services(AWS)、Microsoft Azureの
導入支援サービスのご相談、お問い合わせをお待ちしております。

ページ上部へ戻る