COLUMN
Amazon SageMaker AIで機械学習を始めてみた
みなさん、こんにちは。クラウドエンジニアの鮎澤です。本コラムではAWSが提供する機械学習サービスであるAmazon SageMaker AIのAmazon SageMaker Canvasを使って機械学習を始めてみました。そもそも機械学習とは何か、Amazon SageMaker AIではどのようなサービスを提供しているのかについても解説していますので、最後までお読みいただけると嬉しいです。
1. 機械学習とは?
機械学習は、コンピュータが人間のように「学習」して賢くなっていくデータ解析技術です。従来のプログラミングでは、人間がすべての規則を細かく指示する必要がありましたが、機械学習では大量のデータを読み込ませることで、コンピュータ自身がデータ内のパターンを見つけ出し、判断できるようになります。
例えば、数多くの猫の写真を学習することで「これは猫である」と認識できるようになり、また過去の気象データから天気を予測することも可能になります。私たちの日常生活においても、スマートフォンの顔認証、音声アシスタント、文字認識など、さまざまな場面で機械学習が活用されています。
2. Amazon SageMaker AIについて
Amazon SageMaker AIは、Amazon Web Services(以下、AWS)が提供するフルマネージド型の機械学習サービスで、データの準備から前処理、モデルの開発と学習まで、幅広い機能を提供します。大規模なデータセットの効率的な加工が可能で、Jupyter NotebookベースのIDE(統合開発環境)でモデルの開発と学習を行うことができます。さらに、学習したモデルを本番環境に簡単にデプロイできる機能も備えています。
Amazon SageMaker AIの利用により、開発時間の大幅な短縮が可能です。必要なインフラストラクチャの構築や管理の手間を省くことができます。また、さまざまな機械学習フレームワークやアルゴリズムをサポートしており、多様なユースケースに対応できる柔軟性を備えています。さらに、AWSの堅牢なセキュリティ基盤を活用することで、安全なモデル開発と運用が可能です。
以下のコラムでは、Amazon SageMaker AIの概要や特徴、メリット、導入事例などを詳しく解説していますので、ぜひご覧ください。
Amazon SageMakerとは?できること・使い方をわかりやすく解説
次の章ではAmazon SageMaker AIで利用できるアプリケーションおよび統合開発環境について紹介します。
2-1. Studio
Amazon SageMaker Studioは、ウェブベースの統合開発環境を提供しています。データサイエンティストや機械学習の開発者向けに設計されており、コードの作成、モデルのトレーニング、デプロイまでの一連の開発作業を1つのウェブベースのインターフェイスで実現します。
ユーザーは、Amazon SageMaker Studioから離れることなく、データのアップロード、モデルの作成、データ分析を行うことができます。また、複数のチームメンバーが同じ環境で共同作業を行え、プロジェクトの共有や版管理も簡単です。
チーム内でシームレスに大規模な機械学習モデルを構築できることが、本サービスの特長です。
2-2. Canvas
Amazon SageMaker Canvasは、ノーコードで機械学習モデルを構築・運用できるAWSのサービスです。ウェブベースのビジュアルインターフェイスを提供しており、データサイエンティストでない一般のビジネスアナリストやビジネスユーザーでも、ドラッグ&ドロップの直感的な操作で予測モデルを作成することができます。
AWSの他のサービス(S3、Redshiftなど)との統合により、データの取り込みや結果の出力が容易です。
機械学習の専門知識がなくても利用できるため、売上予測、顧客離反の予測、在庫最適化などのビジネス課題に対して、データドリブンな意思決定を行うためのツールとして幅広く活用することができます。
2-3. RStudio
RStudioは、AWSが提供する完全マネージド型のRStudio開発環境で、データサイエンティストやR言語ユーザーがクラウド上で機械学習開発やデータ分析を効率的に行うことができ、RStudioの統合開発環境をAmazon SageMakerのインフラ上で実行し、リソースを柔軟にスケールできます。
本サービスは、プロジェクト管理機能、大規模データセット処理、AWS各種サービスとの統合を提供し、IAMとの連携で細かなアクセス制御も可能です。
開発者は計算環境のカスタマイズやRパッケージのインストールが自由に行え、モデルのトレーニングからデプロイまでを一貫した環境で実施できます。
2-4. Notebooks
Amazon SageMaker Notebooksは、フルマネージド型Jupyter Notebookインスタンスを提供しています。データサイエンティストや機械学習エンジニアは、このサービスを使用することで、コードの記述、データの分析、モデルのトレーニングとデプロイメントを1つの環境で実行することができます。
セキュリティ面では、IAMによる認証と認可、VPCでのネットワーク分離、KMSによる暗号化など、AWSの堅牢なセキュリティ機能を活用することができます。
3. 料金体系について
本章ではAmazon SageMaker AIの料金体系について紹介します。
Amazon SageMaker AIは、インスタンスタイプおよび起動時間で算出される時間課金、S3に格納しているデータサイズや格納期間などで算出される従量課金などがあります。
Amazon SageMaker AIを利用するにあたり、S3以外にもAWSサービスと連携する場合は、その料金も考慮する必要があります。
AWS無料利用枠の一部として、Amazon SageMaker AIは無料利用枠を提供しています。最初のAmazon SageMaker AIリソースを作成した最初の月から無料利用枠が開始され、最初の2か月間は月ごとに無料利用枠を利用可能です。
執筆時点(2024年12月)では、例えばAmazon SageMaker Canvasはセッション時間が月160時間まで無料利用枠で使用できます。
Amazon SageMaker AIの詳細な料金は、以下の公式ドキュメントをご覧ください。
4. Amazon SageMaker Canvasを使って機械学習を始めてみる
それではAmazon SageMaker Canvasを使って機械学習を始めてみます。
Amazon SageMaker Canvasを利用するにあたり、SageMakerドメインを設定していきます。SageMakerドメインとは機械学習の開発環境を管理するための論理的な境界を提供し、ユーザープロファイル、セキュリティ設定、共有リソースなどを管理する単位です。
AWSにログインし、Amazon SageMaker AIのコンソール画面を開きます。左側のナビゲーションペインにある管理者設定のトグルを開いて「ドメイン」をクリックします。ドメインの一覧が確認できる画面に遷移したら、「ドメインを作成」をクリックします。
設定画面でシングルユーザー向けの設定 (クイックセットアップ)か組織向けの設定を選ぶことができ、今回は学習として利用するのでシングルユーザー向けの設定 (クイックセットアップ)を選択して「設定」をクリックするとセットアップが開始されます。
2〜3分ほど待つとSageMakerドメインの準備ができました。
上記の画面で「ドメインの設定」タブから「ユーザープロファイル」タブに切り替えると、すでにデフォルトでユーザープロファイルが作成されていることを確認できました。今回はこのユーザープロファイルを使って、Amazon SageMaker Canvasを起動します。ユーザープロファイル名の右側にある「起動」のトグルを開き、「Canvas」をクリックします。
Amazon SageMaker Canvasのダッシュボードが開けたら、さっそくモデルを作成していきます。機械学習を行うためのデータについては、SageMakerドメインのクイックセットアップ時にS3バケットにサンプルデータが作成されていますのでこちらを使います。
左側のメニューにある「My Models」から「Create new Model」をクリックします。
任意の名前でモデル名を入力し、Problem typeは「Predictive analysis」を選択します。
データセットは電化製品のデータを予測分析してみたいので、トレーニングデータは「canvas-sample-retail-electronics-forecasting.csv」を選択しました。
次に予測をしたい列は「Product_category」にし、トレーニングの実行は「Quick build」を実行します。
Quick buildでトレーニングが完了すると下図の画面が表示されました。予測の影響や正確性などグラフで確認することができます。
画面上部の「Predict」で予測を行うことができ、「Batch prediction」か、「Single prediction」かを選択できます。今回は「Single prediction」を選択し、カラムに自由に数値を入力しました。数値を入力後に「Update prediction」をクリックすると予測値を確認することができます。
最後に削除のし忘れにご注意ください。特にサンプルデータはS3バケットに保存されていますので、不要な場合はこちらも削除しましょう。
5. まとめ
Amazon SageMaker AIについてご紹介しました。本コラムではAmazon SageMaker Canvasを使って機械学習を行いましたが、コーディングせずに予測分析できました。機械学習の専門知識がなくても、これから機械学習について学びたい方にお勧めのサービスだと感じました。Amazon SageMaker AIでは、Amazon SageMaker Canvas以外にも利用できるアプリケーションおよび統合開発環境を提供していますので、機械学習モデルの構築や予測分析などで活用していきましょう。
RECOMMEND
その他のコラム
無料ダウンロード
自社のクラウド導入に必要な知識、ポイントを
この1冊に総まとめ!
あなたはクラウド化の
何の情報を知りたいですか?
- そもそも自社は本当にクラウド化すべき?オンプレとクラウドの違いは?
- 【AWS・Azure・Google Cloud】
どれが自社に最もマッチするの? - 情シス担当者の負荷を減らしてコストを軽減するクラウド化のポイントは?
- 自社のクラウド導入を実現するまでの具体的な流れ・検討する順番は?
初めての自社クラウド導入、
わからないことが多く困ってしまいますよね。
NTT東日本では
そんなあなたにクラウド導入に必要な情報を
1冊の冊子にまとめました!
クラウド化のポイントを知らずに導入を進めると、以下のような事になってしまうことも・・・
- システムインフラの維持にかかるトータルコストがあまり変わらない。。
- 情シス担当者の負担が減らない。。
- セキュリティ性・速度など、クラウド期待する効果を十分に享受できない。。
理想的なクラウド環境を実現するためにも、
最低限の4つのポイントを
抑えておきたいところです。
-
そもそも”クラウド化”とは?
その本質的なメリット・デメリット - 自社にとって
最適なクラウド環境構築のポイント - コストを抑えるための
具体的なコツ - 既存環境からスムーズにクラウド化を
実現するためのロードマップ
など、この1冊だけで自社のクラウド化のポイントが簡単に理解できます。
またNTT東日本でクラウド化を実現し
問題を解決した事例や、
導入サポートサービスも掲載しているので、
ぜひダウンロードして読んでみてください。
面倒でお困りのあなたへ
クラウドのご相談できます!
無料オンライン相談窓口
NTT東日本なら貴社のクラウド導入設計から
ネットワーク環境構築・セキュリティ・運用まで
”ワンストップ支援”が可能です!
NTT東日本が選ばれる5つの理由
- クラウド導入を
0からワンストップでサポート可能! - 全体最適におけるコスト効率・業務効率の改善を
中立的にご提案 - クラウド環境に問題がないか、
第3者目線でチェック
してもらいたい - 安心の24時間・365日の対応・保守
- NTT東日本が保有する豊富なサービスの組み合わせで
”課題解決”と”コスト軽減”を両立
特に以下に当てはまる方はお気軽に
ご相談ください。
- さまざまな種類やクラウド提供事業者があってどれが自社に適切かわからない
- オンプレミスのままがよいのか、クラウド移行すべきなのか、迷っている
- オンプレミスとクラウド移行した際のコスト比較を行いたい
- AWSとAzure、どちらのクラウドが自社に適切かわからない
- クラウド環境に問題がないか、第3者目線でチェックしてもらいたい
- クラウド利用中、ネットワークの速度が遅くて業務に支障がでている
クラウドを熟知するプロが、クラウド導入におけるお客さまのLAN 環境や接続ネットワーク、
クラウドサービスまでトータルにお客さまのお悩みや課題の解決をサポートします。
相談無料!プロが中立的にアドバイスいたします
クラウド・AWS・Azureでお困りの方はお気軽にご相談ください。