クラウド図鑑 Vol.39

Amazon Web Services (AWS) は、2015年4月9日に、機械学習技術を提供するクラウドサービス「Amazon Machine Learning」を発表した。(追記:その後、2016年11月には「Amazon AI」を発表した。)機械学習は、2015年から2016年にかけてIT業界の台風の目になる可能性がある技術であり、IBMの「Watson」(IBMがいうコグニティブコンピューティング)、Microsoftの「Azure Machine Learning」、Googleの「TensorFlow」、さらにシリコンバレーのMetaMind社のようなスタートアップ企業などが市場を形成しつつある。クラウドコンピューティングの市場をリードするAWSが提供する「Amazon Machine Learning」のサービスは、現時点で大きく3つの特徴を持っていると考えられる。1つめは、Amazon.com で実績のある機械学習技術をベースにしていること。これは、Amazon.comの「おすすめ」商品や、Amazon Echoの音声認識のような技術のことだという。2つめは、AWSで実績のある既存のサービスと統合されていること。具体的には、オブジェクトストレージの「S3」や、データウェアハウスの「Redshift」、「RDS」のリレーショナルデータベースのデータを取り込むことが容易であるため、AWS上にデータを保有しているユーザーが機械学習技術を導入しやすい。3つめは、より多くのユーザーが機械学習を利用できるようにしていることだ。ウィザード形式のインタフェースによって、モデルの作成から予測の実行までの一連のワークフローの敷居を低くしており、AWSによれば、「機械学習アルゴリズムおよび手法に関する幅広い背景知識を必要とすることなく、強力な機械学習テクノロジーを使用できる」とのこと。また、マネージドサービスなので、運用や管理の煩わしさもなく、機械学習を導入しやすいものにしている

Amazon Machine Learningの紹介の動画(日本語)

(クリックで再生)

URL  https://aws.amazon.com/jp/machine-learning/
2015年12月22日 株式会社クラウディット 中井雅也
他の機械学習/AIのクラウドサービスを見る
他のAWSのクラウドサービスを見る

機能

 Amazon Machine Lerningは機械学習モデルを構築し、予測を生成するための一連の機能を提供している。これにより、例えば、不審な取引にフラグを立てるアプリケーション、不正な注文を検出するアプリケーション、需要を予測するアプリケーション、コンテンツをパーソナライズするアプリケーション、ユーザーアクティビティを予測するアプリケーション、レビューをフィルタするアプリケーション、ソーシャルメディアを監視するアプリケーション、フリーテキストを分析するアプリケーション、商品をお勧めするアプリケーションなどを構築するのに役立つとしている。
業界標準のロジスティック回帰アルゴリズムを使っており、binary classification(二項分類)、multiclass classification(多項分類)、regression(数値予測) を行うことができる。
 Amazon Machine Lerningのデータソースの作成と準備の機能によって、データスキーマの定義を行いデータソースを作成する。
 3 つのデータストアからデータを読み込むことができる。(a)Amazon S3 の単一または複数のファイル、(b)Amazon Redshift のクエリ結果、または(c)MySQL エンジンで稼働しているデータベースに対して実行されたときの、Amazon Relational Database Service (RDS) のクエリ結果。その他の製品のデータの場合は、通常 Amazon S3 で CSV ファイルにエクスポートする。
 Amazon Machine Lerningのデータの可視化ツールによって、データソースのデータ分布などをグラフなどで可視化して確認できる。 
 その後、Amazon Machine Lerningのモデルの作成・評価と調整をグラフィカルなインタフェースで行う。そして、処理を行うデータソースを指定して「バッチ予測」を行う、あるいは、「リアルタイム予測」を行うPredict関数を呼び出すコードで、個別データに対する予測を行う。

使いやすさ

一連の機械学習のプロセスをウィザードのインタフェースによってシンプルなものにしている。AWSの他サービスと同様に「AWSコンソール」から設定や構成ができる。また、バックエンドのAWSの既存のサービスの利用も簡単である。

マニュアルや書籍など

AWSによって主要な情報は日本語で提供されている。しかしながら、開発者ガイドやAPIのドキュメントは英語での提供となっている。

拡張性

Amazon Machine Learning では、Amazon Machine Learning では、最大 100 GB のデータセットのモデルをトレーニングできる。リアルタイム処理の多くは 100 ms 以内に応答が返り、デフォルトで、リアルタイム予測エンドポイントから 200 TPS(トランザクション/秒)を処理し、それ以上はカスタマーサポートと相談しての個別対応となる。バッチジョブ(データ処理、モデルトレーニング、評価、その他のバッチ処理リクエスト)は、デフォルトで、 5 件までのバッチジョブを同時に実行し、それ以上はカスタマーサポートと相談しての個別対応となる。

可用性

Amazon Machine Learning では、高可用性が実現されるように設計されており、メンテナンス時間や定期的なダウンタイムはないとしている。モデルトレーニング、評価、バッチ予測のための API は、Amazon の実績ある高可用性データセンターで実行される。AWS リージョンごとにサービススタックレプリケーションが 3 施設にまたがって構成されており、サーバー障害やアベイラビリティーゾーンの機能停止が発生した場合に耐障害性を発揮するとのこと

SLA

2015年12月の時点で、SLAはない。

自動化機能

AWSの他サービスと同様にAPIによる自動化が可能が可能。また、全般にマネージドサービスとして提供されるため、管理や運用は自動化される。

セキュリティ

通信は暗号化される。Amazon Machine Learning の API とコンソールに対するリクエストには、安全な SSL 接続が使われ、AWS Identity and Access Management (AWS IAM) を使うことで、Amazon Machine Learning の特定のアクションとリソースに対するアクセス権をどの IAM ユーザーに付与するかをコントロールする。

データセンターの場所

Amazon Machine Learning は、2015年12月現在では、米国東部(バージニア)と欧州(アイルランド)からの提供となる

実績・シェアなど

Amazonが自社で使用しているとのこと。また、コムキャスト・コーポレーション(Comcast Corporation)がWebで紹介されている。

エコシステム

AWSのエコシステムを活用できると思われる。2015年12月の現時点で優先度の高いBIベンダーとの連携に関しては明らかになっていない。

価格および支払い方法

従量制で、データ分析およびモデル構築料金は0.42 USドル/時間。バッチ予測は 0.42 USドル/時間に加えて予測 1,000 件当たり 0.10USドル/時間 が必要。リアルタイム予測の 1 か月の料金は、予測当たり 0.0001 USD 。また、リアルタイム予測には、時間当たり 0.001 USD/10 MB のリザーブドキャパシティー料金が必要。