クラウド図鑑 Vol.40

Microsoftは、近年、データ分析技術の分野に積極的に取り組んでおり、Gartner 2015 Magic Quadrant for Advanced Analytics Platformsにおいては、2014年の「Niche Players」から「Visionaries」に評価があがり、今後は「Leaders」ポジションにいるIBMやSASを追撃していくと予想される。そのための戦略的なサービスが2015年7月に発表した「Cortana Analytics Suite」である。そして、この「Cortana Analytics Suite」の中で重要な位置づけを担っているのが「Azure Machine Learning」で、2014年6月に発表し、公開プレビューを経て、2015年2月に正式提供を開始した。現時点で「Azure Machine Learning」は、大きく3つの特徴を持っていると考えられる。1つめは、柔軟性である。中心となる機械学習において、さまざまなアルゴリズムを選択ができる上に、RやPythonのコードで分析とデータ操作を拡張できる2つめは、Azureで実績のある既存のサービスと統合されていること。具体的には、Azureのストレージサービスであるテーブルストレージ」および「Blobストレージ」Azureのデータベースサービスである「SQL Databaseのデータベースのデータ、Azureのビッグデータサービスである「Hadoop」のデータまで、さまざまなAzureのデータソースと統合可能だ。3つめは、Microsoftらしい洗練されたユーザインタフェースである。Machine Learning Studio という、Web ブラウザーからアクセスできるワークベンチ環境を提供し、フローチャートスタイルのインタフェースを提供している。また、「ギャラリー」に用意された多数のサンプルや、無料枠により、より多くのユーザーが機械学習技術を利用しやすくしている。

Azure Machine LearningのMachine Lerning Studio画面
Azure Machine Learning
(クリックで拡大)

URL  https://azure.microsoft.com/ja-jp/services/machine-learning/
2015年12月24日 株式会社クラウディット 中井雅也
他の機械学習/AIのクラウドサービスを見る
他のMicrosoftのクラウドサービスを見る


機能

 Azure Machine Learning は、クラウドで予測分析ソリューションを作成、テスト、操作、管理するための、マネージドサービスである。これにより、信用リスクを予測するアプリケーション、需要を予測するアプリケーション、Twitterのツイートの分析アプリケーションなどが開発・実行できるようになる。
 binary classification(二項分類)、multiclass classification(多項分類)、regression(数値予測)、異常検出などを、ロジスティック回帰、ディシジョンフォレスト、デシジョンジャングル、ニューラルネットワークなど、さまざまなアルゴリズムを使って行うことができる。アルゴリズム選択のためのガイドラインやチューニングのパラメータなどのドキュメントが用意されている。
 最大の特徴ともいえる「Azure Machine Learning Studio」によって、データを活用した予測分析ソリューションの構築、テスト、デプロイをドラッグ アンド ドロップのようなビジュアルな操作で行うことができる。最初に「Experiment」 という実験環境を作り、ここで、入力データや学習モデルなどのモジュールを組み合わせて、テストを行い、その後 Web サービスとしてデプロイする、という一連の流れになる。
 最初に必要なのはデータソースだが、テキストファイル、CSVファイル、SQLデータベース テーブル、Hive テーブル (Hadoop)、Rオブジェクトまたはワークスペースなど、さまざまなデータを利用できるようになっている。
 データを整形・加工するためのモジュールがあらかじめ用意されている他にR 言語または Pythonでデータを整形・加工することも可能。
 入力データ、データ整形のモジュール、機械学習のモジュールなどをビジュアルな操作で組み合わせてモデルを作成しテスト実行する。テスト実行の結果は、データの視覚化ツールによって確認ができる。  最後にWebサービスとして公開する。リアルタイムで実行する要求応答サービス(RRS)とタイプと、Azureのストレージサービス、SQL Database、HDInsight (Hive Query)、HTTP ソースなどのさまざまなソースからデータを取り込めるバッチ実行サービス(BES)の2つのタイプがある。デプロイされたモデルはMachine Learning Studioから更新が可能。また、Azureのポータルから監視が可能。Webサービスとしてデプロイされると、さまざまなデバイスなどからアクセスできる REST API を提供する。

使いやすさ

一連の機械学習のプロセスをMachine Learning Studioのグラフィカルなインタフェースによって操作ができる。Azureの他サービスと同様にポータルから設定や構成ができる。また、Azureの既存のサービスののデータも簡単に利用できる。

マニュアルや書籍など

Microsoftによって主要な情報は日本語で提供されている。日本語の書籍も販売されており、この分野の製品/サービスとしては学習しやすいと思われる。Cortana Analytics Galleryのサイトで多数のサンプルが公開されている。

拡張性

Machine Learning Studioのモジュールは、最大 10 GB のデータセットをサポートする。現時点では、Webサービスの 1 つのエンドポイントにつき 20 件の同時 RRS 要求でプロビジョニングされ、同時要求数を 200 件まで拡張でき、Web サービスごとのエンドポイント数を 10,000 まで拡張できる。バッチ実行(BES) の場合、各エンドポイントは一度に 40 件の要求を処理でき、40 件を超えた要求はキューに登録されます。これらのキューに登録された要求は、キューから放出されると自動的に実行される

可用性

Machine Learning サービスは、同じ Geo 内の 2 つのリージョンをペアにすることにより、高可用性をサポートしている。米国中南部は米国中北部とペアになる

SLA

リアルタイムで実行する要求応答サービス(RRS)とタイプではAPIのトランザクションに対して99.95%のAvailabilityを保証。バッチ実行サービス(BES)では99.9%。無料枠(Freeレベル)のサービスはSLAの対象外となる。

自動化機能

Machine Learning APIによって高度な分析アプリを開発できる。デプロイされたWebサービスにもAPIによってアクセスができる。また、全般にマネージドサービスとして提供されるため、管理や運用は自動化される。

セキュリティ

Webサービスの通信はSSLで暗号化される。運用環境およびステージング環境で Web サービスを呼び出すには、アクセス キーによる認証を行う

データセンターの場所

Azure Machine Learning は、2015年12月現在では、米国中南部、西ヨーロッパ、東南アジアの3リージョンからの提供となる

実績・シェアなど

Webサイトで、エクストリームデザイン株式会社の医療情報データの分析、また、株式会社イントロンワークスの裁判の判例検索の事例が紹介されている。

エコシステム

Cortana Analytics Galleryのサイトで多数のサンプルプログラムなどを公開・共有することで、開発者のエコシステムを拡大している。

価格および支払い方法

無料枠(Freeレベル)があり、実稼働なし/最大100モジュール/最大1時間の実験/10GBストレージ/単一ノード実行の制限で利用できる。この制限を超えるには、有償のStandardレベルのサービスを利用することになる。Machine Leaningのサブスクリプションが月額1,018.98円/シート、Machine Learning Studioの使用が102円/スタジオ実験時間、Machine learning APIの使用が 204円/実稼働 API Compute 時間、トランザクションが51円/1,000 実稼働 API トランザクションとなっている。ストレージは別途費用が発生する。