クラウド図鑑 Vol.59

概要

Google は機械学習/AIの分野においてトップクラスの技術を持っていることは、話題になったAlphaGo (Alpha 碁)や、身近なGoogleフォトの画像認識技術などを見ても明らかである。一方、Google Cloud Platform (GCP) における Machine Learningサービス は、2016年5月の時点で Limited Preview となっており、IBM、Azure、AWS の後塵を拝する状況といわざるをえない。しかしながら、2016年になって、Google のCEO Sundar Pichai 氏の「モバイルファーストからAI ファースト」の方向が打ち出され、5月に開催された Google の年次イベント「 Google I/O」 において、その戦略が見えてきた。Pichai 氏は、機械学習/AIを加速させるために2つの方法を強調している。1つめは、Googleの機械学習のコアコンポーネントをオープンにすること。これは昨年11月に機械学習ライブラリ「TensorFlow」をオープンソース化したこと、5月に自然言語のパーサーを追加していることなどで、TensorFlowは現在ナンバーワンの機械学習のプロジェクトとなっている。2つめは、このような機械学習の機能をGoogle Cloud Platform (GCP) に展開することで、Cloud Machine Learningに加え、画像分析のCloud Vision API、音声変換のSpeech API、言語処理のLanguage API、翻訳処理のTranslate APIなどが使えるが、さらに多くのAPIを追加していくという。そして、これらのソフトウェアを高速に処理するために専用ハードウェア「Tensor Processinng Units (TPU)」を開発した。これは、消費電力(ワット)あたりの性能が既存のGPUやFPGAに比較して10倍高いというもので、AlphaGoやStreet Viewでも使われていたという。このハードウェアの外販の予定はなく、Googleのデータセンターで既に利用されており、Googleのクラウドの差別化のためにのみ使われるとのことである。なお、Googleは、2016年内に待望の東京リージョンを開設予定である。

Tensor Processinng Units (TPU)
Google TPU

URL   https://cloud.google.com/products/machine-learning/
2016年5月25日 株式会社クラウディット 中井雅也

機能

オープンソースの機械学習ライブラリ「TensorFlow」によって機械学習のモデルを構築できる。データはCloud DataflowによってCloud Storage, BigQueryを統合することができる。TensorFlowはローカルのPCでも動くので、モデル作成とサンプルデータによるトレーニングをローカルで行い、大規模なトレーニングや処理をクラウドで実行するといった使い方ができる。
また、対話式のデータ探索、分析、可視化ツール「Cloud Datalab」で機械学習のモデルを構築できる(2016年5月時点ではベータ)。Cloud Datalabはオープンソースの「Jupyter」のGoogle版であり、Google Compute Engine, BigQuery, Cloud StorageのデータをPython, Java Script, SQLで分析ができる。
Cloud Vision APIの画像分析によって、自動的な数千のカテゴリー分け、人物の顔および表情、物体、ロゴ、ランドマークの検出、文字の認識や抽出などが可能。
Speech APIによって、80を超える言語のリアルタイムの音声からテキストへの変換、あるいは、音声ファイルからの変換が可能。
Translate APIによって、90以上の言語の変換処理が可能。
これらは標準的なREST APIとして提供され、Python, Java Script, Go, Javaなどで利用できる。
基本的に全てマネージドサービスとして提供されるため、ハードウェアやOS、ミドルウェア、クラスタ管理などはユーザーが意識することはない。
オプションでGPUを使ってモデル構築を高速化できる。

使いやすさ

サービスはGoogle Cloud Platformのコンソールに統合され、画面から設定や構成を行うことができる。しかしながら、TensorFlowやCloud Datalabは、開発者向けのソフトウェアであり、ビジネスユーザーが簡単に使えるBIツールのようなものではない。現時点では、Googleの機械学習プラットフォームを使いこなすには、Pythonのプログラミングや機械学習、数学の知識なども必要だと思われる。逆に、オープンソースのプロジェクトとしてのTensorFlowやJupyterを扱える技術者は、その知識や経験が活用しやすい。

マニュアルや書籍など

Googleによってマニュアルやチュートリアルが用意されている。ただし日本語になっていないものも多い。

拡張性

現時点ではLimited Previewのサービスで仕様が確定していないが、任意の数のノードを設定して訓練を行うことでモデル構築をスピードアップでき、モデル構築にはオプションで GPU のパワーを利用することもできるとのこと。

可用性

現時点ではLimited Previewのサービスで可用性に関する仕様が確定していない

SLA

現時点ではLimited PreviewのサービスでありSLAはない。

自動化機能

現時点ではLimited PreviewのサービスでAPIの仕様などは明らかでないが、Googleの他サービスと同様にプログラムからの操作ができるようになると思われる。

セキュリティ

基本的なデータの保管場所は、Cloud StorageかBigQueryになると思われるが、Cloud Storage、BigQueryともにデータは暗号化されアクセス制御も可能である。

データセンターの場所

現時点で、Googleのクラウドは、北米、ヨーロッパ、アジアの3拠点(リージョン)で運用されており、各リージョンは複数のゾーン群で構成される。このMachine Learningのサービスがどのリージョンで使用できるかは現時点では明らかでない。これまで Google Cloud で課題とされてきた日本のデータセンターは、2016年11月8日に東京リージョンの正式運用が発表された。なお、Googleは、2016年内に待望の東京リージョンを開設予定である。

実績・シェアなど

Cloud Machine Learning のサービスとしては、正式提供されていないため、実績などは公開されていない。しかしながら、Googleの機械学習/AIの技術は、AlphaGoのような複雑な囲碁プログラムのようなものから、身近なGoogleフォトの画像認識技術やGoogle Appsのドキュメントの音声認識など広範囲で使われている。エンタープライズ的な事例としては、Webサイト制作のクラウドサービスとして著名なWixがメディアプラットフォームで画像認識機能を実現している。

エコシステム

TensorFlowは機械学習のオープンソースプロジェクトとして最も人気があり、開発者のエコシステムが拡大している。Cloud DatalabもオープンソースのJupyterがベースなので、開発者のエコシステムが転用できる。

価格および支払い方法

2016年5月の時点では、Limited Previewのサービスであり、価格は決まっていない。