クラウド図鑑 Vol.34

IBM Bluemix は2014年7月に正式リリースされたPaaS(Platform as a Service)で、後発ながら「高度なサービスが充実」「ハイブリッドクラウド対応」などの特徴を持つ。特に「サービス」と呼ばれるミドルウェアなどのパーツ群が豊富に提供されており、よく使われるRDBのようなものから「Watson」のような最先端の機械学習/AIまで、70種類以上におよぶ(2015年11月時点)。これは、Bluemix上に、「DB2」「Watson」「Netezza」「SPSS」「Informix」「Cloudant」「BigInsights」など多岐に渡るIBMのデータ/分析のソフトウェアのポートフォリオを展開していることと、IBMが積極的に取り組んでいる「Apache Spark」のようなオープンソースのソフトウェアや、それらを補完するサードパーティのソフトウェアを統合することによって実現している。Hadoopのマネージドサービス「Infosphere BigInsights」、NoSQLのマネージドサービス「Cloudant」、データウェアハウス(DWH)の「dashDB」などのビッグデータのエンジンと、「Watson」の機械学習/AIや「SPSS」の予測分析、リアルタイム分析の「Streaming Analytics」などの分析系のサービスを駆使して多彩な方法でデータの活用を支援している

IBM Bluemixのビッグデータ関連サービス
Screenshot 2015-11-17 at 11.52.36 - Display 2
(クリックで拡大)

URL  http://www.ibm.com/cloud-computing/jp/ja/bluemix/

2015年11月19日 株式会社クラウディット 中井雅也

機能

Bluemixのコンソールの「カタログ」から選択できるデータおよび分析のサービスは20種類以上に及ぶ(2015年11月時点)。IBMのHadoopの「Infosphere BigInsight」のサービスにより、ベアメタルサーバーのHadoopクラスターのデータに対して、MapReduceなどに加えて、SQLクエリーの「BigSQL」で検索、R言語による統計向けプログラミングをする「Big R」や、テキスト分析の「Text Analytics」などが利用できる。分析系のサービスとしては、SPSSベースの予測分析「Predictive Analytics」のサービス、さらに詳細は割愛するが自然言語の解析や、音声認識、画像認識、機械学習など「Watson」のサービスが十数種類、さらに気象データ分析「Insights for Weather」のサービスや地理データ分析「Geospacial Analytics」のサービス、Twitterの分析サービス「Insights for Twitter」など豊富に用意されている 、また「Streaming Analytics」のサービスは、数千のデータソースに対応し、秒間数百万件規模のデータのリアルタイム分析を可能にする。IBMが3億ドルの資金と3500人の人員を投入するオープンソースの分析基盤Apache Sparkを「IBM Analytics for Spark」のサービスとして提供する。なお、現在IBMは、BigInsights、Streams、SPSSなど15を超える製品にもApache Sparkを組み込み、アーキテクチャを変えていると発表している。RDBベースのDWHに特化したデータベース「dashDB」のサービスは、SQLアクセスはもちろんのこと、「Netezza Analytics」のライブラリや「Watson Analytics」、統計向けのプログラム言語「R」によるデータ分析、および、BIツール「Tableau」「Cognos」などのデータ分析ツールとも連携が可能。「BLUアクセラレーション」により列データを効率よく扱い、インメモリでのカラムナーデータベース処理も高速化している。また、MPP(超並列処理)による複数ノードの並列処理でクエリー性能を向上させている。RDB系のデータベースは、DB2ベースの「SQL Database」のサービス、MySQLベースの「ClearDB MySQL Database」のサービス、PostgreSQLベースの「ElephantSQL」のサービスがある。スケールアウトが容易なNoSQLは、IBMが買収したドキュメント型の「Cloudant」のサービスと、同じくドキュメント型の「MongoDB」のサービス、キーバリューストア型の「Redis」のサービスを提供している。また、時系列データに特化したInformixベースの「Time Series Database」も提供している。他システムとの接続/連携のために高速なRabbit MQベースの「CloudAMQP」のサービスや、エンタープライズのデータベースやアプリケーションを統合できる「Cloud Integration」のサービスを提供している。

使いやすさ

数多くのサービスが日本語化されたBluemixのコンソールに統合されており、グラフィカルに設定・操作が可能。BluemixのベースとなっているPaaSソフトウェア「Cloud Foundry」のアーキテクチャにより、各サービスは一貫性のある「バインド」という操作でアプリから接続ができる。ただし、各サービスの内部は英語の画面があったり操作性も統一されていない。開発は、ローカル環境からコマンドライン使用(cfツール)、Git CLIでのデプロイ、Bluemix DevOps ServiceによるWeb IDEを使用するなどの方法に加えて、プラグインによって人気の高い統合開発環境のEclipseと連携が可能

マニュアルや書籍など

ドキュメントは日本語化されているものも多いIBM Developer Worksから、IoT、モバイル、Web、ビッグデータなどのテーマ別で150以上のチュートリアルが提供されている。

拡張性

「Infosphere BigInsight」では、最大8コアx2/192GBメモリー/32TBストレージのベアメタルサーバーを複数組み合わせてHadoopクラスターを構成する。DWHのサービス「dashDB」では、最大256GBメモリー/4TBストレージのインスタンスを複数稼働させて並列処理(MPP)が可能。またdashDBはNoSQLのCloudantのデータをRDBに変換して連携ができるため、膨大な数のデータを水平分散で拡張可能である。NoSQLのCloudantは、水平分散が得意なアーキテクチャーであるが、実サービスにおいて、7回にわたるノード追加と再配置によって6ノードのクラスターを200ノード以上に拡張し、数十億件でペタバイトレベルのデータを処理した事例がある。

可用性

「Infosphere BigInsight」ではNameNodeの冗長化のオプションがある。「dashDB」は、ノード障害に対するフェールオーバー、および、ストレージの冗長化によりサービスの耐久性を高めている。NoSQLのCloudantのデータレプリケーション機能によって可用性を高めることができる。ただし、現時点ではデータセンターをまたがる冗長化のオプションは提供されていない。地理的な冗長性を確保することは難しい。ベースとなっているSoftLayerのインフラ自体は多数のデータセンター拠点を持ち、高速なグローバルネットワークによって地理的な分散がしやすいため今後の可用性関連の機能拡張に期待したい。

SLA

2016年1月時点でBluemix全体のSLAが定義されていない。
2016年11月の最新のSLAドキュメントでは、Bluemix Publicを複数リージョンで分散配置した場合かBluemix Dedicated、Bluemix Localを地理的に離れたデータセンターに分散配置した場合でPlatform Serviceに対して99.95%の可用性を、単一の環境にBluemix Dedicated、Bluemix Localを配置した場合で99.5%の可用性をサービスレベルとして規定し、これに達しない場合は使用料金が割り引かれる。ただしIBMはSLAをよく変更するので(2016年だけで3バージョンある)、最新のSLAを確認する必要がある。

自動化機能

BigInsight、dashDB、Cloudantなど、多くのサービスはマネージドサービスとして提供されており、管理はIBMによって行われ運用タスクも自動化される。IBM DevOps ServicesとBluemixを連携させることで、サービスを中断することなく新しいアプリケーションをデプロイするプロセスを自動化することができる。

セキュリティ

BigInsightはベアメタルサーバーで提供されるためシングルテナント環境であり、クラスターは独自のプライベートVLANが用意されネットワークも隔離される。通信もSSLで暗号化され、LDAPと連携し認証と権限もコントロールできる。dashDBのデータは256ビットのAESで暗号化され、通信もSSLで暗号化される。組み込みのLDAPで認証や権限をコントロールし、データベースのレベルでも行レベルのセキュリティやカラムのマスキングなどが可能。Bluemixは、パブリックのマルチテナントのPaaSだけでなく、パブリックのシングルテナントのPaaS「Bluemix Dedicated」、さらにオンプレミスの「Bluemix Local」のオプションがあるため、セキュリティの要件にあわせて選択することができる。

データセンターの場所

マルチテナントのパブリックPaaSとしてのBluemixは米国、イギリス、シドニーのデータセンターからの提供となる。ただし、利用できるサービスがリージョンによって異なるので、現時点では米国を選択するのが無難である。シングルテナントのBluemix DedicatedではSoftLayerの東京データセンターも選択できる。オンプレミスのBluemix Localは、当然だが任意のデータセンターで稼働させることができる。

実績・シェアなど

Bluemix自体が新しいサービスであるため、公開事例などは限られているが、Bluemixの高度な機能を活用するケースがでてきている。例えば、地球外生命体の探査で知られるSETI InstituteではIBMおよびNASAと共同で、深宇宙から受信したテラバイト級の無線信号データを解析するため、BluemixとSparkを組み合わせた新しい手法の開発を進めている。

エコシステム

エコシステムを拡大中であり、「IBM Cloud marketplace」を開設して同社やサードパーティのクラウドサービスをセルフサービスを購入できるようにしている。

価格および支払い方法

基本的に従量課金でクレジットカートによる支払いとなる。6ヶ月、12ヶ月、36ヶ月のサブスクリプションでは割引きが適用される。
クレジットカード登録なしで30日間のトライアルができる。トライアル期間の後も
無料枠が用意されており、枠を超えると主に使用メモリーと利用時間に応じて費用が発生する。アプリの場合は、おおまかに、およそ512MBメモリーのインスタンスの月間あたり750時間の使用が無料枠の範囲であり、それを超えると1GBメモリーあたり7.35円/時間で課金される。分析やデータベースなどのサービスは別途費用が発生するが、例えばdashDBでも無料枠が用意されており、データ量が1GBまでは無料で、20GBまでは月額5250円、それ以上はデータ量に応じて課金される。NoSQLのCloudantや、SPSSベースの予測分析や、Watsonなど多くのサービスでも、無料枠が用意されているので、プロトタイプなどを低コストで開発ができる。