アイシン:音声認識アプリのバックエンド システムを Google Cloud に移行し、サーバーレス アーキテクチャで運用負荷を大幅に削減

アイシン:音声認識アプリのバックエンド システムを Google Cloud に移行し、サーバーレス アーキテクチャで運用負荷を大幅に削減

アイシン:音声認識アプリのバックエンド システムを Google Cloud に移行し、サーバーレス アーキテクチャで運用負荷を大幅に削減

自動車部品、エネルギー・住生活関連製品の大手メーカーであり、自動車部品以外の新事業にも取り組まれている株式会社アイシン(以下、アイシン)では、「YYSystem」という音声認識技術や自然言語処理技術を利用したコミュニケーション支援システムを開発しており、スマートフォン向けのリアルタイム音声認識アプリ「YYProbe(ワイワイプローブ)」などを提供しています。この YYSystem や YYProbe では開発当初より音声認識エンジンとして Google Cloud の Cloud Speech-to-Text API を利用していますが、YYProbe の インフラの再構築を機に音声認識エンジン以外のバックエンド システムについても他社クラウド サービスから Google Cloud への移行を実施しました。このプロジェクトに携わる担当者に話を伺いました。

利用しているサービス:

Cloud Speech-to-TextTranslation AI(Translation API)、Cloud RunGoogle Cloud ArmorCloud DNSCloud Load BalancingCloud SQLCloud StorageCloud BuildContainer RegistryMemorystoreCloud Monitoring

利用しているソリューション:

アプリケーションのモダナイゼーション

音声認識の精度を維持しつつアーキテクチャを刷新、ユーザー数の増加に対応できる仕組みを構築

アイシンが開発した「YYProbe」は、手元の端末で集音した音声をリアルタイムで認識し、テキスト化して会話の内容を画面に表示することができるスマートフォン アプリです。当初は会議などの音声データを収集・分析し、業務に関する知見の蓄積や生産性の向上に活用する目的で開発されました。工場の騒音の中でも素早く正確に声を識別できる独自のアルゴリズムを搭載し、高い処理速度と認識精度を実現しているのが大きな特徴です。現在は、高精度な音声認識技術を生かして、聴覚障がい者向けのコミュニケーション支援アプリとしての活用も進めており、有料のプレミアム プランの提供も始めています。

https://storage.googleapis.com/gweb-cloudblog-publish/images/aishin_reception_window.max-1200x1200.jpg

町役場の窓口に設置し、リアルタイムで会話を文字表示

この YYProbe の音声認識エンジンとして利用しているのが Cloud Speech-to-Text です。Cloud Speech-to-Text を採用した理由について、先進開発部 第4開発室 YYSystemプロジェクト 山川 隼輝氏は次のように説明します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/aisin.max-2000x2000.jpg

「開発当初にいくつかの音声認識エンジンを比較したところ、音声認識の精度とレスポンスのリアルタイム性において Cloud Speech-to-Text が圧倒的に優れていることがわかり、採用を決定しました。ただし、この時点ではバックエンドのシステム本体については他社クラウド サービスで構築しており、音声認識エンジンのみ Google Cloud を利用しているという構成でした。」

続きは Google Cloud ブログ へ

事例カテゴリの最新記事