アイシン:音声認識アプリのバックエンド システムを Google Cloud に移行し、サーバーレス アーキテクチャで運用負荷を大幅に削減
利用しているサービス:
Cloud Speech-to-Text、Translation AI(Translation API)、Cloud Run、Google Cloud Armor、Cloud DNS、Cloud Load Balancing、Cloud SQL、Cloud Storage、Cloud Build、Container Registry、Memorystore、Cloud Monitoring
利用しているソリューション:
音声認識の精度を維持しつつアーキテクチャを刷新、ユーザー数の増加に対応できる仕組みを構築
アイシンが開発した「YYProbe」は、手元の端末で集音した音声をリアルタイムで認識し、テキスト化して会話の内容を画面に表示することができるスマートフォン アプリです。当初は会議などの音声データを収集・分析し、業務に関する知見の蓄積や生産性の向上に活用する目的で開発されました。工場の騒音の中でも素早く正確に声を識別できる独自のアルゴリズムを搭載し、高い処理速度と認識精度を実現しているのが大きな特徴です。現在は、高精度な音声認識技術を生かして、聴覚障がい者向けのコミュニケーション支援アプリとしての活用も進めており、有料のプレミアム プランの提供も始めています。
町役場の窓口に設置し、リアルタイムで会話を文字表示
「開発当初にいくつかの音声認識エンジンを比較したところ、音声認識の精度とレスポンスのリアルタイム性において Cloud Speech-to-Text が圧倒的に優れていることがわかり、採用を決定しました。ただし、この時点ではバックエンドのシステム本体については他社クラウド サービスで構築しており、音声認識エンジンのみ Google Cloud を利用しているという構成でした。」