- ニュース

写真:Cult of Android
Google 音声検索は、特に騒がしい環境での音声認識を向上させる新しい音響モデルのおかげで、より高速かつ正確になりました。
「新しい音響モデルが、Googleアプリ(AndroidおよびiOS)の音声検索とコマンド、そしてAndroidデバイスの音声入力に利用されるようになりました」と、Google Speechチームは本日、Google Research Blogに記しました。「新しいモデルは、必要な計算リソースが大幅に削減されただけでなく、より正確で、ノイズに強く、音声検索クエリへの応答速度も向上しています。ぜひお試しください。そして、快適な(音声)検索をお楽しみください!」
GoogleのAndroidアプリとiOSアプリで簡単なテストを行ったところ、パフォーマンスが明らかに向上し、少なくともこれまでと同等の精度を実現していることが分かりました。アップデートされたGoogleアプリはAppleのSiriよりもはるかに高速で、多くの場合、はるかに有用な結果を返します。
音声認識は過去10年間で驚異的な進歩を遂げており、スマートフォンやコネクテッドデバイスが常時接続機能を搭載するにつれて、その重要性はますます高まっていくでしょう。音声認識機能を備えたバーチャルアシスタントは、私たちの要求を聞き取り、理解し、さらには予測する能力が向上し、私たちの日常生活にますます深く浸透していくでしょう。
Siriは最もよく知られているAIアシスタントかもしれないが、Android端末と素晴らしいAmazon Echoが、iPhone 6sでようやくApple端末に搭載された常時オン機能で先導してきた。
Googleの最新音響モデルの詳細は、コンピュータサイエンスの学位を持たない人にとっては非常に奥が深い。Googleのブログ投稿によると、同社は2012年からディープニューラルネットワークを活用しており、コネクショニスト時間分類とシーケンス識別学習を用いて新しい音響モデルを作成したという。
Google のサイトでこの科学を詳しく調べたり、下のビデオで機械が文章の発音を学習する様子を見たりすることができますが、重要なのは、新しい音響モデルは、特に音声認識がほとんど役に立たなくなるような騒がしい環境において、より正確であるということです。
Googleの検索アプリや音声入力アプリをまだお試しでない方は、ぜひ今すぐお試しください。使いやすく、これまで以上に素晴らしい機能を備えています。今年後半にはGoogle Now on Tapがさらに高度なコンテキスト認識機能を搭載し、さらなる飛躍が期待できます。
https://www.youtube.com/watch?v=5_9Soz3D41g&feature=youtu.be