Google I/O 2018で発表されたAIを活用した様々な技術

2018年5月8日から10日の3日間カリフォルニアのショアライン・アンフィシアターで開催されているGoogleの開発者向け発表会

私もYoutubeのLiveで見ておりましたが、驚きと感動とワクワクが盛りだくさんのキーノートでした。

今回はその中から気になる内容をPickしてご紹介したいと思います。

 

Google アシスタントの進化

アクセビリティの向上

Google音声認識の機能拡張です。

聖徳太子は10人の発言を聞き分けれたと伝説がありますが、AIは何人まで可能なのでしょう、、、、

同時に複数の人が喋っていても誰が何をいっているか聞き分けができるようになったそうです。

下記チュートリアルビデオをご覧ください。

このように重なって喋っていてそれぞれ何を言っているか聞き取れませんが

AIアシスタントを使うと

このように、きちんと音声を分けて認識していることがわかります。

さらに人の声を波形で特徴を見つけ出す技術が自然な合成音声をつくる技術にも役立っているようで

 

従来の合成音声の作り方です。録音された音声から波形を抜き出してつなぎ合わせていたものが

文章の一文全てを、一つの波形として作り出すことができるようになったそうです。

このことでより自然に、流れるような音声を合成できるようになり

下記のチュートリアルのように本当に人が喋っているのと変わらないものになっています。

現在用意されている音声の種類は6ボイスあるとのことです。

日本語対応が待ち遠しい

AIが電話予約までしてくれる

スマートフォンで「火曜の午前の10時から12時の間で美容室の予約をとって」とGoogleアシスタントにお願いすると

電話で予約を取ってくれるそうです、、、

 

ん? 電話で?

 

こちらがそのチュートリアルです。

 

まさに未来ですね、ここまでやりとりができてしまうと、

サポートセンターでの使用や受付サービスが実はAIだったなんて未来も近そうです。

そのうち営業のアポ電もAIで効率化されてしまったら、

 

恐ろしいことになりそう、、、、

 

その頃には受け手側もAIがやりとりする、シュールな時代になってそうですが、、、、、

今回は音声認識にフォーカスを当てて見ましたが、画像認識やMAPの進化なども発表されています。

そちらのレポートはまた後日。