識者インタビューからひも解く音声アシスタント(1)

自動車の音声アシスタントの現状と未来

音声アシスタントに関する知見が豊富なロボットスタート中橋さんをゲストに迎え、車の音声アシスタント市場を席捲するセレンス社の最新技術と動向、また車の音声アシスタントの行く末について話を伺いました。

  • UXリサーチ事業部 三浦志保
  • 2022年5月20日

2019年末、自動車業界に強い株式会社イードと、AI音声アシスタントに関する知見が豊富なロボットスタート株式会社は共同で自動車の音声アシスタントの評価を行う実験を行い、レポートを販売しました。またそれに合わせて日米中において音声アシスタントに関するアンケート調査を行い、国民性の違いによる利用率の差について考察を行いました。それから2年が経った今、改めてロボットスタート株式会社中橋さんをゲストとしてお招きし、自動車業界に詳しい株式会社イード貞平(さだひら)も交えながら音声アシスタントにまつわる市場の変化や音声アシスタントの未来などについて考えてみました。以下3回に分けてご紹介します。

  1. 自動車の音声アシスタントの現状と未来
  2. 「Hey Siri、○○して」に抵抗を感じる日本人
  3. スマートスピーカーの行く末

【参加者】

  • 中橋さん ロボットスタート株式会社 代表取締役社長
  • 貞平 株式会社イード リサーチ事業部 チーフコンサルタント
  • 三浦 株式会社イード HCD事業部 リサーチャー ※聞き手

(以下、敬称略)

セレンスの台頭が自動車の音声アシスタント市場を大きく変える

三浦:ご無沙汰しています。前回、自動車の音声アシスタントの調査をしてから2年が経ちました。この間、市場の変化などはありましたでしょうか。

中橋:実はこの2年で大きな変化があったんですよ。Cerence(セレンス)っていう会社がすごく台頭してきて、市場を席捲しています。セレンスはNuance Communications(ニュアンス・コミュニケーションズ、音声認識における業界最大手)から独立した、自動車用の音声アシスタント領域を専門でやっている会社です。この会社が本気で日本への取り組みを見せています。まず、クラウドサービスのホスティング拠点を日本に作ったことで、レスポンスの劇的な向上が期待できるようになりました。前回調査をしたときは、レスポンスが遅いこともありましたが、それがなくなります。あと、Cerence Browse(セレンス・ブラウズ)というサービスが発表されました。このサービスは結構画期的で、今まで自動車用の音声アシスタントというのは、自動車の運転に関わる話題、例えば道順とか天気とかを中心に設計されていました。が、Cerence Browseは、例えばグルメとかレジャーとかニュースとかイベントとか、色んな話題、一般的な話題にも対応しているんです。つまりユーザー体験が変わるという点で、かなり大きな変化だと思います。ちなみにトヨタはホスティングユーザーとして契約しているし、パイオニアとも戦略的パートナーシップ契約を結んでいます。

三浦:そうなんですね。もう日本でも利用できるんでしょうか?

中橋:いや、日本で利用できるのはたぶんもう少し先ですね。Toyota Motor North America(トヨタの北米事業を統括する会社)が自動車メーカーとして初めてセレンス・ブラウズを採用したと発表したのが2021年12月なので。

三浦:なるほど。

セレンスの技術でウェイクワードなしの「自然な会話」が実現しつつある

中橋:セレンスの話が続きますが、Cerence Co-Pilot(セレンス・コパイロット)という、CES2022イノベーションアワードを受賞した先進的なサービスも出ています。これはドライバーが指示をしなくても、データやセンシング機能を駆使して先回りしてニーズをくみ取ってくれるもので、例えば「もうすぐ車検なので、車検のスケジュールを入れますか?」と言ってくれたりします。こちらが話しかけて指示をする、というだけでなく、自動車側からも声を出してくれるという、プロアクティブな感じです。

三浦:まさに未来のアシスタントという感じですね。

中橋:メルセデス・ベンツの音声アシスタント、MBUXの第2世代にセレンスの技術が採用されていて、これもウェイクワードが一定の範囲でいらなくなっているんです。電話応対とかナビの地図表示とか、まだ特定のアクションに限定されていますが。例えば「ハイ、メルセデス」って言わなくても、「寒い」と言っただけでヒーターがついたり。

三浦:それはいいですね。やっぱり、特に日本人は「Hey Siri」とか「ハイ、メルセデス」とか言うことに抵抗を感じる人は多いと思いますし。

中橋:そうです、本当は言いたくないですよ。しかもそこで認識ミスも起きていたので。こういったことが実現したのは、音声認識のレベルが上がったから、という背景もあるんです。誰がどこで喋ったか、分かるようになっている。例えば、後部座席に座っている人が「寒い」と言ったら、後部座席の温度だけ上げて、運転席の温度は上げないというような動作もできるようになると思いますよ。

三浦:すごいですね。

自動車の音声アシスタント市場はセレンスに集約される?

中橋:さらに、Googleが作った車載OS、Android Auto(※)上で、Cerence Drive(セレンス・ドライブ)が利用できるようになったんです。つまりAndroid Autoを採用した自動車メーカーが、Cerence Driveを使って簡単に自社ブランドの音声アシスタントを構築できるようになりました。前回の調査でも見た通り、BMWとかメルセデスとかは自社向けに音声アシスタントをカスタムしていましたが、それがもっと簡単にできるようになったということです。(※Android Autoは今後廃止され、Googleアシスタントの運転モードに移行する)

前回調査時

三浦:そうなんですね。では、これからいろんな自動車メーカーから音声アシスタントが出てきても、ベースはみんなセレンスという可能性もあるんですね?

中橋:その可能性は高いと思います。だから、自動車用の音声アシスタントのことを知りたかったら、とりあえずセレンスに聞きに行けば完結する。この市場はセレンスに集約されていくと思いますよ。

三浦:トヨタでも、自前の音声アシスタントを作ることはしないんですね。

中橋:そうですね。自動車メーカーって基本的にグローバルで展開しているので、日本独自の日本語の会話エンジンだけではだめなんですよ。英語はもちろん、他の言語でも展開しなきゃいけない。それってすごく大変なんです。その点、セレンスは何十カ国の言語にも対応している。60言語だったかな? だからやっぱり、そこはセレンスを選んだ方が楽だし、妥当ですよね。そもそも自動車メーカーにとって、音声領域はそんなにクリティカルなテーマではないと思います。自動運転とか電気自動車の話とか、シェアリングビジネスがどうなるんだろうということの方がよっぽどクリティカルですよね。

三浦:確かにそうですね。

中橋:だから僕も自動車メーカーの社長だったら、「もう面倒くさいんで、音声領域はセレンスでいいや」と思っちゃうと思いますね。

三浦:なるほど(笑)。

中橋:「ちょっとしたカスタムをして出してくれよ」くらいのリクエストしかしないと思います。

自動運転が実現し、ハンドルを握る必要がなくなれば、音声アシスタントのニーズは減る

三浦:今、2年前と比べても、車内の音声アシスタントの利用率は上がっていない、つまり普及していないと思うんですが、今後もっと性能が上がって自然な会話ができるようになったら、音声アシスタントを利用する人も増えそうですね。

中橋:そうですね。ただ今後、完全自動運転が実現したら、もう音声アシスタントはいらなくなると思いますよ。自動車用の音声アシスタントの価値って、自動車を運転していて手がふさがっているときに操作できることなので。ハンドルを握る必要がなくなれば、わざわざ音声で操作する必要はないですよね。だって音声で指示するって面倒ですよね、どう考えても。例えばパソコンで音声でテキスト入力できる機能がついていても、キーボードが目の前にあるのに、わざわざ音声入力ってしなくないですか?

三浦:しないですね…。

中橋:先日BMW 7シリーズの新作が発表されたんですけど、後部座席に31インチのディスプレイがついているんですよ。天井から降ろせるようになっている。

BMWが次世代後席エンタメシステム発表、8Kの31インチ大画面…CES 2022

31インチもあれば、映画も十分楽しめますよね。Amazon Fire TVを搭載しているし、何でも見られる。もちろんタッチ操作も可能で、ああ、こういう方向に進むんだなと改めて思いました。スクリーンをスワイプしたりタッチしたりして操作する方が、音声で操作するより楽ですよね。

三浦:確かに。

中橋:もちろんセンターコンソールのパネルもタッチして操作できるようになっていて、タブレット化している。テスラも大きいタブレットを付けていますし。つまり音声アシスタントはいずれ縮小していく市場だから、自動車メーカーも本気で数百億かけて開発しようという風にはならなくて、「だったらセレンスでいいよね」という話になるんだと思います。音声で動かせることは当たり前になるとしても、自動運転時代には音声中心のUIではなくなっていくんじゃないでしょうか。

完全自動運転車が普及するまでは音声アシスタントのニーズは続く

三浦:確かにおっしゃる通り、自動運転が普及すれば、自動車の音声アシスタントのニーズは減りそうですね。でも、レベル5の完全自動運転が実現するのは、まだ先になりそうですよね。10年後とか、15年後とか?

貞平:そうですね、まだ先だと思いますよ。自動運転の開発が遅れているという話もありますよね。

三浦:そうなんですか?

中橋:確かに、自動運転の開発が遅れているという話は聞いたことがあります。

貞平:ルールどおりにいかない例外的な状況が思いのほか多かったり、センサーから収集した膨大な情報の解析にすごく電力を使ってしまったり。今、どこのメーカーも電気自動車の航続距離を伸ばすために必死だから、電力を使いすぎるのは悩ましい問題ですよね。

三浦:なるほど。そういう事情がある上に、仮に技術が実現しても自動運転する車が普及するのはもっと先ですよね。そうなると、まだ当面はハンドルを握る必要があって、音声アシスタントの強みが生きるということですね。

中橋:そうですね。

まとめ

今回は、ロボットスタート中橋さんに以下のお話を伺いました。

  • セレンスの台頭により、自動車用の音声アシスタント市場が大きく変わりつつある。
  • セレンスの技術でウェイクワードなしの「自然な会話」が実現しつつある。
  • 自動車用の音声アシスタント市場はセレンスに集約される可能性がある。
  • 完全自動運転が実現したら、自動車用の音声アシスタントのニーズは減る。ただし完全自動運転車が普及するのはまだ先であり、それまでは自動車用の音声アシスタントのニーズは続く。

次回は、引き続き中橋さんにお話しを伺いながら、日本で音声アシスタントの利用率がなかなか上がらない理由について考えてみたいと思います。