アマゾンは2月26日(現地時間)、アメリカ・ニューヨークで発表会を開催し、生成AIベースの音声アシスタント「Alexa+」(アレクサ プラス)を発表した。
「これは完全に作り直された、次世代のAlexaです。非常に自然に会話できます。もう『Alexaのための話し方』をする必要はありません」
アマゾンのハードウェア&サービス担当シニア・バイスプレジデントのパノス・パネイ氏はそう語る。
声アシスタントとして始まったAlexaは、登場から10年が経過した。アマゾンはこれまで「生成AIへの対応が遅れている」と指摘されてきたが、同社はここにきて「生成AIをベースにゼロから作り直す」というカードを切ってきた。
発表会の内容とキーパーソンへの取材から、新生Alexaの内容に迫る。
技術トレンドの変化が「新しいAlexa」をもたらした
Alexaは10年前、「声で命令すれば動く」機能として登場した(日本には2017年11月に上陸)。当時としては非常に優れたパーソナルアシスタントだったと言える。
しかし、パネイ氏はこう話す。
「私たちは技術によって制限を受けてきました。しかし、新しい技術が巡ることで、文字通りすべてが変わった。
LLM(大規模言語モデル)の時代になり、AIの考え方が根本から変化し、生成AIの時代になりました。すべてが揺さぶられています」(パネイ氏)
同時にこうも説明する。
「チャットツールはエッセイを書き直したり、画像を作成したりするのに良いもので、時には、かなり役に立ちます。しかしほとんどの場合、タスクを完了するのに役立ちません。
生活の他の部分から隔離されているからであり、毎日使っているアプリともつながっていない。良いメニューは知っていても、食品を注文してはくれないし、友人に夕食の招待状を送信しない」(パネイ氏)
すなわち、Alexaのもつ「家庭や個人とつながっていて、ショッピングもできる」という特性を、生成AIという技術で作り直したのがAlexa+、ということだ。
Alexa+ではお馴染みの「Alexa」ロゴに加え、筆記体的な「Alexa」の新ロゴも使われる。
今回からディスプレイを備えたAlexa対応デバイスでは、最下部にある「Alexaが答えた」ことを示す青い線が、挙動にあわせて時々アイコン表示に変わる。
ユーザーインターフェース (UI)刷新の流れで、一筆書きの「Alexa」ロゴが登場している。どうやらUI・デザインも相当細かく手がはいっているようだ。
生成AIらしさは「会話」だけでなく全面に
会見とその後の体験会では、多数の例が示された。以下は発表会で公開されたビデオだ。「様々なことが自然な会話でできる」というイメージが湧くのではないだろうか。
次の動画は、パネイ氏がAlexa+と会話しながらピザの店を吟味している時のものだ。かなり自然な、普通の言葉で店を見つけられている。
次の例は、セキュリティーカメラ「Ring」との連携だ。Ringには映像の中になにが写っているかを解析する機能があるのだが、それを使って「ハスキー犬と散歩する人」が写った映像を、会話だけでピックアップしている。
この他にもいろいろある。
野球についてAlexa+と語り合って、選手がどんな経歴でどんな活躍をしたかを話しつつ、試合を予約するとしよう。Alexa+との会話も楽しいが、球場に行くのはより興奮的だ。
だが、チケットの価格が高すぎる。アメリカのチケット販売はダイナミックプライシングが基本なので、人気が集中すると高くなるからだ。
ここで、Alexa+に「200ドルになったら教えて」と指示しておくと、チケット販売サイトを監視し、その値段が来た時に教えてくれる。
同じパターンはECとしてのアマゾンで「欲しい製品についてセールがあったら教えて」という形でも使える。