人工知能サービスを提供するPerplexity AIが、Androidアプリのバージョン2.37.0で音声アシスタント機能を新たに追加した。このアシスタントは、カメラを使用した「ライブビュー」機能により、対象物を映し出して説明を受けることが可能であるほか、画面上の情報を要約・翻訳・説明する「画面上のコンテキスト機能」を備えている。

さらに、音楽再生やリマインダー設定、メッセージ送信など、日常的な操作もサポートする。現在は「Hey Google」のような音声起動ワードには対応していないが、電源ボタンやジェスチャー操作を用いた呼び出しが可能だ。

これにより、GoogleアシスタントやGeminiといった競合アシスタントとの新たな市場競争が予想される。最新機能は手動インストールで試すことが可能だが、正式なリリースは未発表である。Perplexity AIは、多様なAIモデルへの対応を武器に成長を遂げており、新機能の投入が競争力向上につながるか注目される。

Perplexity AIの音声アシスタント機能が目指すユーザー体験の進化

Perplexity AIの新しいAndroid音声アシスタントは、従来のAIアシスタントとの差別化を図るため、ユーザー体験の多様化に力を入れている。特に「ライブビュー」機能は、単なる音声コマンドから視覚情報を交えた対話に進化させており、視覚的な対象物をカメラに映すことでリアルタイムな解説を提供できる。この技術は、外出時の道案内や商品情報の即時確認など、日常生活での利便性向上に大きな可能性を秘めている。

また、「画面上のコンテキスト機能」は、ユーザーが閲覧しているページやアプリ内容を理解し、それに基づいた情報提供や要約を行う。これにより、調べ物を行う際にアプリを切り替える手間が減少し、よりスムーズな作業が可能となるだろう。これらの機能は、従来型AIが行えなかったマルチモーダルな情報処理の実現例であり、競合のGoogleアシスタントやGeminiとの差別化に寄与するものと考えられる。

このような技術革新は、スマートフォンユーザーに新たな活用法を提供し、デジタルアシスタント市場の競争をより激化させる要因となる。特にPerplexity AIは、AIモデルを複数選択できる柔軟性を備えている点で注目されており、他社との差別化を進める姿勢が鮮明である。

音声アシスタントの設定方法と注意点

新機能の利用には手動での設定が必要だが、その手順はシンプルである。「設定メニュー」から「アシスタントを有効化」し、「デフォルトのデジタルアシスタントアプリ」にPerplexityを選択するだけで起動できる。さらに、電源ボタンやスワイプジェスチャーによる起動にも対応しているため、物理ボタン操作に慣れたユーザーにも親和性が高い仕様となっている。一方で、「Hey Google」のような音声起動ワードにはまだ対応しておらず、音声コマンドだけでの起動は現段階では不可能だ。

また、最新バージョン2.37.0はGoogle Playストアからは入手できず、APKファイルを手動でインストールする必要がある。公式リリースが行われていない点はユーザーにとってハードルとなるが、早期に最新機能を試したいユーザーにとっては大きな利点であるといえる。この非公開リリース戦略は、競合との技術差を埋める時間を稼ぐ狙いも推測される。

Android Policeの報道によれば、一部のユーザーはアプリ起動時に通知バナーを確認できたが、すべての環境で同様の通知が表示されるわけではない。今後の正式リリース時には、こうした差異が解消されるか注目される。

他社競合アシスタントとの違いと市場展望

音楽再生やリマインダー、メッセージ送信といった基本機能を備えながらも、Perplexity AIは視覚情報を取り入れた機能を軸に新たな体験を提供している。特に、標準モデル「Claude 3.5 Sonnet」や「GPT-4o」、画像生成モデル「DALL-E 3」をサポートすることで、AI機能の幅を広げている点が特徴的だ。

これにより、音声コマンドだけでなく画像認識と生成を組み合わせた操作が可能となり、競合製品との差別化が顕著になっている。Perplexity AIの取り組みは、音声アシスタント市場の競争を一層加速させるだろう。

GoogleアシスタントやGeminiといったメジャーなAIとの競争は激しさを増すが、マルチモーダルAI技術を活用することで新たな支持層を獲得できる可能性がある。特に、ユーザーがAIの活用方法を柔軟に選択できる設計は、スマートフォン利用の多様性を広げる大きな一歩となる。