アコーディオン編集と選り抜き作業:
初期の生成AIユーザーの行動

テキストベースのAIチャットボットとのインタラクションにおいて、2つの新しいユーザー行動が広がっている。ユーザー調査によると、生産性を高めるために、ユーザーはAIツールと、反復的でしばしば複雑な関わり方をしている。

チャットボットは現在、テキスト操作のための生成AIツールの主要なUIである。AIとの個々のインタラクションは、テキストを入力したらAIがテキストを返す、という単純明快なやりとりである。(画像、音声、動画など、他のメディア形式を生成するAIツールもあるが、この記事では特にテキストベースのAIツールに焦点を当てる)

ユーザーテストで我々が目にしたのは、プロンプトを追加することによってAIが生成する出力を改良する、という反復をユーザーが頻繁に行う様子だった。この行ったり来たりのインタラクションがテキストのみのユーザーインタフェースと組み合わさって、アコーディオン効果と選り抜き作業という2つの新しいユーザー行動が生まれたのである。

調査概要

我々の目標は、AIチャットボットのインタフェースに存在するユーザビリティの問題を明らかにすることだった。これらのボットは生産性向上ツールとして広く利用されるようになっていることから、日常の作業でチャットボットを使っている専門家や学生を対象に定性的なユーザビリティ調査を実施した。

サンプルとして8人の参加者を募集し、以下のような人たちが参加した:

  • マーケティングの専門家
  • UXの専門家
  • プログラムマネージャー
  • 博士課程の学生

それぞれの参加者は、セッションに自分で持ち込んだ1~2個のタスクを完了させてから、その後、我々が彼らの専門性に合わせてカスタマイズしたタスクを実行した。これらのタスクには、文章を書く、アイデアを出す、テキストを編集する、情報を分析する、インタフェースをデザインするといったものがあった。ユーザーは、ChatGPT-3.5を使って、彼らの日常的な使い方を代表するようなそうしたタスクを行った。

セッションは90分で、参加者はチャットボットを使って、低・中・高忠実度の出力を作成するように求められた。

  • 低忠実度の出力:コンテンツが優先され、フォーマットや文体は重要でない(アイデアやひらめきなど)。
  • 中忠実度の出力:フォーマットはある程度重要だが、文体は洗練されている必要はない(記事の骨子、マーケティング計画など)。
  • 高忠実度の出力:適切なフォーマットと洗練された文体が求められる(メール、ソーシャルメディア投稿、記事など)。

アコーディオン編集

定義:アコーディオン編集は、ユーザーが1つの目標を達成するために、多くの場合繰り返し、出力の短縮または拡張をAIに要求する場面で生じる。

画像とは異なり、テキストは一次元のメディアであるため、ユーザーのインタラクション方法はシンプルで直線的なものに限定される。そこで、口調や文体以上に、テキストの特性として最もわかりやすいものの1つが長さで、アコーディオンの奏者がアコーディオンを広げたり縮めたりするように、テキストも長くしたり短くしたりされる。

たとえば、旅行の日程表を作成したいユーザーについて考えてみよう。彼らはチャットボットに、まず、新しい都市でのおすすめの観光スポットを何ヶ所か教えてほしいと頼んだとする。次に、その観光名所の近くで食事ができる場所をいくつか追加することで、それぞれのおすすめスポットに関する情報を増やすことを要求した(出力を「拡張」)。最後に、チャットボットにある特定のエリアのおすすめスポットベスト5の場所を教えてもらい(出力を「短縮」)、旅行の日程表を完成させるのである。

短縮

ユーザーは、AIによる出力を順位づけの強制と語数の削減という主に2つの方法で短縮する。

行動説明ユースケース
順位づけの強制 リストの上位選択による短縮特にリストや箇条書きの場合、ユーザーはAIが提示した項目数を減らすようAIに要求する。AIチャットボットはユーザーが求めているよりも長いリストを出すことが多く、ユーザーは「トップ5」や「トップ10」を尋ねることで数を減らそうとする。低~中程度の忠実度の出力やリストの作成(アイデア、計画書、選択肢の生成など)
語数の削減 字数制限の指定メールやソーシャルメディア投稿など、特定の目的のために文章を書くとき、ユーザーにはChatGPTの回答に期待する長さがあるが、ChatGPTはそれを超えることがよくある。そこで、彼らはしばしばこのボットに「短くして」と要求し、絶対的な長さ(「100語」など)や相対的な長さ(「半分にして」など)を指定する。文章が彼らの望む長さになるまでこのような行動を繰り返さなければならないこともある。高忠実度のコンテンツの作成(論文、メール、ソーシャルメディア投稿など)
ある参加者がChatGPTにソーシャルメディアへの投稿文を作成するよう要求したところ、その出力はかなり長すぎたので、彼女はその文字数を減らすようにChatGPTに依頼しなければならなかった(短縮)。彼女はこうコメントした。「これ(=ChatGPT)はたいてい、実際には私の言うことを聞いてくれません。それでもたいてい長すぎるので、280文字に収まるまで、『もっと短く、もっと短く』と言い続けます」。

拡張

ユーザーがAIの出力を拡張する主な方法は2つある。ボットから得たアイデアを拡張する方法と不足しているコンテンツを追加する方法だ。

行動説明ユースケース
アイデアの拡張 既存のアイデアに追加ユーザーは、ChatGPTから与えられたアイデアを発展させるために、特定の段落あるいは箇条書きの項目を拡張させる。拡張したい前回の回答の部分を次のプロンプトで参照し、それを拡張するように指示することで実行する。あらゆる忠実度のテキストの作成(アイデア、特定のトピックについてまとめた情報、記事の骨子、計画書、メール、ソーシャルメディア投稿など)
不足しているコンテンツの追加 新しいアイデアの収集ユーザーは、自分の知識や経験に基づいて期待していた情報が回答に含まれていないということを指摘することが多く、その後、前の回答に何を加えたいかを指定するプロンプトを続ける。中~高忠実度のコンテンツの作成(論文、メール、ソーシャルメディア投稿、企画書、記事の骨子など)
ChatGPTからの回答を受け取った後、ある参加者はこう言った。「回答のある部分を気に入ったことをAIにわかってもらい、そこをさらに詳しく説明してほしいと思っています」。彼女は、AIチャットボットに、元の回答のいくつかの点についてさらに詳しく説明するよう求めるプロンプトを続けた(拡張)。

短縮と拡張はセットで行われる

アコーディオン編集では、AIの出力を意図的に短縮または拡張し、多くの場合、それは連続して行われる。しかしながら、しばしば、短縮と拡張の「両方」を組み合わせて最終的な出力を作成するため、我々はこの行動をアコーディオンに例えた。

たとえば、ユーザーは自分のテキストに不足している内容を見つけ、ChatGPTにそれを追加するよう要求し、それによって出力の特定の部分を拡張する。しかし、その後、ユーザーは続けて、必要なフォーマットに合うように回答全体を短くする。どちらのアクションでも、ユーザーは追加のプロンプトを書いて、自分の望むように回答を変更する必要があり、こうした作業は、たいていの場合、何度も繰り返される。

意図的でないアコーディオン編集の削減

生成AIを使って目指す目標によっては、アコーディオン編集は有益で、意図的に行われることもある。一方、最初の2~3回(または数回)の試行で望ましい出力が得られなかった場合にもアコーディオン編集は発生する。一部の生成AIツールは、パーソナライズされた設定とフォーマットを提供し、ユーザーが今後のすべての使用に関わるカスタムプリファレンスを指定できるようにすることで、この問題に対処している。たとえば、「詳細を尋ねない限り、短くする。リスト表示にして、キーワードを太字にすることで、流し読みしやすくする」というようなカスタム指示を設定しておくことで、冗長になりがちなChatGPTの傾向を抑えることが可能だ。

最初のプロンプトに制限事項(点数や語数など)を含めることで、拡張したり短縮したりするアコーディオン行動の回数を減らそうとしているユーザーもいる。とはいえ、多くの場合、AIの最初の出力はユーザーの指定に沿ったものだ。しかし、最初の指定を満たしていたとしても、多くのユーザーはAIとそれ以外の内容に関する修正を行っていた。

したがって、チャットボットユーザーに対する我々の従来からのアドバイスは依然として変わらない。できるだけ具体的に説明することで、明確化の障壁に立ち向かい、希望通りの出力を手に入れよう。

以下の点を指定することで、目標をすばやく達成できる可能性が高まる:

  • コンテンツに期待するフォーマット(箇条書きか段落か)
  • 出力の種類(メール、ソーシャルメディア投稿など)
  • 期待する長さ(語数やページ数)

選り抜き作業

定義選り抜き作業は、ユーザーが望む出力を得るために、以前のAIの回答を、次のプロンプトの中で参照する場面で生じる。

(訳注:原語のapple pickingを直訳すれば「りんごの摘み取り」だが、appleは「最も望ましいもの」の比喩としても使われることがあり、そこから派生して、ここでのapple pickingは「選り抜くこと」を指している)

ユーザーは、ChatGPTの以前の回答から特定の要素を参照して、以前の回答に基づいて議論や情報を構築したいと思うことがよくある。しかし、これを手軽に行う方法はない。ユーザーは、以前の回答の中の使いたい部分を説明したり、引用したりするテキストを入力(またはコピーアンドペースト)しなければならない。この行動の頻度から考えると、選り抜き作業には多大な労力がかかるということになる。

ユーザーは、以下のような行動を取りたい要素を特定(指定)することによって、りんご(=最も望ましいもの)を選り抜く:

  • 変更する、または
  • その後の要求のためのコンテキストとして使う
行動説明ユースケース
指定して変更ユーザーは、特定のポイントを編集したり、既存の回答の一部を削除したい場合、変更したい部分を示して、その変更を含む新しいバージョンの回答を生成するようにChatGPTに要求する。中~高忠実度のコンテンツの作成(論文、メール、ソーシャルメディア投稿、計画書、記事の骨子など)
コンテキストとして指定特に多くのステップを踏む複雑なタスクの場合、ユーザーは、以前の回答を次のプロンプトのコンテキストとして活用したいと思うことがある。彼らはよく、前の回答の一部を手作業で参照したり、貼りつけたりして、この作業を行う。あらゆる忠実度のテキストの作成(アイデア、特定のトピックについてまとめた情報、記事の骨子、計画書、メール、ソーシャルメディア投稿など)
ある参加者は、ChatGPTの前回の回答の特定の要素をどのように変更したいかをChatGPTに理解してもらうプロンプトを書くのに苦労していた。彼女は、新しい回答に使用したい特定の語句を確認するために、回答を上に2回スクロールしなければならなかった。

選り抜き作業はスクロールを過度に必要とする

テキストを生成するプロセスは反復的であり、新しいバージョンを多数生成したり、以前の回答を元に次の回答を次々に作り出していったりする。そのため、AIボットを利用すると、チャットウィンドウ内に大量のテキストが溜まっていく。ユーザーは、この情報をすべてワーキングメモリーに保持することはできないため、しばしば上にスクロールして戻り、AIツールがこれまでに生成した内容の経過を追わなければならない。

ユーザーは、以前の回答から選択して参照したいポイントを見つけるために、しばしば膨大なテキストの壁をスクロールする必要がある。特にそれぞれのAI出力が長く、ビューポートからはみ出るような場合、その何種類もの作業成果をスクロールしようとすると迷子になりやすい。過度なスクロールは、ユーザーが反復を比較して変更内容を把握しなければならない場合にも問題となる。こうした行動は、調査参加者全員に観察された重要な摩擦のポイントである。

AIチャットボット外での編集

反復して満足のいく回答を得た後でも、ほとんどのユーザーはAIチャットボットの外でさらに最終的な出力を編集する。ChatGPTには限界があるため、この追加のステップが必要になってくるのである。現在のChatGPTの課題は以下の通りである:

  • 現実世界の情報の追加
  • 詳細度の調整
  • フォーマットの追加

最新情報の追加

参加者が最新の情報を求めている場合、彼らはChatGPTの回答に失望することが多かった。現在のChatGPTは、数年前の古いナレッジベースを利用しているからだ。

たとえば、ある参加者はマーケティング用のソーシャルメディア投稿を作成していたが、ChatGPTが今のトレンドになっているハッシュタグを知らないことを指摘した。また、参加者がChatGPTにない事実情報を追加したケースもあった。

詳細度の調整

参加者の中には、口調や詳細度が期待値に合うように回答の一部を微調整したいと考える人もいたが、彼らはChatGPTでその目標を達成するのは難しいと感じていた。

たとえば、アンケートを作成していた参加者は、ChatGPTの回答をテキストエディタで編集して、手作業でさらにいくつか質問を追加していた。また、ChatGPTが作成したメールの草稿の冒頭にあった挨拶を削除していた参加者もいた。自分の普段のメールの書き出し方とは違っていたからだ。

フォーマットの追加

特に高忠実度の出力に対して、ChatGPTの回答のフォーマットのやり方に不満を持つユーザーもいた。こうしたケースでは、参加者がテキストを箇条書きにしたり、不要な小見出しを削除するなどの変更を行っている様子が見られた。

会話型ユーザーインタフェースは容易ではない

多くのアナリストは、チャットボットはそのシンプルな会話型ユーザーインタフェースによって、ユーザビリティの問題のほとんどを解決すると主張している。何か言えば、コンピューターが返事をしてくれるからだ。ウェブサイトと違い、この直線的なインタラクションでは迷子になることがない。さらに良いことに、AIはユーザーの意図を踏まえた結果を提示する。つまり、ユーザーが望むことを言うだけで、ボットがそれを実現してくれるというわけだ。

しかし、それは夢の中での話だ。現実には、我々のユーザー調査を見ると、ユーザーは、ほとんどの場合、何段階もの反復を行っている。AIがユーザーの望むものを正確に提供しないためだ。AIはユーザーの意図を推測することしかできないからである。

この時点で、会話型ユーザーインタフェースは容易なものではなくなってしまう。ユーザーは、自分のニーズに合うように出力を修正するためにかなり余分な作業をする必要がある。さらに悪いことに、現在の延々とスクロールするしかないチャットウィンドウでは、この調査で我々が明らかにしたようなChatGPTに対してユーザーが追加で行う行動をサポートすることも難しい。ここまで見てきたように、直線的であろうとなかろうと、人はスクロールするときには迷ってしまうものだからだ。

この分野の歴史を最低限知っているUXの専門家であれば、新しいインタラクション形式が古い問題を緩和する一方、新しいユーザビリティの問題を引き起こすというのは驚くことではない。グラフィカルユーザーインタフェース(GUI)は、コマンド名を覚えて入力することからユーザーを解放したが、代償として、コマンドを各メニューに配置するための情報アーキテクチャを必要とした。その結果、GUIのデザインが不適切だと、知っているコマンドを見つけるのも、新機能を発見するのも難しくなってしまった。

同様に、AIは、ワープロソフトで文章を作成したり、ビジュアルソフトで画像を描いたりするために必要な面倒な作業からユーザーを解放する。しかし、我々の調査のような迅速でシンプルなユーザビリティテストによって回避できたと思われるユーザビリティ上の多くの問題を、現在のAIツールは抱えている

我々が説明してきたように、AIは新しいユーザー行動を活発に生み出している。これは、ウェブ上のオンライン情報が膨大に増加した結果、あらゆる情報探索行動の中で検索が優位に立つようになった状況とよく似ている。新しい行動には、ユーザーをサポートするための新しいデザインが求められる。現在、AIツールは、例えていうと、1993年のウェブサイトのようなものであり、今後さらに改善される必要があるのである。

AIに求められる新しい機能

アコーディオン編集や選り抜き作業は、既存の生成AIツールとその限界に直接起因するユーザー行動だ。生成AIツールが進化するにつれて、これらの行動も進化していくだろう。

両方の行動は、AIシステムに対する以下のような改善が必要であることを明確に示している:

  • AIの回答の区画化:ユーザーは、回答の一部だけを変更できる必要がある。生成AIツールは、ユーザーがまったく新しい回答を生成するためにプロンプトを書くことを要求するのではなく、回答に直接変更を加えられるようにすべきであり、おそらく最終的にはそうなるだろう。そうすれば、ユーザーは気に入った部分を残し、気に入らない部分を編集できるようになる。これは、プロンプトのどの部分を編集、削除、または拡張するかを容易に指定できるようにすることで可能だ。また、この機能は過度なスクロールの一部の解決にも効果がある。
  • 直接編集:ユーザーが新たなプロンプトを作成しなくても、テキストを直接編集できるようにすべきだ。これにより、ユーザーは手作業で自分独自の修正ができるようになり、追加ツールの必要性をなくすことができる。
  • ポイントして選択:ユーザーが過去のダイアログのステップにある特定の箇所を苦労して説明するのではなく、彼らが直接その箇所を指定して選択できるようにすべきだ。暫定的な方法としては、ChatGPTが各ステップやステップ内の各段落に番号を振って、そうした番号を識別子として使うことが考えられる。しかし、長く待ち望まれているハイブリッドインタフェースが実現すれば、GUIのポインティングがそのより良い解決策になるだろう。