デザインアドバイスの根拠としての、推測 vs. データ

ごくごく小規模な経験的な事実(例えば、観察対象のユーザが2人)からでも、そこから得られる事実はUIデザインに対して、正しい判断ができる確率を大きく高めてくれる。

ユーザがフォントサイズを調節するのを支援すべきか、それとも、ビルトインされているブラウザのコマンドにそのまま頼るか。これはインタラクションデザイナーのディスカッショングループに、最近、投稿されていた質問である。(この後で発言内容を分析している個人の匿名性を保護するため、グループ名は記さないこととする。)

この質問に対して12人が返答していたが、ほとんどの人は単に自分自身の好みから意見を言っていた。それが別に悪いという訳ではない。人間というのは誰もが自分自身の好みに一番詳しいものだ。しかし、自分以外の他の人達に対してどうすれば一番良いだろうか、ということが書かれたポストも6件あった。

この6件のポストのうち、3分の2は純粋な推測によるものだが、残り3分の1はユーザ観察の経験から得られた何らかのデータをベースにしていた。

推測:

  • 「今どき、(中略)ブラウザのフォントを拡大する必要があるほとんどの人は、既にやり方を知っているものだろう。」 誤り
  • 「字の大きさをどうしても変える必要があるのなら、ブラウザ経由でやるだろう。たいして難しくないし。」 誤り
  • 「1995年ならともかく。50歳以上の人がみんなネット初心者で、ブラウザでのテキストサイズを変える方法を知らないとか、そんな方法は知らない方が良いとか、考えているわけではないだろう。」 誤り
  • 「フォントサイズを拡大したいと一番思うのは65歳以上の人である。この人達はセッティングの調整に必要なスキルが一番なさそうなグループだ。」 正解

データ:

  • 「自分は両親のためにいちいち字のサイズを調節しなければならなかった。それに、インターネットに詳しい65歳以上の人の割合がびっくりするくらいの勢いで増えているとは言っても、テキストサイズの調節のような表に出ていない機能に、彼らは気づきにくいものじゃないかな。」 正解
  • 「テキストのサイズ変更ウィジェットを持つサイトのユーザビリティスタディを観察したことがあるんだけど、(中略)全員ではないにしろ、ほとんどの参加者はそれがなんなのか、さっぱりわかってなかった。」 正解

データは推測に勝る

一般的なガイドラインはユーザがサイズを変えることができる(もし彼らがやり方を知っていればだが)相対的なフォントサイズを使い、デフォルトとしては大きく見やすいテキストを表示するというものである。この結論は、フォントのサイズを変更することに対して、多くの年配ユーザがそのスキルを持っていなかったという数え切れないほどの観察結果がベースになっている。

ディスカッショングループの例で見ると、

  • 外部データを与えられたデザイナーのうち、正しい意見を言っていたのは100%だった、のに対し、
  • 個人的意見に頼ったデザイナーのうち、正しい意見を言っていたのは25%だった。

もっとも衝撃的だったのは、推測に頼ったグループの75%が間違った意見を言っていたということである。こういうデザイナーにアドバイスを求めるくらいなら、コインを投げた方が賢明というわけだ。

このシンプルな例では、最小限の数の実際のユーザの経験的観察に基づくデザインアドバイスをベースにすることによって、正解を得られる可能性は4倍になっている。

注意書き: あなたのご両親から得られたデータはデータが何もないよりは良いけれども、自分の家族のデータを基にデザインを決定することをお奨めはしない。というのも、彼らは平均的なユーザよりも賢い可能性が高いからである(なぜならばあなた自身がユーザビリティを理解している賢い人なわけだし)。 自分の子供や孫がいかにオンラインのスキルに優れているかというインターネット関連会社の経営陣の自慢話を聞いた後では、我々のスタディの対象となった平均的な子供達ティーンエイジャーが、そうした関係者の子供達よりも、ウェブを使いこなすのにずっと苦労していることは明白である。

ユーザ2人のテストは推測に勝る

特筆すべきことだが、このテキストサイズの事例は少数の回答のみをベースにしている。もう一つ、より大きなサンプル数で同様の結論が得られた例を紹介しよう。

銀行の口座情報を2種類の方法で各々76人のユーザに提示し、合計152人の参加者で被験者間ベンチマークテストを実施した。ユーザにお願いしたタスクは、口座残高のチェックと、その時点で銀行が提示していた利率を見つけることである。結果は以下のようになった:

ユーザビリティ指標 デザイン A デザイン B
成功率(4つのタスク全部を通して) 56% 76%
4つのタスクの完了時間(分:秒) 5:15 5:03
被験者の満足度(5段階、5が最高) 2.8 3.0

十分な統計的有意差が見られたのは成功率だけとはいえ、3個のユーザビリティ属性の全てで、バージョンBの方がスコアが高かった。つまり、Bの方が良いデザインであることは間違いない。

(このスタディとは異なり、両方のデザインが別々のユーザビリティ属性で良いスコアを得ることもある。例えば、片方のデザインによって、ユーザのタスクの成功率は高くなるかもしれないが、もう片方のデザインを使うと、より早くタスクを完成されられる可能性があるような場合である。こうした事例では、トレードオフの決断をするか、あるいは、可能な場合は、両方の案の一番良い面を合わせた三番目のデザインを作り出すしかないだろう)

この事例で、私はデザインAとデザインBをインタラクションデザインのコースを履修中の21人の学生に見せ、どちらを銀行に推薦しようと思うかをたずねた。どちらのデザインが優れているか、彼らの純粋な個人的推測に頼ったわけだが、このとき、良い方のデザインを推薦した学生の割合は50%。つまり、コインをはじくのと確率が変わらなかった(あなたの忠実なるコインにお願いすれば、簡単にコンサルタント料を節約できるというわけだ)。

その後、同じコースを取っている別の38人に、2つのデザインを2人のユーザで各々テストするように依頼した。ここで、各案に対する2人のユーザの行動を経験的に観察することによって、良い方のデザインを推薦できた確率は76%になった。

この結果に対する別の見方は、1つのデザインにつき、たった2人のユーザがテストすることで、間違った選択をする確率が50%から24%、つまり半分に減ったというものである。もちろん、間違ったデザインを24%もの割合で選んでしまうというのは、ROI(投資利益率)の高いデザインを選ぶという観点からは物足りない。したがって、こういう場合は、1個のデザインにつき、2人より多い数のユーザでテストを行ないたくなるのは明らかである(私は通常、5人のユーザでテストすることを推奨している)。

このスタディでは対象ユーザの数を極端に減らしているが、それでも、なお、1つのデザインにつき、2人のユーザをテストすることで、推測によるコイン投げのような行為よりもはるかに良いアドバイスをすることが可能になった。

(このスタディで2つのバージョンの見栄えは同程度だったが、これは測定研究では重要なことである。例えば、完成度の低いプロトタイプと十分に洗練されたグラフィックデザインの比較では、結果のスコアにバイアスがかかってしまうからだ)

推測がとんでもなく間違ってしまうとき

我々の行なった2つのケーススタディを比較してみると、テキストサイズの事例では、推測で結論を出した陣営の結果が圧倒的に悪かった。そこでは、推測を基にデザインを決定した参加者は4分の3の確率で間違ってしまう計算になる。銀行の事例では、この陣営が間違える率は2分の1のみになるが。

では、なぜ、この哀れなディスカッショングループのメンバーは推測でものを言うのか。その答えは以下の2つの発言の中にある:

  • 「今どき…」
  • 「1995年ならともかく…」

悲しむべきことだが、ユーザビリティの研究結果の耐久性を信じようとしないウェブデザイナーが多すぎる。「昔は難しかったことも今は間違いなく簡単になっているはず」という考えが、多くのウェブサイトを破滅へと導いている。

実際のユーザを研究してみれば、テクノロジーを彼らがどんなにゆっくり学ぶか、凝ったウェブサイトを使いこなすことに関しての彼らの進歩がどれほど遅いかは明らかである。そして、最も重要なのは、手の込んだウェブテクニックを学ぶことに関心があるユーザはほとんどいないということだ。ユーザは単にそこに行って、用事を済ませ、退出したいだけ。学びたいわけではないのである。

推測は間違いにつながる。なぜならば、デザイナーの多くは進化したデザインの可能性を何が何でも信じたいと思っているからだ。彼らは彼らの愛するテクノロジーをほとんどの人が知らないとはまるで思い当たらない。

(そう、最近のテストでは、ユーザのスキルが少し進歩したことはわかっている。しかし、その進歩はゆっくりとしたものである。今後、何十年にもわたって、シンプルさが勝利を収め続けることに変わりはないと思っていいだろう)

ちょっとしたデータが大いに役に立つ

今回の2つの事例では、自分の両親の観察や、1つのデザインにつきユーザ2人のテストという、ごく少量の経験的データが与えられることによって、正しいデザイン決定が下せる確率が大幅に向上した。

もちろん、大規模なスタディを行なうに越したことはない。しかし、どんなデータであろうと、ないよりはましだ。顧客の行動を経験的に観察することなく、決められるデザインがどれだけあるというのだろうか(いや、ほとんどないだろう)。

2009 年 06 月 08 日

公開:2009年6月8日(原文:2009年6月8日)
著者:Jakob Nielsen
原文:Guesses vs. Data as Basis for Design Recommendations

分類キーワード