UX調査における評価尺度:
リッカート尺度かSD法か

リッカート尺度とSD法は、製品、サービス、エクスペリエンスに対する態度を調べるために利用される手段だ。しかし、状況によっては、一方が他方よりもうまく機能することもある。

リッカート尺度とSD(Semantic Differential)法は、UXのアンケートでよく利用される2種類の評価尺度だ。両者は混同されることが多い。その差異が微妙なためだ。しかし、この2つの尺度は、少し異なる方法で、ユーザーの態度や好みを明らかにする。

UX専門家が評価尺度質問を利用する方法

我々はしばしば評価尺度の質問を利用して、ユーザーの態度や認識、信念、好み、自己申告による行動を測定する。この種の質問では、意見の程度を確認することができる

評価尺度の質問は、さまざまな調査方法に登場するが、その最も一般的な用途はもちろんアンケートだ。とはいえ、評価尺度の質問は、定量的なユーザビリティテストでもよく実施される。評価尺度の質問から作成された態度データは、ユーザーが特定のタスクをどのように実行したかに加えて、彼らが自社の製品やサービスをどのように認識しているかを理解するのに役立つ。このデータによって、ユーザーエクスペリエンスの全体像をより鮮明に把握することができる。

リッカート尺度

リッカート尺度は、1930年代にリッカート尺度法を作成した心理学者Rensis Likertにちなんで名付けられた。

リッカート尺度が測定するのは同意の度合いである。リッカート尺度では、回答者は一連の記述文にどの程度同意するかあるいは同意しないのかを尋ねられ、そのユーザーの総合的な見解は、関連する質問に対するすべての回答を分析した後に導き出される。システムユーザビリティスケール(SUS)やStandardized User Experience Percentile Rank Questionnaire(SUPR-Q)などのユーザビリティ評価アンケートでは、リッカート尺度が利用されている。(厳密に言えば、1つの質問自体はリッカート尺度ではなく、リッカート型の回答形式を利用した質問ということになる。1つの質問は、リッカート項目と呼ばれる)。

システムユーザビリティスケール(SUS)のアンケートは、各項目に5段階の回答からなるリッカート型の尺度を利用する。SUSでは、回答者に10個の記述文に同意するかどうかの選択を求める。SUSアンケートの質問1~3を上に示す。

リッカート尺度(およびリッカート型の回答形式)は、以下の2種類の回答バイアスに対して弱い:

1)黙従バイアス  
2)社会的望ましさバイアス

  1. 黙従バイアスとは、他の人に同意する傾向のことである。この現象は意外なものではない。結局のところ、同意するというのは我々の本能だからだ。黙従は、参加者が同意または反対しなければならない肯定的な(または否定的な)記述文にプライミングされるために発生する。この種の行動はフレーミング効果の1つの例といえる。つまり、状況の肯定的な(または否定的な)側面が強調されると、人はその状況全体を肯定的なもの(または否定的なもの)と見なすことが多い。
    この問題を回避する方法の1つは、肯定的な言葉で表現された記述文と否定的な言葉で表現された記述文を交互に入れることである。たとえば、SUSアンケートでは、(上の図に示すように)肯定的な表現の入った記述文と否定的な表現の入った記述文が交互に出てくる(:Q1. このシステムを頻繁に利用したいと思う。Q2. このシステムは不必要に複雑だと思った。Q3. このシステムは使いやすいと思った)。ただし、このやり方に問題がないわけではない。SauroとLewis(2011)は、肯定的な表現の入った記述文と否定的な表現の入った記述文を交互に繰り返すと、(肯定的な内容と否定的な内容が交互になっていることに気づくほど注意深く記述文を読まない可能性のある)参加者と、(否定的な内容の質問と肯定的な内容の質問に対する回答にそれぞれ異なるコードを与えなければならないことに気づかない可能性のある)リサーチャーの両方が混乱する可能性があることを発見している。
  1. 社会的望ましさバイアスとは、他の人から好意的に見なされる意見を表明したいという願望のことである。回答者が、一般に認められている見解があると感じている場合、それに同意しない見解を表明すると自分の評判が悪くなることを恐れて、彼らは一般に認められている見解に同意する可能性が高くなる(たとえば、ポリティカルコレクトネスが見解として正しいものと認められていると感じている人は、ポリティカルコレクトネスに反する個人的な態度を表明することには消極的になる可能性がある)。このバイアスを最小限に抑えるには、回答者に名前などの識別情報を尋ねないことだ。研究者たちは、アンケートで名前などの識別情報を尋ねると、社会的望ましさバイアスが高まることを発見している。

SD法

SD法の質問は、1957年にOsgood、Suci、Tannenbaumによって、彼らの著書、The Measurement of Meaningで紹介され、それ以来、広く利用されるようになった。

SD法の質問では、回答者は形容詞対からなる両極尺度上の位置を選択して、自分の態度を評価することを求められる。尺度の両端には、対義語の形容詞が置かれる(たとえば、醜い – 美しい、やさしい – 難しいなど)。Single Ease Question(SEQ)(:タスク終了後にそのタスクの難易度を聞く単一質問)は、SD法の尺度の例である。SEQで提示されるのは、両端のラベルが「非常にやさしい」(very easy)と「非常に難しい」(very difficult)になっている7段階の尺度である。

Single Ease Question(SEQ)は、7段階のSD法の例である。2つの極によって、特定のタスクに対するインタラクションの難易度を表現している。

SD法が適用される場合、連続体である尺度の途中にある選択可能な選択肢にはラベルが付けられていないことがほとんどだ。そうした選択肢は抽象的な段階を示すものとされているからだ。しかし、途中の段階に番号が付けられていたり(たとえば、-3~+3)、「非常に」、「やや」、「どちらでもない」などの単語でラベル付けされているバリエーションは存在する。

研究からは、単語のラベルのついた尺度のほうがラベルのない尺度に比べると理解されやすいことがわかっている。その一方で、尺度上の途中の段階を表す適切な単語を考え出すのは難しいこともある。

SD法の質問から作成されるデータは、2つの前提が満たされた場合にのみ信頼性が高い。その前提とは以下である:

  1. 2つの形容詞が真に相反している。ただし、二項対立している形容詞を常に見つけられるとは限らない。
  2. その形容詞が二項対立していること、そして、その形容詞間が連続体になっていることを回答者が理解している。ただし、この尺度の途中の段階にはラベルが付いていないため、それぞれの選択肢が複数の回答者間で異なって解釈される可能性がある。

リッカート尺度とSD法

どちらの評価尺度も意見の程度を確認するものだが、両者の間には微妙な違いがある。回答者はリッカート尺度の質問に答えるよりもSD法の質問に回答するほうが認知的な努力を必要とする。SD法では、特に途中の段階にラベルが付いていないので、選択肢を選ぶために自分の態度について抽象的に考える必要があるからだ。しかし、選択肢が認知的に柔軟であるということは、特定のラベルに縛られていると回答者が感じずに済むということであり、リッカート尺度を利用すればそれが可能になる。

以下の比較表は、この2種類の質問の違いを強調したものである。

リッカート項目 SD法
得られる情報 記述文に対する同意または不同意。 2つの対照的な形容詞の間の連続体である尺度上での回答者の見解の位置。
選択のために提示される選択肢の数 通常は5つであるが、7つや9つでも可能。 通常は7つであるが、段階の数はさまざまである。
選択肢のラベル 各選択肢には単語のラベルが付いている。(段階が多い場合には、連続体である尺度上の選択肢のすべてにはラベルが付けられていないこともある。同意の選択肢が3つ以上になると、同意の程度を簡潔に書くことが難しいからだ。) 両極にはラベルが付けられているが、通常、その間の選択肢にはラベルが付いていないか、数字のみのラベルが付いている。
限界 黙従バイアスと社会的望ましさバイアスの影響を受ける。 選択肢にラベルが付いていないため、回答には高い認知能力が必要とされる。

場合によっては、特定の調査質問に対して、リッカート項目とSD法のどちらでも利用可能なこともある。たとえば、自社のWebサイトの利用に関する満足度を知りたい場合は、「Webサイトを利用してみて満足した」という記述文にユーザーがどの程度同意するかあるいは同意しないのかを尋ねることが可能だ。また、「Webサイトを利用してみて、どのくらい満足しましたか」というSD法の質問を作成することもできる。この尺度の両極には、「満足している」と「満足していない」という言葉が入る。このどちらの質問も、Webサイトの使いやすさに対するユーザーの認識を理解する役に立つ。

しかしながら、SD法の利用が難しかったり、不可能な場合もある。たとえば、UX実践者を対象にしたアンケートで、リッカート尺度として提示された以下の記述文について考えてみよう。

  • 発見フェーズが完了するまで、解決策について考え始めない。
  • 新しい機能や製品、サービスのデザインを開始する前に、発見作業をおこなう十分な時間が与えられている。
  • 発見作業に参加するチームは、全員で協力してそれをおこない、作業結果を共有している。
  • 発見作業は、ターゲットユーザーを対象にしたユーザー調査が柱になっている。

上記をSD法に変換するには、回答者から収集しようとしている情報の種類を変更する必要がある。

つまり、概して、リッカート型の回答形式を利用する質問のほうが柔軟性が高く、より多くの応用が可能であるといえる。

UXのアンケートで評価尺度を利用するためのヒント

アンケートで評価尺度を利用することを考えている場合のヒントを以下に紹介する。

  • インタフェースの使いやすさを評価したい場合は、すでに十分にテスト実施済みで、心理測定テストも受けた、ユーザビリティに関する標準化された質問票を利用し、質問票を独自に作成するのはやめよう。
  • どちらの形式の評価尺度を利用すべきかがわからない場合は、両方をテストしてみよう。対面の定性アンケートを実施し、質問と回答の選択肢の理解度をテストするとよい。アンケートを記入する間、参加者には思考発話してもらおう。また、実際にアンケートで両方のバージョンを試してみて、回答を比較し、リッカート法とSD法のどちらの尺度を利用するかを決めることもできる。自分たちのオーディエンスについてよく考えてみることだ。SD法に答えるのに苦労しないか。あるいは、同意しすぎる傾向はないだろうか。
  • リッカート型の回答形式を利用して質問をデザインする場合は、既存の尺度ラベルを利用しよう。同意と不同意についての典型的な言い回し(「非常にそう思う」、「そう思う」、「どちらでもない」など)を変えないようにし、回答の選択肢をわざわざ一から新しく作り直すのはやめよう。
  • SD法の尺度をデザインする際には、両極に来る形容詞を必ず真に相反しているものにしよう。たとえば、「かっこいい」と「変な」のような意外な組み合わせではなく、「おもしろい」と「つまらない」のような広く受け入れられている組み合わせを選ぶ必要がある。大規模な定量的調査を実施する前には、対面のユーザーテストを実施し、相反する単語の組み合わせになっていると見なされるかどうかを調べよう。
  • 自由回答のテキスト欄を置き、より多くの知見が得られるようにしよう。「なぜこの評価にしたのですか」のような質問によって、ユーザーがその尺度上で選択肢を選んだ思考プロセスについての情報を収集することができる。
  • すべての回答者に適用されない可能性がある質問には、「該当なし」という選択肢を追加しよう。この選択肢を追加することによって、中立的な立場の回答者と、質問が自分に関連しているとは思わない回答者を区別することが可能だ。

結論

リッカート尺度とSD法は、UXのアンケートでよく利用される2種類の評価尺度だ。どちらも製品やサービスのエクスペリエンスに関連する意見の程度を測定するためにすでに十分にテスト実施済みの手法である。ただし、両者のやり方はわずかに異なる。調査の目的に合った適切な形式の評価尺度を選択することだ。そして、両者の限界とニュアンスについても理解しておこう。

参考文献

Likert, R. (1932). A Technique for the Measurement of Attitudes. Archives of Psychology, 140, 1–55.

Osgood, C.E., Suci, G.J., and Tannenbaum, P.H. (1957). The Measurement of Meaning. University of Illinois Press, Urbana, Illinois.

Sauro, J., Lewis, J.R. (2011). When designing usability questionnaires, does it hurt to be positive?. Proceedings of the SIGCHI Conference on Human Factors in Computing Systems (CHI ’11). 2215–2224.