AIと個人中心設計(PCD: Person Centered Design) (1) 近年のAIアシスタント
PCDとは、個人の特性や状況の違いを考慮して、一人一人に適したものづくりをしようという主旨の造語である。なぜPCDが必要かというと、特にAIの応用を考えているからである。
AIとロボットの進化とPCD
ここでPCDというのは人間中心設計ではなくPerson Centered Design、つまり個人中心設計のことである。なお、これは筆者の造語である。その主旨は、一般的な意味での人間(ないしユーザ)をターゲットにするのでなく、個人の特性の違いや状況の違いを考慮して、一人一人に適したものづくりをしようという考え方である。HCDはたしかに良い考え方ではあるが、人間、という大括りなとらえ方にもとづいているため、しばしばペルソナなどを使ってターゲットを狭め、特性を明確化する必要がでてくる。それに対してPCDでは、特定の個人が対象になっているので、その特性などをきちんと把握できれば、それをベースにしてデザインを行うことができる。
なぜそんなことをしてPCDをする必要があるかというと、特にAIの応用を考えているからである。AIの利用先を考えると、その一つは個人個人のユーザに適合した回答をし、反応をしてくれた方がありがたいからである。誰にとっても適切な範囲の情報とは、たとえばWikipediaで得られるようなものであり、その範囲であれば、検索した事柄について詳しい情報さえ得られれば、あとはユーザが取捨選択をして情報を加工すれば良い。しかし、質疑応答の形をとって情報の検索をしたりする場合には、ユーザの意図や質問の背景を知っていた方が、より的確な情報提供を行うことができる。Wikipediaで表示されてくる情報のすべてが有益だったということもあるだろうが、もうちょっと違う範囲の情報が欲しかった、ということもあるだろうし、特定の部分についてもう少し詳しい情報が欲しかった、という場合もあるだろう。そうした場合には、ユーザという個人についてAI側が良く理解していることが、的確な情報提供を行うためのベースになると考えられる。
最近のAIの進歩
特に最近は、AIの進歩が著しくなってきた。パソコンで利用できるAIにも、ChatGPTの他に、GrokやGemini、Copilot、DeepSeekなどがあり、複数のAIアシスタントの回答を比較してみるのも楽しい。その応答の実際をこの5つのアシスタントの比較の形でちょっと見てみたい。
たとえば「なぜMrs. Green Appleやマカロニえんぴつのような最近のJPOPでは、旋律が捉えにくいのか」という問いをなげかけると、実際に音楽を聴いてみないとわからないであろう「旋律のとらえやすさ」という点について、上記のアシスタントはそれなりに的確な説明を返してくる。
たとえばChatGPT 4oでは、「1. メロディが変化・複雑化している…節回しが多く、細かく上下する・拍の取り方が自由、抑揚がランダム・変拍子的・コード進行も複雑」「2. リズムと語感の優先(“メロディ”より“ノリ”重視)」「3. コード進行や転調が自由で、予測できない」といった回答を返し、「一曲を集中して聴くというより、サブスクやYouTubeで断片的に聴くようになったため、印象的なワンフレーズがあればOKな傾向」「「完璧なメロディ」より、「引っかかり」や「ズレ」が味になる時代」「ロック/ポップ/ヒップホップ/ボカロ/R&Bがごちゃ混ぜに。結果、メロディの重視より全体の“音像”が重視されるように」といった解説もつけてくる。
こうした回答は、同じような内容の評論や解説がすでにどこかにあって、それがビッグデータに入っていたから可能だったのか、それとも実際に音楽データを分析したから可能になったのかは分からない。しかし、ChatGPT 4oだけでなく、Grokもかなり的確で詳しい説明を返してくる。
ただし、Geminiは「一つの楽曲の中で拍子の数が変わったり、複雑なリズムパターンが用いられたりすることで、メロディーの乗り方が нестабильный に感じられることがあります」という訳の分からない回答をしてくるし、Copilotは短く表面的な回答にとどまっている。DeepSeekの回答は「Mrs. Green Appleはディミニッシュコードや転調を多用し、メロディの流れを意図的に崩すことがあります」といい線をいってもいるのだが、全体としては表面的な回答になっている。
次に「ネスレはなぜ昔ネッスルと呼ばれていたのか」という日本固有の状況についての質問をなげかけると、ChatGPT 4oは「1998年、日本でも正式に「ネスレ日本株式会社」に社名変更」というように細かい情報も提供してくる。このことからしても、このサービスが使っているビッグデータは相当大きなものだと想像される。Grokは、年代についてまでは回答しないものの、背景情報や関連情報についてかなり詳しい情報を提供してくる。Geminiは「ネスレ日本株式会社の公式見解によると、1994年に社名を「ネッスル日本」から「ネスレ日本」に変更した」とChatGPT 4oとは異なる年号を回答してくる。このあたりがAIサービスの回答を全面的に信用しにくい点ではある(編注:1994年が正しい)。Copilotの回答は短く、やはり表面的な回答である。AIアシスタントとしては今一つの性能というべきだろう。それよりはDeepSeekの回答の方がより詳細で評価できるものになっている。
最後に、筆者がこの原稿を書いている2025.4.24時点でメディアで話題になっている、八代亜紀のCDの写真騒動について「ニューセンチュリーレコードが話題になっているのはなぜ」という質問を出してみると、ChatGPT 4oは「ニューセンチュリーレコードが最近話題となっているのは、2025年4月21日に発売された八代亜紀さんの追悼CD『忘れないでね』に、故人のプライベートなヌード写真が特典として封入されたことが発端です」と最新情報にも強いことが分かる。Grokもかなり詳しい情報を的確に回答してきた。Geminiは、間違ってはいないものの、短い回答を返すにとどまった。Copilotも短い回答であり、今回テストしたAIアシスタントの中では最も情報量が少なかった。
DeepSeekは「最近、ニューセンチュリーレコード(New Century Records) が話題になっている主な理由は、「90年代の伝説的レーベルの復活」 や 「VIPPER・ネットミーム文化との関わり」 が影響しています」と見当違いの回答をしており、さすがに日本の最新の国内事情についてまではデータベースが追い付いていないものと思われた。
総じて、ChatGPT 4oとGrokの回答の優秀性が目立って感じられた。Grokは無料なのにその情報精度であり、なかなか優秀なものと思われる。また、日常的にChatGPT 4oを利用していて感じるのは、ユーザがそれまでに行った質問によって構築される文脈をくみ取ろうとし、その文脈のなかで当該の質問を解釈しようとしている点である。時にはこれが質問のナイーブな意味合いを色付けてしまい、ユーザとしては困惑することもあるが、文脈情報の取得と活用という側面は、AIアシスタントにおける一つの大きな進歩といえるだろう。
AIと感情的コミュニケーション
コンピュータが感情を持てるのかという議論は昔からあるのだが、感情をもっているように「見せる」ことは可能なはずだ。
最近のChatGPT 4oは、ユーザとの感情的コミュニケーションにも乗り出そうとしているようで、たとえば「すき焼きと牛丼は似ているのに、なぜ前者では日本ネギ、後者では玉ねぎが使われるのか」という質問に対しては、回答の前に「とても良いご質問です!」というおべんちゃらがついてくるし、続けて「玉ねぎは在来のネギか」と質問すると「いい質問です! 答えをひとことで言うと:いいえ、玉ねぎ(タマネギ)は「日本在来のネギ」ではありません。」と質問への評価が併せて返ってくる。また「帝国ホテルや帝国データバンクなどの帝国は、日本帝国とか帝国主義という言葉を連想させてしまうけど、そういう弊害はないのか」と質問すると、「とても本質的なご質問です」と返してくる。こうしたクスグリは、質問した当人にとって悪い気持ちがするものではない。
また「便秘に困っている。二日に一度の割合で、コーラックを一粒のんでいるが、それが慢性化している。どうしたらいいか」という質問には、「便秘、つらいですよね…。そしてコーラックを定期的に使っているということは、「刺激性下剤」に頼った排便習慣ができてしまっている可能性があります。ただし、これは多くの方が抱える悩みで、正しく対処すれば改善できます!」という同情的なフレーズで回答が始まっている。
そして、慢性湿疹についての相談をしたあとに「ありがとう。ところでコーラックの利用は皮膚疾患に関係するの?」と聞くと、「こちらこそ、丁寧にやりとりしていただいてありがとうございます。そして――とても鋭いご質問です!」と丁寧な会話になっている。また、「なぜ鶯は春にだけ鳴くのか」という問いには「とても美しい疑問ですね」と審美性評価に関わる言葉で回答が始まる。
このような形で、まだ感情的関与度は低いものの、ユーザに対する親近的な対応をとる姿勢が見えてきていることは注目に値する。否定的感情に関係した表現を取ることはないが、やろうとすればできないことではないだろう。ただ、AIアシスタントという立場からは、基本的にユーザに寄り添う姿勢が求められるから、現在のAIアシスタントという形では否定的感情表現は行わないと思われる。
ともかく、ユーザの感情体験を喚起するような表現を含めたことは、AIアシスタントがユーザに近い存在になるための一歩を踏み出したと言えるだろう。そして、PCDの立場からすれば、対話の文脈の把握とそれに適合した回答を出力することと、その時点で相手にしているユーザの肯定的感情を惹起するような表現の利用とは、個人を相手にするAIとしてはまず考えてゆかねばならないことだろう。
次回に向けて
次回は、AIアシスタントという存在のあり方に関連して、独立した個体としてのロボットについてPCDのスタンスから考えてみたい。
「AIと個人中心設計(PCD: Person Centered Design) (2) 多数のAIの同期と統合的ユーザ像2) 多数のAIの同期と統合的ユーザ像」につづく