ChatGPTによる認知バイアスエラー回避の可能性

Posted on
essay cognitive psychology Daniel Kahneman

はじめに

随分前の話しなりますが(今から約7年前)、会社の先輩から 「頭脳明瞭な経営者(経営委員会)が、時に非合理な判断の結果、失敗するケースへの理解になるかもしれない」 と薦めてもらった面白い本があります。

タニエル・カーネマン著「ファスト&スロー

img1

本書は、ノーベル経済学賞を受賞されたダニエル・カーネマン氏による著作で、人間の思考が2つの異なるシステムに分かれていることを示しています。 システム1(ファスト)は、自動的かつ直感的な思考を司り、短時間での判断や反応に適しています。しかし、時には感情的な判断を引き起こし、誤った結論に至ることもあります。 一方、システム2(スロー)は、論理的で分析的な思考を司り、より長い時間をかけて問題に取り組むことができます。 このシステムは、より正確な判断や意思決定をするために必要ですが、人間の認知的負荷が高く、エネルギーを消費するため、継続的な使用は困難です。

さて、冒頭の「問い」に戻りますが、経営判断などは論理的で分析的な思考を司る「システム2」を使うのが適します。一方、残念ながら、 人間の思考の特性として「システム2」を使う事は難しく、(楽して?)「システム1」の判断に従った結果、合理的でない判断を下す事もある、というのが 本書で述べられている回答になります。

本書を読んで以降、私は世の中の見方が大きく変わりました!行動経済学、心理学、そして認知科学に興味のある方は、非常に貴重な情報源 となること間違いないので、是非手に取ってみて下さい。

あまりに面白かったため、当時簡単な書籍紹介をしたのを覚えています。その時に使った紹介資料がまだ手元にありましたので、 後述「付録」に載せました。興味ある方は、そちらもご参考になさって下さい。

本題

先日、片道2時間の出張の際、時間もあるので「少し骨太な本でも読もうかしら」とこの本をカバンに携え、数年ぶりに読み直してみて、 ふと思いついた事がありましたので(タイトルの件)、以下、書き残しておきたいと思います。

(7年前の)当時、書籍紹介の場で、「人間は元来システム2を使う事が不得意なので、プロジェクトなど重要な判断を有する 事案があった時には、非合理な判断(ミス)を回避するために(著者のお勧め通りに)「死亡前死因分析」(※)が有効です」と紹介しました。 その時参加者の方から 「集合知(プログラミング)」という手法もあるので、うまく活用できない?」 とコメントを頂いたのを覚えています。

指摘者の方が「集合知」というキーワードを出した理由ですが、私が話の中で「人間(の思考)が合理性を欠く原因の一つに、 (特に複雑に多くの要素が絡みあう)統計的な事実を適切に扱うことが苦手であるから」と説明したのを受けて、 指摘者の方は、であれば「集合知」と統計をうまく活用する事で、複雑な事実関係の統計的な計算部分を(人間の思考から)コンピュータへオフロード できるのでは?と考えられたのではないかと想像しています。

今回揺れる電車の中で、ふと次のことが脳裏に浮かび、記事を残しておこうと思った次第でした:

「最近流行りの生成系AI(ex. chatGPT)は、集合知を利用したらいいのではという当時の指摘を具現化したものではないだろうか?」 今であれば、(当時、バイアス回避のためにカーネマン氏も推奨している「死亡前死因分析」より)「chatGPTに相談」を推奨できるのではないか?

では早速、試してみましょう。

(※)死亡前死因分析とは、プロジェクトや計画において、事前に失敗要因や問題点を特定するための分析手法の一つです。 具体的には、あたかもプロジェクトが失敗した場合の原因を探るかのように、事前にシナリオを考え、問題の発生要因を洗い出すことで、 失敗リスクを事前に軽減することを目的とします。

非合理な判断しやすい事例(問題)

人間の直感的な思考が統計的な事実を無視しやすい事例として、書籍には次の例が挙げられています:

夜、1 台のタクシーがひき逃げをしました。この市では、緑タクシーと青タクシーの 2 社が営業しています。
事件とタクシー会社については、次の情報が与えられています。
・市内を走るタクシーの 85%は緑タクシーで、15%が青タクシーである。
・目撃者は、タクシーが青だったと証言している。裁判所は、事件当夜と同じ状況で目撃者の信頼性をテストした結果、
この目撃者は青か緑かを 80%の頻度で正しく識別し、20%の頻度でまちがえた。
では、ひき逃げをしたのが青タクシーである確率は何%でしょうか?
(第16章「原因と統計-驚くべき事実と驚くべき事例」)

書籍によると、この問題を出された被験者の大勢は、バイアスにより直感的に「80%」と答えた、とのことです。実際は、母集団に関する 「緑色が85%」という情報が無視してはならないキーであり、統計的に処理すれば「41%」が答えなのでありますが、人間は得てして 「緑色が85%」を直感的にはどう使っていいかわからず(合理的判断の材料から)無視されがちというバイアスの例であるそうです。

そこで、chatGPTは、この問いに対してどのような回答を生成するのか、少し試してみたいと思います。

ChatGPTによる実験

正解例

chatGPTは、英語の学習データで訓練されているため、英語で質問するのが良いとも言われています。そこで、英語文面で問合せしています。 どうやら正しく回答しているようです^^。

img2

不正解例

現地点ではchatGPTも発展途上ということもあり、 「問合せ(文)の仕方」やタイミングにより、正しい答えが得られないケースもあるので注意が必要です。即ち、適切な「問い」を投げかける事と、 回答の妥当性を正しく評価する事が必要(重要)となります。

以下、不正解のサンプル回答を眺めてみます。

同じ文面です、ロジックは正しいようですが、計算ミスしています。「0.8 * 0.15 + 0.2 * 0.85 = 0.29」ですね。。。

img3

日本語でも試してみました。ロジックは正しそうですが、こちらも計算ミスしております。。。

img4

結論

書籍「ファスト&スロー」にある、人間が直感的には正しい回答を導き出しづらい一つのサンプル問題を、chatGPTに問いかけてみました。 chatGPTの回答は、(人間の直感的な非合理回答と比べ)統計事実を正しく考慮した合理的なものである点が確認できました。一方、現地点では、 「問合せ(文)の仕方」やタイミングにより、正しい答えが得られないケースもあることを確認できました。従って、chatGPT利用には適切な 「問い」を投げかける事と、回答の妥当性を正しく評価する事が大事だという点も合せて確認できました。

追伸

最近、近所の本屋を探索していると、リチャード・セイラー氏、キャス・サンスティーン氏による「NUDGE 実践 行動経済学 完全版」 という書籍が目に留まりました。早速購入し、パラパラと眺めてみたところ、ウェルビーングの達成に「選択アーキテクト(※)」が 関与していく世界観が述べられていました。この時、chatGPTのような生成系AIが、強力なサポーターになるのではと感じました。

(※)選択アーキテクトは、行動経済学において、人々が意思決定を行う際の環境や枠組みを設計する人のことを指します。 例えば、商品を陳列する店員や、ウェブサイトのUIを設計するデザイナー、保険や退職金のプランを提供する企業の担当者などが、 選択アーキテクトの役割を担うようです。

付録1 GPT-4での実験

2022.5.14更新。GPT-4は、より長い問合せや会話を処理でき、事実の誤りが少ないと聞きました。そこで、2023.4.21にTwitter上で Perplexity AI(※)というサービスが、拡張モードでGPT-4をサポートしていると知り、 早速試してみました。3回同じ文面で問合せた結果、いずれも正しく回答してくれました。ただし、Perplexity AIが提示している 参考サイトを見ると、この問合せ(問題)自体が有名なものであるため (→例えばこちら)、あらゆる集合知をAIエンジンが 適して回答してくれたか、本当に認知バイアスによる判断エラー回避の救世主となるか、この問いだけでは判断しかねる、もっと使いこなし てみないと実力値は分からない、ということが分かりました。

※Perplexity AIは、情報の元ソース(や出典)を明記してくれるため、内容の正確さの評価もしやすいといったメリットがあります。

付録2 書籍「ファスト&スロー」書籍紹介

以前、書籍紹介に使った資料を共有します。

slide1
slide2
slide3
slide4
slide5
slide6
slide7
slide8
slide9
slide10
slide11
slide12
slide13
slide14
slide15
slide16
slide17
slide18
slide19

参考文献

  1. Daniel Kahneman, Thinking, Fast and Slow (1st edition), New York:Farrar, Straus and Giroux (2011).
  2. Dan Ariely , Predictably Irrational: The Hidden Forces That Shape Our Decisions, New York: Harper Perennia, 2010.
  3. 池田 信夫, 『イノベーションとは何か』,東洋経済新報社, 2011.
  4. ルディー和子, 『合理的なのに愚かな戦略』, 2014.
  5. 友野 典男, 『行動経済学; 経済は「感情」で動いている』, 2006.
  6. Johnson, Eric J., and Daniel G. Goldstein. “Defaults and donation decisions.“Transplantation 78.12 (2004): 1713-1716.
  7. Ian Ayres , Super Crunchers: Why Thinking-By-Numbers is the New Way To Be Smart, New York: Bantam Dell, 2007.

お勧めTED