囚人のジレンマ：個人の合理性から社会の合理性へ

サマリー

合理的に選んだはずなのに、なぜ全員が損をするのか。囚人のジレンマを通じて、個人の合理性と社会の合理性が乖離する構造を解き明かし、協力を実現する条件を探ります。

この記事でわかること

囚人のジレンマが示す「合理的なのに損をする」パラドックス

ナッシュ均衡と支配戦略──なぜ自白が選ばれるのか

繰り返しゲームで協力が生まれる3つの条件

価格競争や雑務分担など、日常に潜むジレンマの構造

単発か繰り返しかで戦略がどう変わるか

「正しい選択をしたはずなのに、なぜかうまくいかない」

自分の利益を最大化しようと考え、誰もが合理的に行動している。
なのに気づけば、全員が損をしている。
一体なぜこんなことが起きるのでしょうか。

実は、この不思議な現象には明確な構造があります。
それを解き明かすのが、ゲーム理論の古典的な問題「囚人のジレンマ」です。

この問題は、単なる思考実験ではありません。
私たちの日常、ビジネス、社会のあらゆる場面に潜んでいます。
そして、その構造を理解することで、「なぜ協力が難しいのか」「どうすれば協力を実現できるのか」が見えてくるのです。

合理的に選んだはずなのに、なぜ全員が損をするのか。
その謎を、解いていきましょう。

1. 囚人のジレンマ──合理的なのに損をするパラドックス
1. 囚人のジレンマの設定
2. 合理的に考えるとどうなるか？
2. ナッシュ均衡と繰り返しゲーム──協力を生む条件
3. ジレンマは身近に潜んでいる──個人から市場まで
1. ① 個人・チームのジレンマ：雑務は誰がやる？
2. ② 企業・市場のジレンマ：価格競争の落とし穴
4. 「単発」か「繰り返し」か──関係性が戦略を変える
まとめ：「合理的な個人」から「合理的な関係性」へ
学んだこと

1. 囚人のジレンマ──合理的なのに損をするパラドックス

誰しもが、いつでも思い通りの選択ができるとは限りません。
たとえば、こんなシーンを考えてみましょう。

価格競争でライバル企業が値下げを始めたとき、自社も値下げに追随すべきか？
部署内で全員が残業をしているとき、自分だけ早く帰ることは許されるのか？
マンションのゴミ捨て場が汚れているとき、自分だけが掃除する意味はあるのか？

ここでは、「相手がどう動くか」によって、自分の選択の合理性が変わってしまうのです。

あなたは、相手の行動を予測しながら選択を迫られた経験はありませんか？

このように、複数の意思決定者が相互に影響を与え合う状況を分析するのがゲーム理論です。
そして、その中でも最も有名で、最も重要な概念が「囚人のジレンマ」です。

これは、「お互いの選択が結果を左右する状況で、合理的に選んだはずなのに、結局みんなが損をしてしまう」という逆説を示しています。

囚人のジレンマの設定

ある犯罪で逮捕された2人の容疑者が、別々の部屋に隔離され、次のような条件を提示されます。

もし両方が黙秘すれば、双方とも懲役1年
もし一方が自白し、もう一方が黙秘すれば、自白した方は懲役0年、黙秘した方は懲役5年
もし両方が自白すれば、双方とも懲役3年

合理的に考えるとどうなるか？

囚人Aの立場で考えてみましょう。

相手（囚人B）が黙秘するなら、自分が黙秘すると懲役1年、自白すれば懲役0年
相手（囚人B）が自白するなら、自分が黙秘すると懲役5年、自白すれば懲役3年

つまり、自白するほうが常に自分に有利です。相手がどう動こうと、自白した方が損をしない。これが合理的な判断です。

囚人Bも同じ推論をするため、両者とも自白を選び、結果として懲役3年＋3年になる。
ところが、もし2人が協力して黙秘すれば、懲役1年＋1年で済んだはずなのです。

この構造が示すのは、「合理的に選んだはずなのに、全体としては非効率になる」というパラドックスです。

2. ナッシュ均衡と繰り返しゲーム──協力を生む条件

囚人のジレンマが示したのは、「個人の合理性」と「社会の合理性」が乖離する構造でした。
では、なぜこのような結果になるのか、そして協力を実現する道はあるのでしょうか。

ナッシュ均衡──誰も動けない均衡点

囚人のジレンマで両者が「自白」を選ぶ理由は、それがナッシュ均衡だからです。

ナッシュ均衡とは、「誰も一方的に戦略を変えたくない状態」を指します。
つまり、相手の戦略が固定されているとき、自分だけが戦略を変えても得にならないという状態です。

囚人のジレンマでは「自白×自白」がナッシュ均衡になります。

相手が自白しているなら、自分が黙秘に変えても損をする（3年→5年）
だから、誰も一方的に黙秘に変えようとしない

この均衡は安定していますが、効率的ではありません。
両者が黙秘すれば「1年+1年」という、より良い結果が得られるのに、そこに到達できないのです。

これが、ゲーム理論が示す現実です。合理的な個人が集まっても、自動的に最良の結果が生まれるわけではないのです。

支配戦略──相手がどう動こうと最適な選択

囚人のジレンマがナッシュ均衡に陥る理由は、「自白」が支配戦略だからです。

支配戦略とは、「相手がどう動こうと、自分にとって常に最適な選択」を指します。

相手が黙秘するなら、自分が自白した方が得（0年＜1年）
相手が自白するなら、自分も自白した方が損が少ない（3年＜5年）

つまり、相手の選択に関係なく、自白が常に合理的なのです。
だからこそ、両者が自白を選び、「3年+3年」という非効率な結果に落ち着いてしまいます。

黙秘が崩れる理由は次の3つにまとめることができます。

利得の非対称性: 相手が黙秘したときに自白すれば、最大利得が得られる
信頼の欠如: 相手の行動が見えないため、自白されるリスクを避ける動きが強まる
短期的合理性: 一回限りのゲームでは「自白」が合理的な結論になる

しかし、もしこのゲームを一度きりではなく繰り返すとしたらどうでしょうか。
将来の行動を見越した「戦略」が可能になります。

繰り返しゲーム：黙秘が芽生える条件

単発のゲームでは自白が優位ですが、繰り返しゲームでは話が変わります。

同じ相手と何度も対戦する場合、今回の自白は次回以降の信頼を失うことにつながります。
逆に、黙秘を続ければ相手も黙秘を返してくれる可能性が高まり、長期的には大きな利得を得られるのです。

代表的な戦略の一つがしっぺ返し戦略です。

最初は黙秘する
相手が黙秘すれば黙秘を続ける
相手が自白すれば、次のラウンドで自白し返す

つまり、「未来がある」と分かっている場面では、自白よりも黙秘の方が合理的になる場合があるのです。
繰り返しゲームの分析から、黙秘を実現するための条件が見えてきます。

関係の継続性: 一度きりではなく、繰り返される関係であること
将来の重要性: 短期的な利益よりも、長期的な利益を重視すること
行動の相互性: 相手の行動に応じて、自分も行動を変えられること

これらの条件が揃えば、自白のインセンティブは弱まり、黙秘が戦略的に合理的になります。

📖 協力を生むしくみの設計：インセンティブ設計：人を動かす「しくみ」の作り方

3. ジレンマは身近に潜んでいる──個人から市場まで

ゲーム理論は、実際に日常やビジネスに繰り返し現れる構造です。

① 個人・チームのジレンマ：雑務は誰がやる？

職場で共有される雑務（コピー用紙の補充、会議室の片付け、事務所の清掃など）は、典型的な「公共財」の問題です。

全員の利益: 誰かが雑務をやれば、チーム全体が快適・効率的に動ける
個人の損得: やった人だけが時間を失い、直接的な評価につながらない

だからこそ、「自分はやらなくてもいいだろう」と考える人が増え、結果的に誰もやらない。

これはまさに囚人のジレンマの構造です。
個人の最適（自分はやらない）と、集団の最適（みんなが少しずつやる）が乖離している。
そのために、全体最適が実現しないのです。

この構造は経済学で「フリーライダー問題」とも呼ばれ、公共サービスなどで繰り返し観察されます。
雑務の「あるある」は、実は経済学的な構造を映しているのです。

② 企業・市場のジレンマ：価格競争の落とし穴

企業レベルになると、このジレンマは「競争の過剰」として現れます。

各企業の合理的行動: 「自社だけ価格を下げれば、市場シェアを拡大できる」
市場全体の帰結: ライバルも同じ戦略を選ぶため、最終的に価格は下がり続け、利益率は崩壊する

これが典型的な「価格競争のジレンマ」です。
航空業界や家電業界では実際にこの現象が起きることがあります。
安くなるのは消費者にとって良いことです。
しかし、業界全体の収益性は下がり、「サービス水準が維持できなくなる」といった副作用が現れます。

さらに、広告戦争でも同じ構造が起こります。
「自社だけ広告を出せば目立つ」という合理的な判断が、全社による過剰な広告を生み出します。
結果として広告効果が逓減し、投入したコストの割に成果が出ない状態に陥るのです。

「短期的な自分の得」を優先すると、「長期的に全体の損」へつながります。
そして皮肉なことに、個々人は自分の行動を合理的だと思っているかもしれません。

だからこそ、囚人のジレンマは単なる寓話ではなく、経済現象の裏側を解き明かす強力なフレームワークと言えるでしょう。

📖 構造のズレ：モラルハザード：「構造のズレ」が行動を歪ませる

4. 「単発」か「繰り返し」か──関係性が戦略を変える

ここまで見てきたように、囚人のジレンマの結末は「一回きり」か「繰り返し」かで大きく変わります。
そして、私たちの身の回りの関係性は、思いのほか長期で、繰り返されるものばかりです。

単発の関係：自白の誘惑が強まる場面

囚人のジレンマを一度だけするなら、「自白」が支配戦略になります。
なぜなら、相手が黙秘しても自白しても、自分にとっては自白する方が得だからです。

一度きりの取引
短期アルバイト
観光地の飲食店

こうした場面では、裏切りの誘惑が強まります。
つまり、「手抜き」が起こる原因となるのです。自分の利得を最大化しようとする動機が働くためです。

この状況で互いの利得を最適化するには、制度・契約・罰則といった仕組みが必要になります。
これらは「一回きりでも協力せざるを得ない状況」を人工的に作る仕組みです。

繰り返しの関係：協力が合理的になる場面

一方で、もしその関係が繰り返されるなら話は変わります。
同じ相手と繰り返し取引をする場合、裏切りはすぐにしっぺ返しを食らいます。
逆に言えば、誠実な協力は信頼を積み上げ、やがて自分に大きな利益を返してくれるのです。

つまり「長期的な利益」を考えるなら、裏切りより協力の方が合理的になります。
ここに、信頼・信用・ブランドといった社会資本の価値が生まれるのです。

実際のビジネス関係やチームワークは、この「繰り返しゲーム」に近い構造を持っています。
だからこそ、誠実さや透明性が強力なインセンティブとして働くのです。

身の回りは「繰り返し」だらけ

私たちの身の回りの関係性は、長期で繰り返されるものばかりです。

職場・仕事: 協力しなければ、自分の業務に影響する
近所・地域: わだかまりがあると、顔を合わせる度に気まずくなる
家族・友人: 裏切ったら、次の集まる機会に響く
SNS: 一度やらかすと、履歴が残り続ける

一見、単発に思える出会いや関係性も、意外なところで再びつながり、積み重なっていきます。
つまり人間関係は、想像以上に長期戦なのです。

それなのに、つい「今回だけ得すればいいや」という思考にハマる。
そんな裏切りや小さな得逃げのコスパは、思っている以上に悪いのかもしれません。

見極めが合理的な選択を生む

だからこそ、意思決定の際に問わなければなりません。

これは単発の関係か？
それとも繰り返される関係か？

もし単発なら、制度やルールで協力を担保する。繰り返しなら、信頼や誠実さを土台に協力を築く。

この見極めを誤ると、「短期の得」に惑わされて「長期の損」を背負い込みます。
ここを正しく見抜けば、自分にとっても相手にとっても、そして社会にとっても持続的に最適な選択ができるはずです。

📖 任せることと守ることのバランス：比較優位：自立のコストと依存のリスク

まとめ：「合理的な個人」から「合理的な関係性」へ

「合理的な個人」が集まっても、自動的に「合理的な社会」が生まれるわけではないのが現実です。

囚人のジレンマは、その構造を最もシンプルに示しています。
各自が自分にとって最適な選択をしているにもかかわらず、全体としては非効率な結果に陥る。
これは単なる思考実験ではなく、私たちの日常やビジネスに繰り返し現れる構造です。

この構造は、価格競争、環境問題、公共財の管理など、あらゆる場面に潜んでいます。
「自分だけ得をしよう」という短期的な合理性が、長期的には全員の損失につながるのです。

しかし、ゲーム理論は不条理を示すだけではありません。協力を実現する道も示してくれます。

その鍵は関係性の継続です。

一回きりの関係では、裏切りが合理的になります。
しかし、同じ相手と繰り返し関わる場合、今日の裏切りは明日の信頼を失うことにつながります。
逆に、誠実な協力は信頼を積み上げ、やがて自分に大きな利益を返してくれるのです。

つまり、長期的な視点を持つことで、協力が戦略的にも合理的になるのです。
職場での誠実さ、長期的な関係構築、地域社会での協力。これらはすべて、「繰り返しゲーム」の構造の中で価値を発揮します。

これは単発の関係か、それとも繰り返される関係か？
短期的な利益を優先すべきか、長期的な信頼を築くべきか？

すべてを一人でこなすことが、ほぼ不可能な現代社会において、重要な問いかもしれません。
ここを正しく見極めることで、持続的で最適な選択ができるはずです。

囚人のジレンマは、「合理的なのに損をする」という逆説を示しました。
しかし同時に、「合理的だからこそ協力できる」という希望も含んでいます。

問題は「合理性」そのものではなく、「どの時間軸で合理性を考えるか」なのかもしれません。

📖もう一つのゲーム理論：優しいけれど舐められない：タカとハトのゲーム理論

学んだこと

囚人のジレンマ: 各自が合理的に選んでいるのに、全体としては非効率な結果に陥るパラドックス
ナッシュ均衡と支配戦略: 誰も一方的に戦略を変えたくない均衡点。囚人のジレンマでは「自白」が支配戦略となり、安定だが非効率な均衡に陥る
繰り返しゲームの力: 同じ相手と繰り返し関わる場合、今日の裏切りは明日の信頼を失う。長期的視点では協力が合理的になる
協力を実現する条件: 関係の継続性、将来の重要性、行動の相互性。これらが揃えば協力が戦略的に合理的になる
日常に潜むジレンマ: 価格競争、雑務の分担、広告戦争など、身の回りの多くの場面が囚人のジレンマの構造を持つ
時間軸が戦略を変える: 問題は「合理性」そのものではなく、「どの時間軸で合理性を考えるか」。単発か繰り返しかの見極めが重要