サマリー
合理的に選んだはずなのに、なぜ全員が損をするのか。囚人のジレンマを通じて、個人の合理性と社会の合理性が乖離する構造を解き明かし、協力を実現する条件を探ります。
この記事でわかること
- 囚人のジレンマが示す「合理的なのに損をする」パラドックス
- ナッシュ均衡と支配戦略──なぜ自白が選ばれるのか
- 繰り返しゲームで協力が生まれる3つの条件
- 価格競争や雑務分担など、日常に潜むジレンマの構造
- 単発か繰り返しかで戦略がどう変わるか
「正しい選択をしたはずなのに、なぜかうまくいかない」
自分の利益を最大化しようと考え、誰もが合理的に行動している。
なのに気づけば、全員が損をしている。
一体なぜこんなことが起きるのでしょうか。
実は、この不思議な現象には明確な構造があります。
それを解き明かすのが、ゲーム理論の古典的な問題「囚人のジレンマ」です。
この問題は、単なる思考実験ではありません。
私たちの日常、ビジネス、社会のあらゆる場面に潜んでいます。
そして、その構造を理解することで、「なぜ協力が難しいのか」「どうすれば協力を実現できるのか」が見えてくるのです。
合理的に選んだはずなのに、なぜ全員が損をするのか。
その謎を、解いていきましょう。
1. 囚人のジレンマ──合理的なのに損をするパラドックス
誰しもが、いつでも思い通りの選択ができるとは限りません。
たとえば、こんなシーンを考えてみましょう。
- 価格競争でライバル企業が値下げを始めたとき、自社も値下げに追随すべきか?
- 部署内で全員が残業をしているとき、自分だけ早く帰ることは許されるのか?
- マンションのゴミ捨て場が汚れているとき、自分だけが掃除する意味はあるのか?
ここでは、「相手がどう動くか」によって、自分の選択の合理性が変わってしまうのです。
あなたは、相手の行動を予測しながら選択を迫られた経験はありませんか?
このように、複数の意思決定者が相互に影響を与え合う状況を分析するのがゲーム理論です。
そして、その中でも最も有名で、最も重要な概念が「囚人のジレンマ」です。
これは、「お互いの選択が結果を左右する状況で、合理的に選んだはずなのに、結局みんなが損をしてしまう」という逆説を示しています。
囚人のジレンマの設定
ある犯罪で逮捕された2人の容疑者が、別々の部屋に隔離され、次のような条件を提示されます。
- もし両方が黙秘すれば、双方とも懲役1年
- もし一方が自白し、もう一方が黙秘すれば、自白した方は懲役0年、黙秘した方は懲役5年
- もし両方が自白すれば、双方とも懲役3年
合理的に考えるとどうなるか?
囚人Aの立場で考えてみましょう。
- 相手(囚人B)が黙秘するなら、自分が黙秘すると懲役1年、自白すれば懲役0年
- 相手(囚人B)が自白するなら、自分が黙秘すると懲役5年、自白すれば懲役3年
つまり、自白するほうが常に自分に有利です。相手がどう動こうと、自白した方が損をしない。これが合理的な判断です。
囚人Bも同じ推論をするため、両者とも自白を選び、結果として懲役3年+3年になる。
ところが、もし2人が協力して黙秘すれば、懲役1年+1年で済んだはずなのです。
この構造が示すのは、「合理的に選んだはずなのに、全体としては非効率になる」というパラドックスです。
2. ナッシュ均衡と繰り返しゲーム──協力を生む条件
囚人のジレンマが示したのは、「個人の合理性」と「社会の合理性」が乖離する構造でした。
では、なぜこのような結果になるのか、そして協力を実現する道はあるのでしょうか。
ナッシュ均衡──誰も動けない均衡点
囚人のジレンマで両者が「自白」を選ぶ理由は、それがナッシュ均衡だからです。
ナッシュ均衡とは、「誰も一方的に戦略を変えたくない状態」を指します。
つまり、相手の戦略が固定されているとき、自分だけが戦略を変えても得にならないという状態です。
囚人のジレンマでは「自白×自白」がナッシュ均衡になります。
- 相手が自白しているなら、自分が黙秘に変えても損をする(3年→5年)
- だから、誰も一方的に黙秘に変えようとしない
この均衡は安定していますが、効率的ではありません。
両者が黙秘すれば「1年+1年」という、より良い結果が得られるのに、そこに到達できないのです。
これが、ゲーム理論が示す現実です。合理的な個人が集まっても、自動的に最良の結果が生まれるわけではないのです。
支配戦略──相手がどう動こうと最適な選択
囚人のジレンマがナッシュ均衡に陥る理由は、「自白」が支配戦略だからです。
支配戦略とは、「相手がどう動こうと、自分にとって常に最適な選択」を指します。
- 相手が黙秘するなら、自分が自白した方が得(0年<1年)
- 相手が自白するなら、自分も自白した方が損が少ない(3年<5年)
つまり、相手の選択に関係なく、自白が常に合理的なのです。
だからこそ、両者が自白を選び、「3年+3年」という非効率な結果に落ち着いてしまいます。
黙秘が崩れる理由は次の3つにまとめることができます。
- 利得の非対称性: 相手が黙秘したときに自白すれば、最大利得が得られる
- 信頼の欠如: 相手の行動が見えないため、自白されるリスクを避ける動きが強まる
- 短期的合理性: 一回限りのゲームでは「自白」が合理的な結論になる
しかし、もしこのゲームを一度きりではなく繰り返すとしたらどうでしょうか。
将来の行動を見越した「戦略」が可能になります。
繰り返しゲーム:黙秘が芽生える条件
単発のゲームでは自白が優位ですが、繰り返しゲームでは話が変わります。
同じ相手と何度も対戦する場合、今回の自白は次回以降の信頼を失うことにつながります。
逆に、黙秘を続ければ相手も黙秘を返してくれる可能性が高まり、長期的には大きな利得を得られるのです。
代表的な戦略の一つがしっぺ返し戦略です。
- 最初は黙秘する
- 相手が黙秘すれば黙秘を続ける
- 相手が自白すれば、次のラウンドで自白し返す
つまり、「未来がある」と分かっている場面では、自白よりも黙秘の方が合理的になる場合があるのです。
繰り返しゲームの分析から、黙秘を実現するための条件が見えてきます。
- 関係の継続性: 一度きりではなく、繰り返される関係であること
- 将来の重要性: 短期的な利益よりも、長期的な利益を重視すること
- 行動の相互性: 相手の行動に応じて、自分も行動を変えられること
これらの条件が揃えば、自白のインセンティブは弱まり、黙秘が戦略的に合理的になります。
📖 協力を生むしくみの設計:インセンティブ設計:人を動かす「しくみ」の作り方
3. ジレンマは身近に潜んでいる──個人から市場まで
ゲーム理論は、実際に日常やビジネスに繰り返し現れる構造です。
① 個人・チームのジレンマ:雑務は誰がやる?
職場で共有される雑務(コピー用紙の補充、会議室の片付け、事務所の清掃など)は、典型的な「公共財」の問題です。
- 全員の利益: 誰かが雑務をやれば、チーム全体が快適・効率的に動ける
- 個人の損得: やった人だけが時間を失い、直接的な評価につながらない
だからこそ、「自分はやらなくてもいいだろう」と考える人が増え、結果的に誰もやらない。
これはまさに囚人のジレンマの構造です。
個人の最適(自分はやらない)と、集団の最適(みんなが少しずつやる)が乖離している。
そのために、全体最適が実現しないのです。
この構造は経済学で「フリーライダー問題」とも呼ばれ、公共サービスなどで繰り返し観察されます。
雑務の「あるある」は、実は経済学的な構造を映しているのです。
② 企業・市場のジレンマ:価格競争の落とし穴
企業レベルになると、このジレンマは「競争の過剰」として現れます。
- 各企業の合理的行動: 「自社だけ価格を下げれば、市場シェアを拡大できる」
- 市場全体の帰結: ライバルも同じ戦略を選ぶため、最終的に価格は下がり続け、利益率は崩壊する
これが典型的な「価格競争のジレンマ」です。
航空業界や家電業界では実際にこの現象が起きることがあります。
安くなるのは消費者にとって良いことです。
しかし、業界全体の収益性は下がり、「サービス水準が維持できなくなる」といった副作用が現れます。
さらに、広告戦争でも同じ構造が起こります。
「自社だけ広告を出せば目立つ」という合理的な判断が、全社による過剰な広告を生み出します。
結果として広告効果が逓減し、投入したコストの割に成果が出ない状態に陥るのです。
「短期的な自分の得」を優先すると、「長期的に全体の損」へつながります。
そして皮肉なことに、個々人は自分の行動を合理的だと思っているかもしれません。
だからこそ、囚人のジレンマは単なる寓話ではなく、経済現象の裏側を解き明かす強力なフレームワークと言えるでしょう。
📖 構造のズレ:モラルハザード:「構造のズレ」が行動を歪ませる
4. 「単発」か「繰り返し」か──関係性が戦略を変える
ここまで見てきたように、囚人のジレンマの結末は「一回きり」か「繰り返し」かで大きく変わります。
そして、私たちの身の回りの関係性は、思いのほか長期で、繰り返されるものばかりです。
単発の関係:自白の誘惑が強まる場面
囚人のジレンマを一度だけするなら、「自白」が支配戦略になります。
なぜなら、相手が黙秘しても自白しても、自分にとっては自白する方が得だからです。
- 一度きりの取引
- 短期アルバイト
- 観光地の飲食店
こうした場面では、裏切りの誘惑が強まります。
つまり、「手抜き」が起こる原因となるのです。自分の利得を最大化しようとする動機が働くためです。
この状況で互いの利得を最適化するには、制度・契約・罰則といった仕組みが必要になります。
これらは「一回きりでも協力せざるを得ない状況」を人工的に作る仕組みです。
繰り返しの関係:協力が合理的になる場面
一方で、もしその関係が繰り返されるなら話は変わります。
同じ相手と繰り返し取引をする場合、裏切りはすぐにしっぺ返しを食らいます。
逆に言えば、誠実な協力は信頼を積み上げ、やがて自分に大きな利益を返してくれるのです。
つまり「長期的な利益」を考えるなら、裏切りより協力の方が合理的になります。
ここに、信頼・信用・ブランドといった社会資本の価値が生まれるのです。
実際のビジネス関係やチームワークは、この「繰り返しゲーム」に近い構造を持っています。
だからこそ、誠実さや透明性が強力なインセンティブとして働くのです。
身の回りは「繰り返し」だらけ
私たちの身の回りの関係性は、長期で繰り返されるものばかりです。
- 職場・仕事: 協力しなければ、自分の業務に影響する
- 近所・地域: わだかまりがあると、顔を合わせる度に気まずくなる
- 家族・友人: 裏切ったら、次の集まる機会に響く
- SNS: 一度やらかすと、履歴が残り続ける
一見、単発に思える出会いや関係性も、意外なところで再びつながり、積み重なっていきます。
つまり人間関係は、想像以上に長期戦なのです。
それなのに、つい「今回だけ得すればいいや」という思考にハマる。
そんな裏切りや小さな得逃げのコスパは、思っている以上に悪いのかもしれません。
見極めが合理的な選択を生む
だからこそ、意思決定の際に問わなければなりません。
- これは単発の関係か?
- それとも繰り返される関係か?
もし単発なら、制度やルールで協力を担保する。繰り返しなら、信頼や誠実さを土台に協力を築く。
この見極めを誤ると、「短期の得」に惑わされて「長期の損」を背負い込みます。
ここを正しく見抜けば、自分にとっても相手にとっても、そして社会にとっても持続的に最適な選択ができるはずです。
📖 任せることと守ることのバランス:比較優位:自立のコストと依存のリスク
まとめ:「合理的な個人」から「合理的な関係性」へ
「合理的な個人」が集まっても、自動的に「合理的な社会」が生まれるわけではないのが現実です。
囚人のジレンマは、その構造を最もシンプルに示しています。
各自が自分にとって最適な選択をしているにもかかわらず、全体としては非効率な結果に陥る。
これは単なる思考実験ではなく、私たちの日常やビジネスに繰り返し現れる構造です。
この構造は、価格競争、環境問題、公共財の管理など、あらゆる場面に潜んでいます。
「自分だけ得をしよう」という短期的な合理性が、長期的には全員の損失につながるのです。
しかし、ゲーム理論は不条理を示すだけではありません。協力を実現する道も示してくれます。
その鍵は関係性の継続です。
一回きりの関係では、裏切りが合理的になります。
しかし、同じ相手と繰り返し関わる場合、今日の裏切りは明日の信頼を失うことにつながります。
逆に、誠実な協力は信頼を積み上げ、やがて自分に大きな利益を返してくれるのです。
つまり、長期的な視点を持つことで、協力が戦略的にも合理的になるのです。
職場での誠実さ、長期的な関係構築、地域社会での協力。これらはすべて、「繰り返しゲーム」の構造の中で価値を発揮します。
- これは単発の関係か、それとも繰り返される関係か?
- 短期的な利益を優先すべきか、長期的な信頼を築くべきか?
すべてを一人でこなすことが、ほぼ不可能な現代社会において、重要な問いかもしれません。
ここを正しく見極めることで、持続的で最適な選択ができるはずです。
囚人のジレンマは、「合理的なのに損をする」という逆説を示しました。
しかし同時に、「合理的だからこそ協力できる」という希望も含んでいます。
問題は「合理性」そのものではなく、「どの時間軸で合理性を考えるか」なのかもしれません。
📖もう一つのゲーム理論:優しいけれど舐められない:タカとハトのゲーム理論
学んだこと
- 囚人のジレンマ: 各自が合理的に選んでいるのに、全体としては非効率な結果に陥るパラドックス
- ナッシュ均衡と支配戦略: 誰も一方的に戦略を変えたくない均衡点。囚人のジレンマでは「自白」が支配戦略となり、安定だが非効率な均衡に陥る
- 繰り返しゲームの力: 同じ相手と繰り返し関わる場合、今日の裏切りは明日の信頼を失う。長期的視点では協力が合理的になる
- 協力を実現する条件: 関係の継続性、将来の重要性、行動の相互性。これらが揃えば協力が戦略的に合理的になる
- 日常に潜むジレンマ: 価格競争、雑務の分担、広告戦争など、身の回りの多くの場面が囚人のジレンマの構造を持つ
- 時間軸が戦略を変える: 問題は「合理性」そのものではなく、「どの時間軸で合理性を考えるか」。単発か繰り返しかの見極めが重要

