囚犯悖论
阐明纳什平衡概念
囚犯悖论(prisoner dilemma)是阐明纳什平衡概念的一个例子。
设两名囚犯嫌涉参与某罪行而受审.他们商定合作顽抗,但被告知以下政策:若两人均招认(不合作,决策O),则罪名成立,各判刑五年;若有一个招认(决策D)而另一人顽抗(决策 C),则招认者立功释放,而顽抗者罪名成立,重判十年.但若两人均顽抗(决策C),则可能由于证据不足而只能各轻判一年.以上各可能性可以用支付矩阵描述如下表.
这个例子的纳什平衡解是(一5,一5),而合作最优解为(-1,-1),直观地说明了各人均用其优超决策D将导致较坏的结果,从而指出了纳什平衡的意义和缺陷.
参考资料
最新修订时间:2023-08-17 13:08
目录
概述
参考资料