问答题
传统的囚徒困境的报酬矩阵是:
乙
不坦白
坦 白
甲
不坦白
-3,-3
-15,-1
坦 白
-1,-15
-10,-10
如果犯罪组织有着严格的惩罚制度,任何一个罪犯坦白后,不论坦白的事情严重与否,犯罪组织一定会杀人灭口,并且总是能迅速做到,那新的报酬矩阵是什么?会不会有新的优势策略均衡?
【正确答案】
由于坦白后将被灭口,所以收益将是-∞。新的报酬矩阵是
乙
不坦白
坦 白
甲
不坦白
-3,-3
-15,-∞
坦 白
-∞,-15
-∞,-∞
在乙不坦白的情况下,甲最好是不坦白:在乙坦白的情况下,因为被判刑15年总比死去要好,甲最好也是不坦白,所以甲会选择不坦白。同理,无论甲如何选择,乙的最好选择也是不坦白。结果双方都选择不坦白,这是新的优势策略均衡,各自被判刑3年。
【答案解析】
提交答案
关闭