问答题 传统的囚徒困境的报酬矩阵是:
 
不坦白 坦 白
不坦白 -3,-3 -15,-1
坦 白 -1,-15 -10,-10

   如果犯罪组织有着严格的惩罚制度,任何一个罪犯坦白后,不论坦白的事情严重与否,犯罪组织一定会杀人灭口,并且总是能迅速做到,那新的报酬矩阵是什么?会不会有新的优势策略均衡?
【正确答案】由于坦白后将被灭口,所以收益将是-∞。新的报酬矩阵是
 
不坦白 坦 白
不坦白 -3,-3 -15,-∞
坦 白 -∞,-15 -∞,-∞

   在乙不坦白的情况下,甲最好是不坦白:在乙坦白的情况下,因为被判刑15年总比死去要好,甲最好也是不坦白,所以甲会选择不坦白。同理,无论甲如何选择,乙的最好选择也是不坦白。结果双方都选择不坦白,这是新的优势策略均衡,各自被判刑3年。
【答案解析】