从游戏理论看人类社会
迄今为止的全部经济学都假定:个人总是在最大化自己的效用(UTILITY),换句话说:“人不为己,天诛地灭”。为了以此为根据得到有意义的解,在数学上必须假定这个效用函数是‘理性’的。所谓理性的意思就是如果一样东西公认是‘好的’,那么你得到的越多你的效用就应该越大;反之你的效用就应该越小。
让我们来看一看最简单的游戏:犯人悖论。两个犯人A和B面临检控,根据他们所做的不同选择,两个人将会得到不同的刑期。在下面的表格里,括号中的两个数字前一个是A的刑期,后一个是B的刑期。例如(8,0)表示如果A否认而B认罪,那么A将获罪8年而B将立刻释放。假定A与B事先并不知道对方的选择。
┏━━━━━┯━━━━━━━┯━━━━━━━┓
┃ │ A否认 │ A认罪 ┃
┠─────┼───────┼───────┨
┃ B否认 │ (1,1) │ (0,8) ┃
┠─────┼───────┼───────┨
┃ B认罪 │ (8,0) │ (4,4) ┃
┗━━━━━┷━━━━━━━┷━━━━━━━┛
在这种情况下,A应该如何选择呢?我们可以推理如下:如果B否认(对应上表第二行),那么A若认罪将立刻释放,A若否认将入狱1年,显然A的最佳选择是认罪;如果B认罪(对应上表第三行),那么A若认罪将入狱4年,A若否认将入狱8年,因此A的最佳选择仍然是认罪。根据此推理,无论B作何选择,A都应该认罪,同样,B也应该得到相同的结论。结果就是‘聪明的’A和B都将选择认罪而同时获罪4年,错过了显然的最优结果(1,1)。
这个游戏的结论就是,如果假定“人不为己,天诛地灭”,那么人类就只能存在次优资源分配中。让我们把上述游戏一般化一下:
┏━━━━━┯━━━━━━━━━┯━━━━━━━━━┓
┃ │ A温和 │ A强硬 ┃
┠─────┼─────────┼─────────┨
┃ B温和 │ (赢,赢) │ (赢多,输多) ┃
┠─────┼─────────┼─────────┨
┃ B强硬 │ (输多,赢多) │ (输,输) ┃
┗━━━━━┷━━━━━━━━━┷━━━━━━━━━┛
这个游戏和犯人悖论的解是一样的:无论是A还是B,在‘最大化’自己效用的名义下,不约而同地选择了强硬,从而落入双输的圈套。
我们注意到,上面这个游戏还有一个隐藏的假定,那就是假定A与B是对等的,因此输赢的结果是对称的。我们进一步一般化:假定A和B是不对称的,比如A是Microsoft,B是Netscape,又会看到怎样的结果呢?
┏━━━━━┯━━━━━━━━━┯━━━━━━━━━┓
┃ │ A合作 │ A竞争 ┃
┠─────┼─────────┼─────────┨
┃ B合作 │ (75,25) │ (100,0) ┃
┠─────┼─────────┼─────────┨
┃ B竞争 │ (55,45) │ (95,5) ┃
┗━━━━━┷━━━━━━━━━┷━━━━━━━━━┛
在这种情况下,强者A会自然而然地选择竞争,因为它根本就不存在通过合作而提高自己效用的空间。弱者B也只有竞争这一条路可走,不然就面临彻底被消灭的命运。这也就是为什么‘美帝国主义’越来越‘贪婪暴虐’、‘单边主义’的原因所在,恃强凌弱是由自己的利益所驱动的必然选择,要不然,强大有什么意义呢?这也是为什么弱小国家、民族必须努力发展自己的动力:落后就要挨揍。
还有一点儿要指出的是,上述第三个游戏中,括号里的数字是指‘市场占有率’。而双方的利润还决定于市场的大小和利润率。通常情况下,竞争的市场价格相对较低,供应商一方的利润率也会下降,但是另一方面,低价格对消费者一方较有吸引力,因此市场总值会比较高。所以,从长远而言,最终的利润并不能简单地由市场占有率来决定的。
在对游戏理论的研究中,科学家们还发现了,如果让A和B两人反复重复上述‘犯人悖论’游戏,由于每一次的结果在最终结果中所占的比例比较小,因此A和B都愿意冒一些险而试探一下‘否认’的结果。经过一段时间的试探挫折之后,通常A和B是可以达成默契共同‘拒不认罪’的。
换句话说,由于人的自私和短视,人们在相对有限的时间里通常会选择‘斗争’‘不合作’。但是从长远而言,同样出于‘最大化自己效用’的动力,人们会发现‘合作’的价值。在这里,我想引用以下Ebay创始人的理念来结束这段‘理工科’的探讨:我们认为普通人都是好的,只要给与机会都会做正确的选择。我唯一想要补充的是,当人与人素质上存在巨大差距时,人性中的善良一面就必然要受到压抑,这就是上面的第三个游戏,因为巨大的差异就是剥夺和被剥夺的最好理由。而当人与人素质比较接近时,‘合作’才会具有真实的利益,人性中善良的一面才能得以充分释放。