选择理论 - 第7章

所有的社会价值——自由和机会、收入和财富，以及自尊的基础——将被平等分配，除非其中任何一种或者全部价值的不平等分配方案对所有人有利。
第一个声明，即每个人会选择给最贫穷的人最大数额的分配方案，是很实际的，且直接和选择理论相关。在面纱背后，你不得不从一些赌局中进行选择，比如下列三个：
以概率p得到1000美元，以概率q得到4000美元，剩余情况则得到8000美元
以概率r得到1000美元，剩余情况则得到5000美元
以概率1得到2000美元
如果你是极端风险厌恶的，你将单选这三个赌局中的最后一个。确实，如果你喜欢第三个赌局胜过第二个，那么不管你以概率r得到的价值是多少，你都违反了连续条件。因此声称每个人将选择给最贫穷的人最大数额的分配方案，这一点似乎不能成立。
第二个声明，即在无知面纱背后，人们选择的分配方案是公正的，并且如果真实分配方案不同于所选方案，就有理由进行再分配。这个声明属于伦理学范畴：选择理论将无法说明这一点。但是，我顺便提一下，还有其他观点。其中之一是如果某种财富分配方案是自愿行为的结果，而不是出于其他原因，那么它就是公正的。如果你比我有钱，因为你勤奋工作，而我很懒，这就无话可说了：任何人都不该把你的财富分拨给我。这就是罗伯特·诺齐克（我们在第三章已提到过他）所阐发的理论：
我们并不是处于孩子的位置，孩子们得到一定份额的馅饼，分的人在最后一刻作了细微调整以修正粗心的切割。不存在主导性的分配方案，没有人或集体有权控制所有资源，并决定资源该如何划分。比如，每个人得到什么，他从其他人那里得到什么以作为交换，或者作为礼物。在一个自由社会里，不同的人控制不同的资源，并且出于人们的自愿交换和自愿行为，新的财产所有格局会出现。正如在一个自由选择对象的社会里不存在配偶分配，我们的社会里也不存在财富分配或者说份额分配。
小结
在所有回报由金钱数额组成的赌局中，你的选择体现了你对风险的态度。
赌局的风险酬金等于：（1）赌局的期望价值，即把每个回报乘以相应概率，再把所得数字相加；减去（2）赌局的确定性对等物，即你愿意接受用以替代该赌局的金额。
在某个财富水平上的风险厌恶量度是效用分配曲线在该水平上斜率减小的比例幅度。
如果我愿意接受你所接受的任何赌局，但反之则不然，那么你就比我更加厌恶风险。
你比我更加厌恶风险，当且仅当（1）对于所有赌局你的风险酬金都大于我的风险酬金，并且（2）在任何财富水平你的风险厌恶量度大于我的风险厌恶量度。
第五章
冲突与合作
现在我回到本书主题，来考虑候选菜单由策略选项组成的情况。我把这些选项称为行为，比如作出一个或高或低的拍卖报价。这是博弈论的框架。但我将侧重于研究当你一个人进行选择的时候，怎样才是理性的，而博弈论则关注我们应该如何以某种共同稳定的方式进行各自的选择。
情形
在一个策略框架里，你在选择你的行为的时候，知道我也将独立选择某个行为，而结果将取决于我们各自的选择。你必须在这种情况下作出你的选择。
在开始前，我们要先了解互知信息的概念。互知信息不同于共同信息。如果我们各自知道某件事，它就属于共同信息。如果我们不但各自知道某件事，而且知道对方知道这件事，知道对方知道我们知道他知道这件事，依此类推，这样的信息就属于互知信息。试举一例说明互知信息和共同信息的区别。假设你我各自发到一张牌。两张牌的花色都是红色，但我们并不知道：我们各自只知道自己牌的花色。此时，发牌人先问我，然后问你，是否知道对方牌的颜色。显然，我们都回答不知道。发牌人随即告诉我们至少其中一张牌是红色的，然后他重复了刚才的问题。我再次回答不知道。但是你一听到我的回答，就会意识到我的回答表明我手中的牌肯定不是黑色，因此你推断出我的牌是红色的，并且回答说你知道。这个例子的要点在于当你被告知某个你已经知道的信息（至少一张牌是红色的）之后，你的回答变了，从否定变为肯定。改变的理由是你所获得的信息从共同信息变为互知信息。
一个策略问题的所有细节都属于互知信息，包括：我们各自所选择的行为，产生的结果，以及我们各自（根据第三章的结果）对此所指定的效用。互知信息还包括我们各自都理性地作出选择，这一点尚待具体探讨。
举一个策略问题的例子。假设在一次拍卖中，你我各自作出一个封闭报价。拍卖品是一瓶价值为100美元的酒。为简化问题，只允许两种报价：高价96美元和低价94美元。在我们各自递交报价后，拍卖师打开报价，将酒交给报价更高的人。随即报价者按所报价格付款给拍卖师。如果双方报价相等，则报价师将酒平均分给两人，同时两人各自支付一半报价。很显然，你每次报价的所得取决于我的报价，反之亦然。如果你报高价，我报低价，则你的所得为100－96美元，即4美元。如果你报低价，我报高价，你的所得为0，因为你的报价没有被接受。如果我们都报高价，则你的所得为0.5×4美元，即2美元。如果我们都报低价，则你的所得为0.5×6美元，即3美元。我的所得也可以这样计算。你必须要选择究竟是报高价还是报低价。
拍卖的可能结果如下表所示，其中结果“4美元，0美元”代表你的所得为4美元，而我的所得为0美元，依此类推。
你和我各自对这些结果指派基数效用。比如，我们可以指派效用如下：
你对于某个使你的收益为0美元而我的收益为4美元的结果指派效用0，依此类推。
这一效用指派方式有三个方面值得一提。第一，你和我各自对整个结果，而不仅是对我们各自的收益指派效用：你可能希望我过得好，因此，在其他条件不变的情况下，你会为某个使我得到更多收益的结果指派更高效用。或者你也可能希望我过得不好，或者根本就不关心我。第二，既然我们指派的是基数效用，它就已经包含了对于风险的态度。因此，如果你选择一个赌局，以各占一半的概率得到结果“2美元，2美元”和“4美元，0美元”，那么在上述效用分配方式下，这个赌局和确定得到结果“3美元，3美元”对你来说是无差异的，因为你的（期望）效用在每种情况下都是2。第三，没有任何说法证明你的效用和我的效用能够以任何方式作比较：我们各自独立指派效用。
我们可以将这两个表格中的信息结合在一起得到一个拍卖问题的收益矩阵。与以往不同的是，我们用一对效用来代替与之相关的结果“2美元，2美元”，也就是说，你的效用是1，我的效用也是1，依此类推。收益矩阵的行对应你可能的行为，列对应我的行为。如果你选择行的行为，我选择列的行为，我们行为的结果就是每一个行和列组合在一起的条目。条目的格式是：你的效用在前，我的效用在后。现在我们可以将拍卖的例子改写如下。
拍卖的例子
在某次封闭报价拍卖会上，你和我各自决定报极高或者极低的价格。收益矩阵如下：
图12 《国际跳棋比赛》：奖品坐在正中（马蒂亚·普雷第，约1635）
这个拍卖问题和著名的“囚徒困境”难题实质上是一样的。在囚徒问题里，你和我都被指控犯下罪行。我们被告知如果我们都否认罪行，那么我们各自将被判较轻的罪名，并且接受很轻的惩罚。如果我们都坦白，那么我们各自接受中等程度的惩罚。如果我们两人中只有一个人坦白，那么他就会被释放，并且成为证人指控另一个人。被指控的人将受到严厉惩罚。在我们可以沟通之前，我们被关在隔离的牢房里。你必须选择究竟是坦白还是否认。假定我们每个人只关心自己的惩罚，我们各自为严厉的惩罚指派效用0，为中等程度的惩罚指派效用1，为很轻的惩罚指派效用2，为无罪释放指派效用3。显而易见，这个问题的收益矩阵和刚才的拍卖问题是一样的，只不过把几个名称换了而已。
理性行为
来考虑下面的例子（我将不再为这个例子以及随后的其他一些例子来编故事）。
树的例子
你和我各自选择一种树：你可以选白蜡树、山毛榉或栗子，我可以选白蜡树或山毛榉。收益矩阵如下：
当然，你不会知道我将选择哪个或哪些行为，甚至不知道我将以什么样的概率来选择每个行为。但是，如果你知道这些概率，你的选择就很简单：你将在给定这些概率的情况下，选择能够将你的期望效用最大化的行为。这一行为被称为你对于这些概率的最佳反应。假设在本例中，你被告知我将以概率0.5选择A（否则选B），那么如果你选择A，你的期望效用就是：（0×0.5）+（3×0.5），等于1.5。如果你选择B，那么期望效用就等于2。如果你选择C，期望效用等于1.5。于是你选择B，也就是说B是你对于这些概率的最佳反应。
现在假设你仅仅被告知我的潜在行为，即我可能选择的行为。总的来说，把这些行为和不同概率联系在一起，就会得到不同的最佳反应。比如，如果在上例中，你被告知我将以概率0.2而不是0.5选择A，那么你的最佳反应将变为A；如果你被告知我将以概率0.8选择A，那么你的最佳反应就将变为C。对于我的潜在行为，你的可信反应是对于其中一些概率的最佳反应。在本例中，对于我的潜在反应A或B，你的可信反应是A、B和C。
最佳反应和可信反应可以用来研究理性。不妨举个例子说明看似有违理性的选择，比如在拍卖的例子中你如果选择B。B的问题出在对于我的任何潜在行为，它都不是最佳反应。不管你是否被告知我将选择A，或选择B，或者可能随机选择其中之一，你的唯一的可信反应都是A。
下面的例子提供了一个更为复杂的案例来说明有违理性的选择。
花的例子
你和我各自选择一种花：我们可以各自选择乌头、毛茛或连香报春花。收益矩阵如下：
假设在本例中你选择B。这里的问题不太明显。表面看来，你的选择无可挑剔：不管我选A或B，你选B都是一个可信反应。但是你必须问自己，我是否会选择A或B。显然，我不会选择A，因为对于你的任何选择，A都不是我的可信反应。那么我可能选择B吗？如果我这么做，那么我不得不相信你将选C，因为对于你选A或B，我选B都不是可信反应。但我知道你不会选C，因为对于我的任何选择，你选C都不是可信反应。结果是，你知道我会排除A与B来选C。但是你选B不是我选C的可信反应。因此，你选择B看起来违背理性。
理性行为是可以通过一连串可信反应论证来检验其合理性的行为，正如在上例中那样。在策略问题里，你不知道我将选择什么。但是，你可以推断出关于我的行为的一些信息，因为你知道我只会选择一个可信反应。特别是，你可以推断，我的任何选择将是我在推断出你的选择之后所作出的可信反应。更进一步，因为你知道我知道你只会选择一个可信反应，你会预期我将作出类似的推断。确实，你应该预期到我会预期到你将作出类似推断，依此类推。理性行为是从这条推理链中产生的行为：你的行为是理性的，如果它是你针对我的可信反应所作出的可信反应；而我的可信反应又是针对你的可信反应所作出的；你的可信反应又是针对我的可信反应所作出的……注意理性本质上是和个人相关的概念。在拍卖的例子里，如果我们各自选择B而不是A，那么我们将各自变得更好：对于个人来说是理性的选择，可能对于集体来说并非理性。
在花的例子里，我们可以用一张表来说明这一推理链。表中每一行给出选择者、他所面对的另一个人的潜在行为，以及选择者对此的可信反应。
直到你我的可信反应都不再随着推理的进行而改变，这一推理链宣告结束。如果我们到达某一点时，都只选择一个行为，如上例所示，那么很显然这就是推理链的终点。我们应该注意到，我们是从你的而不是我的反应开始推理的：但是显而易见，如果我们从我的反应开始也会得到同样的结果。因此你的理性行为是A（而我的是C）。
显然，你将总能作出某个理性行为。但是，如下例（这个例子是“在纽约见面”的原始版本）所示，你可能有不止一个理性行为。
见面的例子
你和我约好见面，但忘了确定究竟是在A点还是在B点见面。因为我们各自都想见面，但不在乎在哪里见面，我们的收益矩阵可以写成下面的形式：
如果你被告知我选A的概率大于0.5，那么你的最佳反应就是A。如果你被告知这一概率低于0.5，你的最佳反应就是B。因此，因为你的可信反应是你对于某些概率所作的最佳反应，对于我的潜在行为A或B，你的可信反应就是A和B。因为我的可信反应也是一样，所以对于我们每个人来说，理性行为一定是A和B两者（其实，我们应该已经从本例的对称性上判断出这一点）。
非劣势行为
为了概括理性的特征，我们需要“优势”这一概念。在你的两个行为中，如果不管我选择什么，你都偏好第一个，那么该行为对第二个占优势。相应地，你的第一个行为所带来的效用大于第二个。例如，在拍卖的例子里，你的行为A相比B占优势。优势行为还有更为复杂的一种形式。试想，你不再选择某个特定行为，而是能够选择多个行为的组合，或者说，针对你行为的一个赌局。这意味着，除了单选X或Y之外，你还可以选赌局“以概率0.5得到X，以概率0.5得到Y”。如果无论我选择什么，你从赌局得到的期望效用都大于你从特定行为所得到的期望效用，那么涉及多个行为的赌局相比某个特定行为就占优势。考虑下面的例子。
昆虫的例子
你和我各自必须选择一种昆虫：你可以选蚂蚁、蜜蜂或者毛虫；而我可以选蚂蚁或蜜蜂。收益矩阵如下：
在本例中，你的赌局“以概率0.5选A，否则选C”相比行为B占优势：无论我选择什么行为，你从赌局获得的期望效用都是1.5，而你从B获得的期望效用是1。如本例所示，一个行为可能相比一个行为组合占劣势，即使相比组合中的任何一个行为，它都不占劣势：你的行为B和A或C相比，都不占劣势。
如果一个行为和任何组合（包括任何简化组合，即任何行为）相比都不占劣势，那么该行为是非劣势的。换句话说，如果无论我选择什么行为（或行为组合），没有任何行为能给你更高的（期待）效用，你所选的行为就是非劣势的。如你所料，一个行为如果是最佳反应，它一定是非劣势的。既然要成为理性行为必须是最佳反应，这就意味着理性行为必须是非劣势的。但是，反之则不一定成立：一个行为可能是非劣势的，但却不是理性的。