策略思维sjmuvx|每天挣300-500的方法_在线兼职

帆船比赛给我们提供了一个很好的机会，观察“跟随领头羊”策略的一个很有意思的反例。成绩领先的帆船，通常都会照搬尾随船只的策略。一旦遇到尾随的船只改变航向，那么成绩领先的船只也会照做不误。实际上，即便成绩尾随的船只采用一种显然非常低劣的策略时，成绩领先的船只也会照样模仿。为什么？因为帆船比赛与在舞厅里跳舞不同，在这里，成绩接近是没有用的，只有最后胜出才有意义。假如你成绩领先了，那么，维持领先地位的最可靠的办法就是看见别人怎么做，你就跟着怎么做。（这一策略在竞争者超过两个后就不适用了，因为如果落后的两条船只做出了相反的动作，成绩领先者就得做选择）。

跟在别人后面第二个出手有两种办法：

囚徒困境的故事体现了一个普遍的现象：大多数经济的、政治的或社会的博弈游戏都跟类似橄榄球或扑克这样的博弈游戏不同。橄榄球或扑克是零和博弈：一个人的得就是另一个人的失。但在囚徒困境中，有可能出现共同利益，也有可能出现利益冲突；不招供的结果对两个囚徒都是有利的，而不是相反。与此类似，在劳资双方的讨价还价中，虽然存在利益冲突，一方希望降低工资，而另一方要求提高工资，不过，大家都知道假如谈判破裂而导致罢工，双方都将遭受更大的损失。任何一个关于博弈的有用的分析，都应该考虑到怎么处理冲突与利益同时存在的情况。我们通常将博弈游戏的参加者称为“对立者”，不过，有时候，策略可能将原本毫不相干的人变为一条绳上相互依存的蚂蚱。

在实践中，“坚持到底，拒不妥协”说起来容易做起来难，理由有二：

老鼠们意识到，假如可以在猫脖子上拴一个铃铛，那么，它们的小命就会大有保障。问题在于，谁会愿意冒赔掉小命的风险给猫拴上铃铛呢？

这个问题同样摆在老鼠和人类面前。占据支配地位的党派或独裁暴君怎样才能通过规模相对较小的军队长期控制数目很大的一个人群呢？整架飞机的众多乘客为什么只要出现一个持枪劫机者就会显得无计可施，束手就擒？在这两个例子里，只要大多数人同时采取行动，就很容易取得成功。不过，统一行动少不了沟通与合作，偏偏沟通与合作在这个时候变得非常困难，而压迫者由于深知群众的力量有多大，还会采取特殊的措施，阻挠他们进行沟通与合作。一旦人们不得不单独行动，希望聚沙成塔，集腋成裘，问题就出来了：“谁该第一个采取行动？”担当这个任务的领头人意味着要付出重大代价，甚至可能付出生命。他得到的回报则会是死后的光荣或受人感激。确实有人在想到责任或荣誉的时候会感到热血沸腾，挺身而出，但大多数人还是认为这么做的代价超出了得益。

涉及超过两个人的囚徒困境，可以把它称为“人质困境”。现在我们要用这个困境阐述一个不同的观点，确切地说，就是惩罚经常压倒回报而处于上风。独裁者可以通过向大众提供物质乃至精神安慰保持局势稳定，不过，这个做法可能需要付出高昂代价。建立在人质困境之上的压迫和恐吓可能是一种代价小得多的替代选择。

许多国家运用关税、配额以及其他方法限制进口，保护本土产业。这样的政策会抬高价格，损害国内所有使用受保护产品的消费者的利益。经济学家估计，假如美国运用进口配额保护钢铁、纺织或制糖产业，导致大家不得不购买价格更高的产品，换算过来，相当于每保住这些产业一个职位，美国国内其他人就要付出10万美元的代价。为什么会这样，极少数人的得益怎么总是会压倒更大多数人的损失而得到优先考虑呢？

秘诀在于一次提出一件事情。首先，美国制鞋产业的1万个职位面临着威胁。要想挽救这些职位，国内其他人就得付出10亿美元，或人均付出4美元。谁不愿意付出4美元保住1万个职位呢？即便素昧平生的陌生人也会愿意的吧，尤其是在可以把所谓不择手段的外国人当做现成的诅咒目标之际。接着就轮到服装产业、钢铁产业、汽车产业，等等。没等我们明白过来，我们已经点头同意付出500多亿美元，相当于人均付出200多美元，或每个家1000多美元。假如我们事前可以看穿整个过程，我们大概会想，这个代价是不是太高了，继而坚持要让上述各个产业的工人自己承担国际贸易带来的风险，就像他们承担任何其他经济风险一样。就个案逐项进行决策可能导致全部结果都与我们的意愿南辕北辙。实际上，一项决定即便获得多数人投票赞成，仍然有可能导致一个在每个人看来都比现状更糟的结果。

人们陷入某种境地而发现从此难以脱身的情况实在是太普遍了。比如，一旦你在某个城市找到一份工作，那么，换一个地方重新安置下来的代价就会变得很高；一旦你买了一台电脑，学会了怎样使用其操作系统，那么，学会另一种操作系统，改写你的全部程序，其代价就会变得很高。同样，参加了一家航空公司的里程积分计划的旅行者若想搭乘另一家航空公司的飞机，付出的代价也会更高。还有，当然了，从婚姻围城中逃脱出来的代价也很高。问题在于，一旦你做出了类似的承诺，比如接受了工作或结了婚，你的讨价还价地位就会被削弱。公司大可以利用其职员预期的搬家成本高，向他们支付较低薪水或降低加薪幅度。电脑公司可以给新出的可兼容的外围设备标出更高的价码，因为它们知道，它们的消费者不会轻易转向同样是新出的却不兼容的技术。至于航空公司，一旦找到数目庞大的里程积分计划参加者，就不大愿意参与价格战了。夫妻签订的平均分担家务的协议一旦遇到小孩出生，就不得不重新谈判一番。

《红绿男女》中赌徒斯凯想起他父亲给他提的建议：孩子，在你的旅途中，总有一天会遇到一个家伙走上来，在你面前拿出一副新扑克，连塑料包装纸都没拆开的那种，赌他有办法让梅花J从扑克牌里跳出来，并把苹果汁溅到你的耳朵里。不过，孩子，千万别跟这个家伙打赌，因为就跟你站在那里一样，最后你会落得苹果汁溅到耳朵里的下场。

其他人的行动向我们提示了他们究竟知道什么，我们应该利用这些信息指导我们自己的行动。当然，我们应该将这些信息连同我们自己有关这个问题的信息综合起来加以利用，运用全部策略机制，尽可能从其他人那里获取整个事情的真相。

两名美国经济学家找了一辆出租车，告诉司机应该怎么去他们的酒店。司机几乎立即认出他们是美国观光客，因此拒绝打表，声称自己热爱美国，许诺会给他们一个低于打表数目的更好的价钱。自然，两人对这样的许诺有点将信将疑。在他们表示愿意按照打表数目付钱的前提下，这个陌生的司机为什么要提出这么一个奇怪的少收一点的许诺呢？他们怎么知道自己有没有多付钱呢？（假如这个司机想要证明他确实打算少收车钱，他完全可以按乘客的要求打表，等到了目的地后按照打表数字收取80%的钱，但他没有打表，这其实已经扭曲了他的真实动机，参看前面斯凯的故事）。在到达酒店后，司机要求他们支付2500谢克尔，两位经济学家还价2200谢克尔。司机生气了，不等对方说话就锁住车门开到出发点，把他们扔出车外，大叫：“现在你们自己看看那2200谢克尔能走多远吧！”他们又找了一辆出租车，这名司机开始打表，当跳到2200谢克尔时，他们到了酒店。

在这个关于轮盘赌的故事里，先行者处于不利地位。由于那名女子先下注，巴里可以选择一个确保胜利的策略，即模仿女子的做法。假如巴里先下注，那名女子就可以选择一个具有同样取胜机会的赌注。这里需要说明的是，在博弈游戏里，抢占先机、率先出手并不总是好事。因为这么做会暴露你的行动，其他参与者可以利用这一点占你的便宜。第二个出手可能使你处于更有利的策略地位。

策略博弈的精髓在于参与者的决策相互依存。这种相互影响或互动通过两种方式体现出来：

一旦你发现自己正在玩一个策略博弈，你必须确定其中的互动究竟是相继发生的还是同时发生的。有些博弈，比如橄榄球，同时具备上述两种互动元素。这时候你必须确保自己的策略符合整个环境的要求。

相继出招的博弈有一个总的原则，就是每一个参与者必须预计其他参与者接下来会有什么反应，据此盘算自己的最佳招数。这一点非常重要，值得确立为策略行为的一个基本法则。

法则1：向前展望，倒后推理。展望你的最初决策最后可能导致什么结果，利用这个信息确定自己的最佳选择。

一系列需要向前展望、倒后推理的决策，甚至有可能出现在一个孤立的决策者面前，而这个人并非置身于一个有其他人参加的策略博弈中。

我们遇到一个有两个人或更多人参与的博弈。沿着这棵树出发，后面许多分枝可能是几个参与者轮流决策。每个参与者在前一个分枝做决策时必须向前展望，而且考察的范围不应仅局限于他自己的决策，还要包括其他参与者的决策。他必须对其他人的下一步决策进行预计，办法就是置身于其他参与者的地位，按照他们的思维方式进行思考。为了强调一下这个做法与前面一个做法的区别，我们把一棵反映一场策略博弈当中的决策次序的树称为“博弈树”，而把“决策树”留做描述只有一个人参加的情形。

假如一个博弈无论选择哪一条路径，都会在有限次的行动之后到达终点，我们在理论上就可以完全解决这个博弈。这意味着能找出谁将取胜以及他将怎样取胜。这是通过沿着这棵树倒后推理得出的。一旦我们走通了整棵树，我们就会发现我们究竟能不能取胜，还有，假如可以取胜，我们应该使用怎样的策略。对于任何一个相继选择并且数目有限的博弈，总是存在某种最佳策略。当然，存在一个最佳策略并不等于说我们总是可以轻而易举地找到这个最佳策略。象棋就是一个很好的例子。

大多数人基于社会常识，预测一场谈判的结果就是妥协。这样做的好处是能够保证“公平”。我们可以证明，对于许多常见类型的谈判，一个50对50的妥协也是倒后推理的结果。首先，我们必须认识讨价还价的两个普遍特征。我们必须知道谁向谁提出了一个什么条件，换言之，就是这个博弈的规则是什么；接着，我们还要知道，假如各方不能达成一个协定，将会导致什么后果。

不同的谈判按照不同的规则进行。在大多数零售店里，卖方会标出价钱，买方的唯一选择就是要么接受这个价格，要么到别的店里碰运气。这是一个简单的“接受或者放弃”的法则。而在工资谈判的例子中，工会首先提出一个价码，接着公司决定是不是接受。假如公司不接受，可以还一个价码，或者等待工会调整自己要求的价码。有些时候，相继行动的次序是由法律或习俗决定的，还有一些时候这一次序本身就有策略意义。

同样的观察结果会引出一个谜。假如讨价还价的过程真像这里阐述的那样，应该不会出现罢工。当然，罢工的可能性会影响最终达成的协议，不过公司会把握第一个提条件的机会，提出一个刚好足以引诱对方接受的条件，工会也会这样做。罢工变成现实，或者更普遍的情况，即谈判破裂，一定是现实生活更微妙或者更复杂的特征引出的结果，而这些特征早已从上述这个简单的故事中排除出去，未予考虑，后续会讨论。

倒后推理的另一个实例是怎样通过一系列双边谈判维护和平。举个例子，苏丹是一个相对弱小的国家，现在面临被其邻国利比亚入侵的危险，假如这两个国家在某种程度上与外界隔绝，那么想要阻止利比亚入侵并击败苏丹简直毫无可能。两个敌对邻居可能无法继续和平共处，但第三方的存在也许可以构成必要的制约。在利比亚与苏丹的例子里，这一原理可能会是“我的敌人的敌人就是我的朋友”。

从表面看来，这个例子说明，一个国家究竟会不会遭到入侵，将取决于潜在侵略者链条的节点数目是奇数还是偶数。一个更加接近现实生活的情况分析可以把国与国之间的复杂关系考虑在内，从而得到更多细节，用于分析一国入侵别国的企图究竟有多大。不过，还有一个重要的结论：博弈的结果在很大程度上取决于参与者的人数。参与的人越多越好，参与的人越少越糟，即便在同一个博弈里也是如此。但是，两个敌对国家难以和平共处、三个敌对国家就能恢复稳定局面的结论并不意味着若有四个敌对国家就更好。

本章我们讨论了有序行动或者有序移动的博弈。实际上，现实生活当中没有几个博弈存在清晰界定而参与者又必须遵守的行动规则。参与者自己制定自己的规则。那么，他们怎么才能向前展望、倒后推理呢他们又怎么才能知道这个博弈究竟有没有行动次序呢？

一个普遍的观点是若要运用向前展望、倒后推理的原理，不可缺少的前提是后行者可以观察到先行者的行动。向前展望、倒后推理原理的另一个适用条件：策略必须是不可逆转的。

假如这两个条件有一个不符合，又会怎么样？就策略思维而言，这些决定就跟同时做出没有两样。

在同时行动的博弈里，没有一个参与者可以在自己行动之前得知另一个参与者的整个计划。在这种情况下，互动推理不是通过观察对方的策略进行，而是必须通过看穿对手的策略才能展开。你怎样才能看穿所有那些错综复杂而又看不见的策略呢？你不要把其他参与者的未知行动视做天气那样，具有与个人无关的不确定性。在同时行动的博弈中，我们有三个行动法则：一是寻找和运用优势策略；二是寻找和避免劣势策略，与此同时假设你的对手也在这么做；三是寻找和运用均衡。反过来，这些法则又基于两个简单概念：优势策略与均衡。

优势策略的定义：某些时候它胜于其他策略，且任何时候都不会比其他策略差。

以策略观点来看，各方均有一个优势策略的博弈是最简单的一种博弈。虽然其中存在策略互动，却有一个可以预见的结局：全体参与者都会选择自己的优势策略，完全不必理会其他人会怎么做。但这一点并不会降低参与或者思考这种博弈的趣味性。比如，在百码短跑中，优势策略是能跑多快就跑多快，但许多人还是很喜欢参加或者观看这种比赛。囚徒困境中，两个参与者都有一个优势策略，只不过这股压倒一切的力量最终将他们引向了一起倒霉的结局。这就提出了一个很有意思的问题：参与者怎样合作才能取得一个更好的结果？

只有一方拥有优势策略的博弈其实也非常简单。拥有优势策略的一方将采用其优势策略，另一方则针对这个策略采用自己的最佳策略。

优势策略的两个特征：

法则2：假如你有一个优势策略，请照办。不要担心你的对手会怎么做。假如你没有一个优势策略，但你的对手有，那么就当他会采用这个优势策略，相应选择你自己最好的做法。

一个优势策略优于其他任何策略，同样，一个劣势策略则劣于其他任何策略。假如你有一个优势策略，你可以选择采用，并且知道你的对手若是有一个优势策略他也会照办；同样，假如你有一个劣势策略，你应该避免采用，并且知道你的对手若是有一个劣势策略他也会规避。假如你只有两个策略可以选择，其中一个是劣势，那么另一个一定是优势策略。因此，与选择优势策略做法完全不同的规避劣势策略做法，必须建立在至少一方拥有至少三个策略的博弈的基础之上。

法则3：剔除所有劣势策略，不予考虑，如此一步一步做下去。假如在这么做的过程当中，在较小的博弈里出现了优势策略，应该一步一步挑选出来。假如这个过程以一个独一无二的结果告终，那就意味着你找到了参与者的行动指南以及这个博弈的结果。即便这个过程不会以一个独一无二的结果告终，它也会缩小整个博弈的规模，降低博弈的复杂程度。

利用优势策略方法与劣势策略方法进行简化之后，整个博弈的复杂程度已经降到最低限度，不能继续简化，而我们也不得不面对循环推理的问题。你的最佳策略要以对手的最佳策略为基础，反过来从你的对手的角度分析也是一样。我们已经找到了一个策略组合，其中，各方的行动就是针对对方行动而确定的最佳对策。一旦知道对方在做什么，就没人愿意改变自己的做法。这称之为“均衡”。

法则4：寻找这个博弈的均衡，即一对策略，按照这对策略做，各个参与者的行动都是对对方行动的最佳回应。

为什么一个博弈的参与者非得达到这么一个结局呢？

一旦陷入囚徒困境，人们就会想方设法逃脱，寻求大家一致愿意看到的合作的结果。一个根本的难题在于在任何协定下参与者都有作弊的动机。因此，中心问题是，怎样才能觉察这么一种作弊行为？什么样的惩罚才能阻止这种行为？

卡特尔作为一种企业联合组织，必须找出有效的办法，了解是不是出现了作弊行为，以及若是有作弊行为的话，确定是谁作弊。

合谋集中在比较透明的抉择层面，竞争则转向不那么容易看出来的层面，我们把这个现象称为“提高不透明度定律”。也许读者未必看得出来，但合谋仍然可能损害你的利益。比如，1981年开始实施日本汽车进口配额制度后，不仅包括日本车和美国车在内的全部汽车涨价了，而且大众化的日本车型也从市场上消失了。不透明的竞争后果更甚：不仅导致价格上升，产品组合的平衡也被扭曲了。

确认作弊者可能比觉察作弊更为艰巨。假如只有两个参与者，诚实的一方当然知道谁在作弊。即使如此，能不能让他承认错误可能又是一个未知数。假如出现不止两个参与者，我们可能知道有人作弊，却没人知道究竟是谁，只有作弊者自己心知肚明。遇到这种情况，用于惩罚的手段显得莽撞生硬，它会同时影响到无辜者和作弊者。

在每一个鼓励合作的良好计划里，通常都会包含某种惩罚作弊者的机制。一个坦白且供出合作伙伴的囚徒可能遭到这些人的朋友的报复。若是知道外面会有什么报应等着自己，尽快逃脱牢狱之灾的前景大概也就不会显得那么诱人了。在最初博弈之上增加惩罚机制的做法，其目的就是为了减少作弊的动机。

在博弈的结构里还存在其他类型的惩罚。一般而言，这种情况发生的原因在于这个博弈反复进行，这一回合作弊所得将导致其他回合所失。

最巧妙的方式在于通过一个保证加以惩罚的承诺推行一个价格联盟，而且是以竞争的名义进行。现在我们将要看到的是纽约市及其立体声音响商店大战。疯狂埃迪(CrazyEddie)已经打出了自己的口号：“我们不能积压产品。我们不会积压产品。我们的价格是最低的——保证如此！我们的价格是疯狂的。”它的主要竞争对手纽瓦克与刘易斯，口号却没叫得那么野心勃勃。然而每次购物，你都会得到这个商店的“终生低价保证”。按照这一承诺，假如你在别的地方看到更低的价格，商店会按差价的双倍赔偿给你。

假设一台录像机的批发价是150美元，现在疯狂埃迪和纽瓦克与刘易斯都卖300美元。疯狂埃迪偷偷作弊，减价为275美元。假如没有那个击败对手的承诺，疯狂埃迪完全有可能将一些原本打算在对手那边购物的顾客吸引过来，而这些顾客之所以要去纽瓦克与刘易斯那边购物，原因很多，可能是因为路途较短或者以前曾在那里买过东西。不幸的是，对疯狂埃迪而言，这回减价起了完全相反的效果。因为纽瓦克与刘易斯有那么一条价格保证，人们就想赚便宜，纷纷进来买一台录像机，然后要求赔偿50美元。这么一来，相当于纽瓦克与刘易斯的录像机自动减价为250美元，比疯狂埃迪减得还厉害。

如果存在几个不同的惩罚手段，可以阻止作弊和维持合作，我们应该怎样抉择呢？有几个标准可供参考。

要想策略地行动，你必须保证自己不要采取在同时出招博弈里的均衡策略。美国的这个策略行动改变了日本的预期，进而改变了它的行动。一旦相信美国会不惜一切代价选择高水平，日本就会选择低水平。当然了，等到日本拿定了主意，美国最好还是改变主意，同样回到低水平的道路上去。

为了使一个策略行动可信，你必须采取其他附加行动，使扭转这一行动变得代价高昂乃至完全没有可能。可信度要求对这个策略行动做出一个承诺。

因此，策略行动包含两个要素：计划好的行动路线以及使这一路线显得可信的承诺。本章我们集中考察行动。

一个无条件的行动可以使这个参与者获得策略上的优势，抢占先机，率先出招。即便你并未真的先行，仍然可以通过对一个回应规则做出一个承诺，获得相仿的策略优势。回应规则把你的行为视为对其他人行动的一种回应。虽然你是跟在别人后面行动，但这个回应规则必须在别人开始行动之前就实施。父母对孩子说，“除非你吃掉菠菜，否则没有甜品”，实际上就是在确立一个回应规则。毫无疑问，这个规则必须在这个孩子把自己那份菠菜喂了小狗之前就开始实施，并且明确宣布出来。

回应规则分为两大类：威胁与许诺：

有时候，威胁与许诺的界限非常模糊。一个人被抢劫，却得到如下的许诺：只要你“借给”我1000元，我许诺不会伤害你。

一切威胁与许诺的共同点在于：回应规则使你不会在没有回应规则的前提下采取行动。假如这个规则只是泛泛地指出，无论什么时候你都会采取最佳行动，那就跟没有规则差不多。由于别人对你以后的行动的预期毫无变化，这个规则也就产生不了任何影响。不过，说明什么事情会在没有规则的情况下发生，仍然具有一种公告天下的作用，这些说明被称为警告和保证。

如果实践一个“威胁”对你有利，我们称之为警告。如果实践一个“许诺”对你有利，我们称之为保证。

威胁与许诺是真正的策略行动，而警告与保证更多的是起一个告知的作用。警告或者保证不会改变你为影响对方而设立的回应规则。实际上，你只不过告知他们，针对他们的行动，你打算采取怎样的措施作为回应。与此截然相反，威胁或者许诺一旦时机来临，就会改变你的回应规则，使之不再成为最佳选择。这么做不是为了告知，而是为了操纵。由于威胁和许诺表明你可能选择与自身利益冲突的行动，这就出现了一个可信度的问题。等到别人出招之后，你就有动机打破自己的威胁或者许诺。为确保可信度必须做出一个承诺。

美国的回应规则要求采取某种行动，而这一行动在从事之后判断显然不是最佳选择。其中的策略意图在于，以令人信服的方式改变苏联对美国事后采取什么回应的认识，可以使美国改变“这件事”——确切地说就是苏联要不要进攻西欧的决定。这个规则必须在对方采取你打算加以影响的行动之前生效。一旦被人占了先机，不管是无条件的行动，抑或威胁与许诺，都将无济于事。

你的无条件行动若是打算用来影响对方，就一定要让对方看到，同样，假如你打算通过威胁或许诺影响他的行动，那么他的行动也应该可以让你看到。否则你不可能知道他是不是选择顺从，而他也明白这一点。

在你做出一个许诺的时候，不应让自己的许诺超过必要的范围。假如这个许诺成功地影响了对方的行为，你就要准备实践自己的诺言。这件事做起来应该是代价越小越好，因此也意味着许诺的时候只要达到必要的最低限度就行了。不那么容易看到的是，适度原则其实同样适用于威胁。你不应让自己的威胁超过必要的范围。这么做的理由相当微妙。

为什么美国不会威胁日本说，假如日本不同意进口更多的美国大米、牛肉和柑橘，美国就要动武呢？虽然动武的想法有可能博得美国一些农场主和政治家的欢心，但同时却存在几个很好的理由，说明不能这么做：

上述各点的核心在于，这个威胁大而不当，对方难以置信，而自己又不能说到做到，更别说进一步确立自己的信誉了。

假如受到威胁的参与者知道反抗的下场，并且感到害怕，他就会乖乖就范。那么，我们为什么还要担心若实践这个威胁，会有多么可怕的情况发生呢？问题在于，在这个方面，我们永远不会遇到理想状况。只要我们仔细考察美国不能威胁动武的理由，我们就会看得更清楚，现实与理想状况究竟有什么区别。

结论是，能奏效的最小而又最恰当的威胁应该成为美国的首要选择，务必使惩罚与罪行相适应。如果美国希望刺激日本多买柑橘，就应该选择一个更具互惠性质的威胁，使惩罚与不肯多买柑橘的做法更加匹配。比如，美国可以威胁说要削减日本汽车或者电器的进口配额。

第5章描述的全部策略的根本目的在于，改变对手对你就他的行动可能做出什么回应的预计。假如他相信你不会实践你做出的威胁或许诺，这一目的就会落空。假如你不能影响他的预期，你就不能影响他的行动。建立策略意义上的可信度意味着你必须让别人相信你确实会实践你的无条件行动，你会信守许诺，也会实践你的威胁。可信度要求找到一个办法，有效阻止你反悔。

要想使一个策略行动显得很可信，你必须同时采取一个附加或从属的行动。我们把后一种行动称为承诺。现在，我们提供八种手段，以助于建立可信的承诺。

第一个原则是改变博弈的结果，意思是说，务必使遵守你的承诺成为符合你自身利益的选择：把威胁变成警告，把许诺变成保证。以下两种手段都能使破坏承诺的代价高于遵守承诺的代价。：

第二个原则是改变博弈，使你背弃承诺的能力大受限制。在这方面，我们考察三种可能性。最极端的做法莫过于剥夺自己反悔的机会，比如禁止自己走到反悔的地步，或断绝一切反悔的后路。甚至还有一种可能性，就是离开决策位置，听天由命：

以上两个原则合并起来就是：可能的行动及其结果都有可能改变。假如一个大的承诺被分割为许多小的承诺，那么，违背其中一个小的承诺的得益很可能并不足以抵消失去余下承诺的损失。因此我们说小步前进。

第三个原则是充分利用别人，帮助自己遵守承诺。一个团队也许会比单独一个人更容易建立可信度。又或者，你可以考虑雇用其他人来做你的代表：

信誉

一个例子是以色列的一贯原则：坚决不跟恐怖分子谈判。这是一个威胁，意在阻吓恐怖分子，打消他们企图劫持人质，以此索取赎金或者要求释放犯人的念头。假如这个决不谈判的威胁是可信的，那么，恐怖分子就会意识到他们的行动注定徒劳无功。与此同时，以色列的决心也会经受考验。每一次，一旦这个威胁必须实践，以色列总会吃苦头；拒绝妥协可能使以色列人质命丧黄泉。每一次只要遭遇恐怖分子，以色列的信誉和可信度就会面临考验。屈服一次的意义绝不仅仅是满足眼下这批恐怖分子的要求那么简单，还会给以后的恐怖行动增添诱人的魅力。

对于承诺而言，信誉的影响是一把双刃剑。有时候，破坏信誉可能为达成一个承诺铺设道路。破坏你的信誉这一行动会使你跟你自己达成一个承诺，决心以后不再采取任何在你预计当中并不符合自己最佳利益的行动。

要不要跟劫机者谈判的问题有助于说明这个观点。在任何具体劫机事件发生前，政府可以做出决定，通过威胁说决不谈判，对劫机行动进行阻吓。不过，劫机者预计到，一旦他们夺取飞机，政府就会发现它根本不可能坚守绝不谈判的立场。政府怎样才能剥夺自己跟劫机者谈判的能力呢？一个答案是破坏其许诺的可信度。设想一下，在双方谈判达成协议后，政府却突然背弃自己的承诺，向劫机者发动攻击。这么做的结果是，政府对劫机者的处理方式值得信赖的信誉将会丧失殆尽。政府失去了做出一个可信的许诺的能力，同时不可逆转地断绝了自己对劫机者发出的威胁进行回应的后路。这种破坏许诺的可信度的做法将使决不谈判的威胁变得非常可信。

合同

要使你的承诺显得可信，一个直截了当的办法就是同意在你不能遵守承诺的时候接受某种惩罚。

合同方式更加适用于商业交易。违反合同一般都会造成破坏，因此，受害方一定不愿意善罢甘休。比如，一个制造商就可能要求一个没能按时送货的供应商支付罚金。这个制造商不会对供应商究竟有没有送货漠不关心。他更愿意得到的是自己订购的货物，而不是罚金。但是，单有合同并不能解决可信度的问题。若想奏效，还需要另外一些可信度工具，比如雇用对强迫执行或者他人信誉面临考验问题具有独立兴趣的人士。实际上，假如信誉影响足够大，可能根本没必要正式签订一份合同。这就是“一言既出，驷马难追”的意义。

切断沟通

切断沟通之所以可以成为一种管用的确保承诺可信的工具，原因在于它可使一个行动真正变得不可逆转。这一做法的一个极端形式是一份最后的遗嘱或者证词中的条款。一旦这一方死亡，再也没有进行再谈判的机会。

将切断沟通用做一个确保承诺遵守的工具，其中存在一个严重的问题。假如你被单独囚禁，与外界隔绝，那么，你要想确定对手是不是真的按照你的愿望行事，就算还不至于完全没可能，也是非常不容易的。你必须雇用其他人，确保合同得到遵守。比如，遗嘱就是由受托人而不是死者本人负责执行的。

破釜沉舟

军队通常借助断绝自己后路的做法而达成遵守承诺的目标。

人们没有必要按照字面意思当真烧毁桥梁或者连接各大洋的船只。人们可以通过采取一种可能惹恼某些选民的政治立场，从而象征性地切断自己的后路。

最后，建设而非烧毁桥梁也可能成为立下一个可信的承诺的办法。比如重新开放东西德国的桥梁，政府迫使自己一定要改革，否则就要冒人民大规模逃亡的风险了。

让后果超出你的控制

影片《奇爱博士》里，那台“末日毁灭机”由埋藏在地下的巨大原子弹组成，一旦引爆足以消灭地球上的所有生物。一旦苏联遭到入侵，这台机器会自动引爆。当美国总统询问这个自动引爆开关有没有可能被制造出来时，奇爱博士答：“不仅有可能，而且不可缺少。”

要想减小出错的后果，你一定希望找到一个刚好足够阻吓对手而又不会过火的威胁。假如行动不可分割，比如一场核爆炸，你该怎么办？你可以使你的威胁变得缓和一点，办法是创造一种风险，而不是一种确定性，表明可怕的事情有可能发生。这就是托马斯·谢林的边缘政策想法。

边缘政策是故意创造一种可以辨认的风险，一种人们不能完全控制的风险。这一策略在于有意将形势变得多少有点难以把握，其原因只是这种难以把握的形势在对方看来可能难以承受，因而被迫忍耐下来。这等于将敌人置于一个双方共担的风险之下对他进行干扰和威胁，又相当于是告诉他，假如他采取敌对行动，我们可能大为不安，以至于不管我们是不是愿意，我们都会越过边缘界线，采取行动与他同归于尽，从而对他进行阻吓。

小步前进

信任对方有时候意味着要冒很大的风险，在这种情况下，双方未必愿意互相信任对方。不过，假如承诺的问题可以减小到一个足够小的范围，那么，可信度的问题就能自动解决。威胁或许诺可以分解为许多小问题，每一个问题可单独解决。

就像边缘政策一样，小步前进缩小了威胁或许诺的规模，相应地缩小了承诺的规模。只有一点需要特别小心：深谙策略思维者懂得瞻前顾后，他们最担心最后一步。假如你预计自己会在最后一轮遭到欺骗，你应该提前一轮中止这一关系。不过，这么一来，倒数第二轮就会变成最后一轮，你还是没法摆脱上当受骗的问题。要想避免信任瓦解，千万不能出现任何确定无疑的最后一轮。只要仍然存在继续合作的机会，欺骗就不可取。因此，假如有一个可疑的家伙对你说，这是他在退休之前的最后一笔交易，你可得打起十二万分精神。

团队合作

其他人常常可以帮助我们立下可信的承诺。虽然每个人在独立行事的时候都有可能显得弱不禁风，但是大家团结起来就可以形成坚定的意志。

有时候，团队合作可以超出社会压力的范畴，通过运用一个强有力的策略，迫使我们遵守自己的许诺。

受托谈判代理人

假如一名工人声称自己不能接受任何低于5%的工资涨幅，凭什么老板应该相信他一定不肯退让而接受4%的工资涨幅呢？摆在桌面上的银子完全可以引诱人们回头再作一次谈判。如果这名工人有别人代为谈判，他的地位就会有所改善。工会领袖担任谈判者的时候，其地位可能不够灵活。他可能被迫坚守自己的许诺，否则就会失去工会会员的支持。这名工会领袖要么从其会员那里得到一份有条件的委托，要么公开宣布自己的强硬立场而使自己的声望面临考验。实际上，工会领袖变成了一个受托谈判代理人。他作为一个谈判者的权威建立在他的地位之上。有时候他根本无权妥协，批准合同的必须是工人们，而非这名工会领袖。有时候，这名工会领袖若是做出妥协，可能导致他下台走人。

第二种受托谈判代理人是机器。没有多少人会跟一台自动售货机讨论价格问题。

美国政府认为，IBM把重心放在短期租赁的做法设置了一道进入屏障，使其独享了垄断的好处。IBM辩解说这一做法完全是为了消费者利益着想。它认为，签订一份短期租赁合同后，消费者就不必担心自己使用的机器可能过时，从而享有灵活性，并且可以在需要的时候改变合同，同时还可在合同中规定由IBM负责保养出租的机器。许多人认为这番辩解令人信服。不过，租赁做法还有一个优势策略，双方似乎都没注意到，假如IBM对其大型计算机只是出售而绝不出租，你认为大型计算机的价格会有怎样的变化？

即便是一个没有外部对手的公司，也不得不担心怎样跟以后的自己竞争。每次推出一款新的计算机，IBM都能以非常高的价格把首批产品卖给那些迫不及待想尝试最新技术成果的消费者。一旦这款计算机的大批量生产可行，就会出现一种诱惑，促使公司降价，从而吸引更多消费者。生产这款计算机的主要成本在开发阶段已经发生了，此后每多卖一台，其所得基本上就是利润。这里有一个问题：假如消费者估计IBM差不多要降价了，他们就会稍等一下再购买。一旦大多数消费者都在观望，IBM就有动机加速减价进程，希望早日俘获消费者。这个想法首先是由芝加哥大学法学教授罗纳德·科斯提出的。他认为，对于耐用产品，一个垄断者实际上是在跟以后的自己竞争，从而使市场变得富有竞争性。

在教科书市场上也遇到了同样的问题。假如承诺有可能存在，出版商一定会通过每五年推出一部新版教科书的方式提高利润，而不是沿用现在通行的三年周期。周期越长，这部教科书在二手教科书市场上的价值就越高，相应地，新版推出之际学生的购买积极性也会越高。问题在于，一旦出现二手教科书，出版商就有很强的动机想通过推出新版削弱二手教科书的竞争。由于人人都知道这样的事情一定会发生，因此，学生们可以用较低的价格买到二手教科书，因而也就不那么愿意花钱购买新版了。出版商的解决办法与IBM的解决办法一样：应该出租教科书，而不是出售教科书。

正确估计并回应不可预测性不仅在棒球场上非常有用，在其他领域也是一样。只要一方喜欢准确地预料将发生的事情，而另一方却竭力避免被预测，不可预测性就会变成策略的一个关键因素。实际上，选择投这种球而非那种球的概率，或者选择这人而非那人进行审核的概率，可以通过整个博弈的细节精确地确定下来。

随机性存在一种均衡模式，必须加以计算。对于奇偶数游戏，两个50∶50混合策略对彼此都是最佳选择，它们合起来就是一个均衡。这一解决方案的名称叫做“混合策略”均衡，反映了个人随机混合自己的策略的必要性。若是换了其他更一般的情况，这个均衡混合的对称性就不会显得如此明显，但仍有一些简单规则可以用来计算

从两位选手的不同角度计算最佳混合策略，会得到一个有趣的共同点：两次计算会得到同样的成功回球率，即48%。接球者若采用自己的最佳混合策略，就能将发球者的成功概率拉低到发球者采用自己的最佳混合策略所能达到的成功概率。这并非巧合，而是两个选手的利益严格对立的所有博弈的一个共同点。这个结果称为最小最大定理，由前普林斯顿数学家约翰·冯·诺依曼与奥斯卡·摩根斯坦创立。这一定理指出，在零和博弈里，参与者的利益严格相反(一人所得等于另一人所失)，每个参与者尽量使对手的最大收益最小化，而他的对手则努力使自己的最小收益最大化。他们这样做的时候，会出现一个令人惊讶的结果，即最大收益的最小值(最小最大收益)等于最小收益的最大值(最大最小收益)。双方都没办法改善自己的地位，因此这些策略形成这个博弈的一个均衡。

最小—最大定理的普遍证明相当复杂，不过，其结论却很有用，应该记住。假如你想知道的只不过是一个选手之得或者另一个选手之失，你只要计算其中一个选手的最佳混合策略并得出结果就行。

所有混合策略的均衡具有一个共同点：每个参与者并不在意自己在均衡点的任何具体策略。一旦有必要采取混合策略，找出你自己的均衡混合策略的途径就在于使别人对他们自己的具体行动无所谓。虽然这听上去像是一种倒退，其实不然，因为它正好符合零和博弈的随机化动机：你想阻止别人利用你的有规则的行为占你的便宜。假如他们确实倾向于采取某一种特别的行动，从你的角度观察，这只能表示他们选择了最糟糕的方针。说到这里，我们已经解释了采取混合或者随机策略的好处，以及这么做的策略必要性。基本要点在于，运用偶然性防止别人利用你的有规则的行为占你的便宜。

一旦接球者以为看穿了对方的惯用手法，而放弃自己的均衡混合策略，一心要占对方便宜，就会上发球者的当。发球者乍看起来很傻的混合策略可能只是一个陷阱。只有采取自己的均衡混合策略才能避免这一危险。

假如一个参与者选择的是他的最佳混合策略，那么，无论对手采取什么样的策略，他的成功率都是一样的。假设你是网球比赛例子里的接球者，而发球者已经选择了他的最佳混合策略，即40∶60的混合策略。那么，无论你向正手方还是反手方移动，又或是时而正手方，时而反手方，你的成功回球率都是48%。意识到这一点，你可能打算免掉计算自己的最佳混合策略的麻烦，只随便选定一种行动，并指望对手选择他的最佳混合策略。问题在于，除非你选择自己的最佳混合策略，否则你的对手就没有动机选择他自己的最佳混合策略。举个例子：假如你选择向正手方向移动，他会转向攻击你的反手方。为什么你应该选择自己的最佳混合策略？理由就是迫使对方继续使用他的最佳混合策略。

随着接球者的技巧不断改进，他的成功率自然也会提高。不过，出人意料的是，这一提高了的成功率是由减少使用改进了的反手技巧取得的。在第1章的妙手传说中，我们说过这样的事情有可能发生；现在我们就来解释一下。原因在于两位参与者的策略的相互影响。当接球者更善于反手回球，发球者就会多向他的正手方发球(向正手发球的比率达到43%，而不是原来的40%)。为了适应这个变化，接球者也会多向正手方移动。反手技巧改进了，正手技巧的威力也因此释放出来。好比拉里·伯德的例子，随着他的左手投篮得分率上升，对方防守他的策略不得不发生同样的改变，结果反而给了他更多机会右手投篮。

心理学家已经发现，人们往往会忘记这样一个事实，即投掷硬币翻出正面之后再投掷一次，这时翻出正面的可能性与翻出反面的可能性相等；这么一来，他们连续猜测的时候就会不停地从正面跳到反面，很少出现连续把宝押在正面的情况。

最后给你一个警告。即便在你采用了自己的最佳混合策略的时候，你还是有可能得到相当糟糕的结果。

假如你采用了自己的最佳混合策略，那么，另一个参与者能不能发现这一点无关紧要，只要他不能提前发现你通过自己的随机机制为某个具体情况确定的具体行动方针。对于你的随机策略，他无计可施，占不了你的便宜。均衡策略恰恰就是用来防止对方通过这样的方式占你的便宜。不过，假如出于某种原因，你没有采取自己的最佳混合策略，这时，保密就是关键。泄露这一信息会让你付出巨大代价。与此同时，你也有同样的机会使对手误解你的计划。

行动确实胜过言语一筹。通过观察你的对手的行动，你就能判断他想跟你说的事情究竟有几分可以相信。从我们列举的例子中可以看到，你不能单单按照字面意思理解对手所说的事情。但这并不表示在你努力识破他的真实意图时，应该忽略他的行动。一方按照怎样的比例混合其均衡策略，关键取决于他的得益。因此，观察一个参与者的行动可以提供一些有关正在使用的混合比例的信息，同时这种观察也是一个很有价值的证据，有助于推断对手的得益。

目前为止，我们还只是将随机策略的应用集中在参与者利益严格对立的博弈上。在某种程度上显得更出人意料的还是找出随机行动的均衡的可能性，即便博弈的参与者存在共同利益。遇到这种情况，混合自己的策略可能导致各方得到更差的结果。不过，仅仅是结果更差并不表示这些策略就不是一个均衡：均衡是一种描述，不是一项指示。

混合自己的策略的原因来自合作失败。这个问题只出现在缺乏一个独一无二的均衡的时候。欧·亨利小说《麦琪的礼物》(TheGiftoftheMagi)里的那对夫妻。“谁也不会计算”他们彼此的爱情，他们彼此都愿意——甚至迫切希望——为对方做出任何牺牲，换取一件真正配得起对方的圣诞礼物。德拉愿意卖掉自己的头发，为吉姆买一条表链，配他从祖先那儿继承下来的怀表，而吉姆愿意卖掉这块怀表，买一把梳子，配德拉的漂亮长发。假如他们真的非常了解对方，他们就该意识到，为了给对方买一份礼物，两人都有可能卖掉他或者她的心爱之物，结果将是一个悲剧性的错误。德拉应该三思而行，好好想想留下自己的长发等待吉姆的礼物会不会更好。同样，吉姆也不要考虑卖掉自己的怀表。当然，假如他们两人都能克制自己，谁也不送礼物，又会变成另外一种错误。

尽管这对夫妻的利益在很大程度上是一致的，但他们的策略还是会相互影响。德拉保住自己的头发而吉姆卖掉他的怀表是一种可能的均衡；各人的策略都是对对方策略的最佳回应。不过，若情况是德拉卖掉她的头发而吉姆保住自己的怀表，这也是一个可能的均衡。会不会存在一种彼此了解的共识，从而可在两种均衡中做出取舍呢？由于“出人意料”是礼物的一个重要特点，因此他们不会提前商量以达成共识。

混合策略有助于保住这个“出人意料”的特点，可要付出代价。不难发现，各人都用2/3的机会选择献出而以1/3的机会选择接受，也能达到一个均衡。出错的概率相当大：9次里面有4次，这对夫妻会发现对方卖掉了自己买礼物回来相配的心爱之物(正如欧·亨利的小说提到的那样)，有1次大家都得不到礼物。由于存在这些错误，平均得分(两人各得2/3分)还比不上原来两种均衡得到的结果，在这两种均衡当中，各有一方送礼物而另一方收礼物(施者得2分，受者得1分)。这和网球比赛的例子不同，在网球比赛的例子中，各方确实可以通过混合自己的策略提高成功率。

为什么会有这种区别？网球是一个零和博弈，选手们的利益严格相悖。他们在独立选择混合策略的比例时会取得较好的结果。而在《麦琪的礼物》里，两夫妻的利益在很大程度上是结合在一起的。因此，他们必须协调他们混合策略的比例。他们应该投掷一枚硬币，按照硬币翻出的结果决定谁该送礼物，谁该收礼物。这对夫妻有一个小小的利益矛盾：吉姆喜欢左上角的结果，而德拉喜欢右下角的结果。经过协调的混合策略可以使他们达成一个妥协，化解这个矛盾。若用一枚硬币决定谁送礼物而谁收礼物，那么各人的平均结果就都会变成1.5分。当然，“出人意料”这一元素也不存在了。

到目前为止，我们提到的混合策略的例子几乎全都来自体育竞技场。为什么现实世界里见不到几个将随机行为应用到商界里去的例子呢？首先，假如企业文化说的是努力保持对结果的控制权，就不大可能推广让概率决定结果的主张。出了问题之后更是如此，因为随机选择行动的时候总会出现偶然问题。关键并不在于冒险策略总能成功，而在于冒险策略可以避免出现固定模式，并防止别人轻易预测自己的行动。

折扣券是运用混合策略改善企业业绩的一个例子。诸如可口可乐与百事可乐这样的竞争对手之间的折扣券策略博弈，其实就跟吉姆和德拉的合作问题极为类似。两家公司都想成为提供折扣券的公司。但是，假如他们同时这么做，折扣券就不能发挥原来设想的作用，两家的结局甚至会比原来更糟。一个解决方案是遵守一种可预测的模式，每隔半年提供一次折扣券，几个竞争者轮流提供折扣券。这个方案的问题在于，当可口可乐预计到百事可乐快要提供折扣券的时候，它就应该抢先一步提供折扣券。要避免他人抢占先机，唯一途径就是保持“出人意料”的元素，而这一元素来自一个随机化的策略。

在商界还有其他例子可以说明我们必须避免陷入一个固定模式，防止对手轻易预测我们的行动。一些航空公司向愿意在最后一分钟买票的乘客提供优惠机票。不过，这些公司不会告诉你究竟还剩下多少座位，而这个数字本来有助于你估计成功得到机票的机会有多大。假如最后一分钟所剩机票的数量变得更容易预测，那么乘客利用这一点占便宜的可能性就会大得多，航空公司也会因此失去更多本来愿意购买全价机票的乘客。

在商界，随机策略的最广泛用途在于以较低的监管成本促使人们遵守规则。这已经应用于从税收审计、毒品测试到付费停车计价器的许多领域，同时解释了惩罚不一定要和罪行吻合的原因。

那些希望击败监管当局的人，也可以利用随机策略为自己谋利。他们可以将真正的罪行隐藏在许许多多虚假情报或罪行里（藏木于林），从而使监管者的注意力和资源大大分散，以至于不能有效发挥作用。比如，防空体系必须保证摧毁所有的入侵导弹，对进攻方而言，击败防空体系的一个办法是用假导弹掩护真导弹，一枚假导弹的成本远远低于一枚真导弹，除非防守方可以百分百识别真假导弹，否则防守方就不得不摧毁所有入侵导弹。

我们普通人也会运用边缘政策，只不过不会产生那么深远的国际影响罢了。比如公司管理层与工会可能面临一场毁灭性的罢工，固执己见而不能达成妥协的夫妻可能离婚，意见不一的国会议员假如不能通过预算案，就会让政府关门：这些案例的双方其实都会用到边缘政策。他们故意创造和操纵着一个有着在双方看来同样糟糕的结局的风险，引诱对方妥协。

边缘政策是一个充满危险的微妙策略，假如你想成功地运用这个策略，你必须首先彻底弄明白它究竟是怎么一回事。要想透彻地理解边缘政策，关键在于，必须意识到这里所说的边缘不是一座陡峭的悬崖，而是一道光滑的斜坡，它是慢慢变得越来越陡峭的。

边缘政策的本质在于故意创造风险。这个风险应该大到让你的对手难以承受的地步，从而迫使他按照你的意愿行事，以化解这个风险。这么一来，边缘政策变成一个策略行动，属于我们在第5章介绍的类型。和其他任何策略行动一样，边缘政策的目的是通过改变对方的期望来影响他的行动。实际上，边缘政策是一种威胁，只不过属于非常特殊的类型。要想成功运用边缘政策，你首先必须了解其独特之处。我们通过三个问题分析这些独特之处：第一，为什么不直接用一种表示可怕结果一定会出现的确定性威胁你的对手，而只是借助一个单纯的风险来暗示可怕的结果可能出现？第二，最终确定风险是不是已经过去的机制又是什么？第三，这个风险的恰当程度应该如何把握？

在美国希望苏联从古巴撤出导弹的前提下，肯尼迪为什么不直接威胁说，假如赫鲁晓夫不拆除那些导弹，他就会将莫斯科夷为平地？按照我们前面(第5章)介绍的术语，这将是一个令人信服的威胁；它必须具体说明对方退让的确切条件(将导弹撤回俄罗斯，还是装箱后搬上哈瓦那港的一条船)以及退让的最后期限。问题在于，在实践当中，这么一个威胁不会有人相信，赫鲁晓夫不相信，其他什么人也不会相信。不错，这个威胁中提到的行动将会引发一场全球性的核战争，但这个危险本身实在太夸张了，以至于让人难以置信。假如导弹没有在最后期限之前撤离，肯尼迪一定不愿意将整个世界夷为平地，而更加愿意考虑延长留给苏联的最后期限，推后一天，再推后一天，如此下去。

虽然表明战争必然爆发的确定性的威胁并不能让人信服，但表明战争可能爆发的风险或概率却可以变得可信。假如赫鲁晓夫不肯退让，就会出现一种风险，而不是一种确定性，表明导弹可能发射。这种不确定性降低了这个威胁的程度，从而使美国觉得这个威胁比较容易承受，因此在苏联看来也更加可信。这跟我们在第6章提到的另一个提高可信度的办法相似，即小步前进。美国或苏联方面的每一次不让步都会加大爆发世界大战的风险；而他们的每一个小的让步则都会减少这个风险。假如肯尼迪愿意走得比赫鲁晓夫更远，那么肯尼迪的边缘政策就会取胜。肯尼迪不能令人信服地威胁说他马上就要发动一场全面的核打击，但我们还要考虑肯尼迪怎样才能以爆发战争的风险而不是爆发战争的确定性威胁对方。这里我们看到了前面提过的那道光滑的斜坡。

怎样着手创造一个包含风险的威胁呢？在第7章，我们研究了有关混合行动的想法，提出了几种随机机制，若要从一系列混合行动中选择一个行动，我们可以借助这些机制进行选择。现在我们也可以尝试同样的办法。举个例子：假设在古巴导弹危机期间，肯尼迪要以爆发战争的风险威胁对方，这种风险合适的可能性应该是六分之一。接着，他可以告诉赫鲁晓夫说，除非苏联导弹在星期一之前撤出古巴，否则他就会投一个骰子，若是碰巧投出一个六，他就会下令美国军队发射导弹。不过，与这一幕隐含的可怕情景相反，这一招未必行得通。假如赫鲁晓夫就是不肯就范，而肯尼迪也确实投出了一个六，但实际决策权还是在肯尼迪的手里。在末日来临前，他会有一种强烈的愿望，想再给赫鲁晓夫一个机会，也就是再投一次骰子(“我们来一个三局两胜吧”)。赫鲁晓夫早就看穿了这一点，也知道肯尼迪同样明白这一点。于是这个威胁的可信度一定会丧失殆尽，就好像从来没人提过这个精心设计的投骰子决定的机制一样。

这里必须看到：当一座陡峭的悬崖被一道光滑的斜坡取代时，就连肯尼迪本人也不知道安全的界线究竟在哪里。这就好比他在玩一场核战争的俄罗斯轮盘赌，而不是投一个骰子。有一个数字会引发大灾难，但他并不知道究竟是哪个数字。假如当真出现这个数字，他不可能改变主意再投一次。在与理性的对手较量时，没人愿意越过核战争的边缘，却有可能由于一个错误而滑下那道光滑的斜坡。边缘政策创造了一种刚刚超出控制的情况，故意掩盖了那道悬崖。因此，边缘政策的风险与混合行动的概率元素存在根本区别。假如你的网球发球的最佳混合比例是正手和反手各占50%，而你在某一次特定发球前投一枚硬币，若是翻出正面，你没有理由感到高兴或不高兴。你对自己的每一次行动毫不在意；真正重要的是每一次的不可预测性以及正确的混合比例。而边缘政策则是你愿意在事实发生前创造这个风险，却在时机来临时不愿意将这个风险付诸实践。要想让你的对手相信你威胁的后果一定会发生，你还要借助其他一些渠道。

最常见的是采取超出你的控制的行动。这不是“假如你不服从我，就会出现我会这么做的风险”的问题。相反，这是“假如你不服从我，就会出现不管到时候你我会不会感到后悔不迭都会发生这样的事情的风险”的问题。因此，边缘政策的可信度离不开一个约定机制；只不过这个机制包含一枚硬币或一个骰子，用于决定究竟出现什么结果。这里引出了一个机器人或一台电脑按照骰子投出的数字自行行事的情形，但它却是一种不会变成现实的情形。不过，在许多情况下，担心“局势可能超出控制”的普遍的恐惧心理可以收到异曲同工之妙。肯尼迪没有必要确切说出世界末日的出现概率究竟有多大。

现在我们遇到一个问题。许多创造风险的机制不允许对这个风险的程度进行足够精确的控制。我们前面已经看到肯尼迪是怎样运用内部政治和标准操作程序确保局势可能超出他的控制的，且局势不会由于肯尼迪自己有心退让而受到影响。不过，同样是这些事情，使他难以确保这个风险不会上升到连美国自己也感到难以承受的程度。肯尼迪自己估计的这个风险——概率介于三分之一与一半之间——是一个具有较宽范围的风险，不由得让人担心这个风险究竟能不能得到有效控制。对于这个两难问题，我们没有任何完美的或普遍有效的答案。边缘政策通常会是一个很管用的办法，却同样可能变成某种冒险经历。

还有最后一个方面的控制，是使边缘政策发挥效力所不可缺少的因素。受到威胁的一方通过同意边缘政策者的条件，必须有能力充分减小这一风险，通常是一路减小到零。斯佩得必须得到保证，只要古特曼知道那个秘密，他的心情一定会马上平静下来，而赫鲁晓夫也必须得到确认，只要他一退让，美军马上会撤退。否则，如果无论你做或不做，你都会遭到惩罚，也就不存在什么退让的激励了。

无论怎样运用边缘政策，总有一种跌落边缘的风险。虽然策略家们回顾古巴导弹危机的时候会把它当做边缘政策的一个成功应用，但假如超级大国之间爆发一场战争的风险变成现实，我们对这一案例的评价就会完全不同。若是真的爆发了战争，幸存者一定会责怪肯尼迪完全没有考虑后果，毫无必要地就把一场危机升级为一场灾难。不过，说到运用边缘政策，跌落边缘的风险经常会变成现实。

欧洲人担心北约的核保护伞可能抵挡不住苏联常规军队的暴风骤雨的原因在于，因为核武器的威胁太大，如果它的使用是不合理的，那么这个威胁也不可能是合理的，一旦失去威胁的价值，核武器对阻吓小型冲突也就毫无价值。即使美国决心保卫欧洲，核武器的威胁遇到苏联的小型进攻，根本不可信。苏联可以运用每次切一小片的“意大利香肠”战术，钻核武器威胁的这个空子。

美国就苏联在欧洲的常规入侵发动核报复的威胁是边缘政策之一。有两个办法可以绕过被迫重新确定忍耐底线的问题。这两个办法边缘政策都会用到。首先，你要设法让惩罚措施的控制权超出你自己的控制，从而断绝你自己重新确定忍耐底线的后路。其次，你要将悬崖转化为一道光滑的斜坡。每向下滑一步都会面对失去控制而跌入深渊的风险。这么一来，你的对手若要用“意大利香肠”战术避开你的威胁，就会发现他自己将不断面对一个很小的遭遇灭顶之灾的概率。他每切下一小片香肠，无论这一片有多小，都有可能成为引发万劫不复灾难的最后一片。要使这种威胁变得可信，一个必不可少的要素在于，无论是你还是你的对手都不知道转折点究竟在哪里。

一个很小的遭遇灭顶之灾的概率可以具有和一个很小的遭受惩罚的必然性同样的威胁价值。美国通过创造一个风险，即哪怕政府本身竭尽全力防止，导弹还是可能发射出去的风险，成功地运用了边缘政策。美国的威胁能不能付诸实践与它本身的意愿无关。核武器的威胁在于可能出现意外事故。当存在任何常规冲突都有可能使局势激化到失去控制的可能性时，核阻吓就变得可信了。这一威胁不是一定发生，而是一种同归于尽的可能性。

核阻吓包含一个基本的得失结果。有能力发出同归于尽的威胁，本身就存在一种价值。毕竟，在人类进入核时代之后，我们享受了半个世纪没有爆发世界大战的和平。不过，把我们的命运交给概率去控制是要付出代价的。核阻吓要求我们接受某种同归于尽的风险。关于核阻吓的争论大部分集中在这种风险上。我们有什么办法可以降低爆发核战争的可能性，同时又不会削弱核阻吓的力量呢？诀窍同样在于确保这样的普遍化的风险控制在有效的与可接受的界限内。本章我们已就怎样做到这一点给出了一些提示，不过，完全成功的边缘政策仍是一门艺术和一种冒险。

怎么才能达成最佳模式呢？

你要不要遵守速度限制？在这个博弈里，你的决定会与其他司机的决定发生互动。假如谁也不遵守这项法律，那么你有两个理由也违反这项法律：首先，一些专家认为驾驶的时候与道路上车流的速度保持一致实际上会更安全。在大多数高速公路上，谁若是开车只开到每小时55英里，就会成为一个危险的障碍物，人人都必须避开他。其次，假如你跟着其他超速驾驶者前进，那么你被逮住的机会几乎为零。警方根本没工夫去逮只占一个很小百分比的超速汽车，让它们统统停到路边，一一进行处理。只要你紧跟道路上的车流前进，那么总体而言你就是安全的。假如越来越多的司机遵守法律，上述两个理由就不复存在。这时，超速驾驶变得越来越危险，因为超速驾驶者需要不断在车流当中穿过来又插过去。而你被逮住的可能性也会急剧上升。

我们的意见是，假如谁也不肯以低于法律限制的速度行驶，你也不该那样做；假如人人遵守法律，你也应该遵守。在两条路线之间选择的那个案例中，整个动态过程趋向收敛于中间的均衡。而在这里，趋势变成朝向其中一个极端。之所以出现区别，原因在于互动的方式。在路线选择的案例中，一旦越来越多人跟随你的选择，无论你选择哪条路线，这条路线的诱惑力都会降低。而在超速行驶的案例中，跟随你的选择的人越多，这个选择的诱惑力就越高。

一个人的选择会影响其他人的普遍原理在这里同样适用。假如有一个司机超速驾驶，他就能稍稍提高其他人超速驾驶的安全性。假如没有人超速驾驶，那就谁也不想做第一个超速驾驶、为其他人带来“好处”的人，因为那样做不会得到任何“补偿”。不过，这里出现了一个新的变化：假如人人超速驾驶，谁也不想成为唯一落后的人。

立法者若是希望鼓励驾驶者遵守速度限制，他们可以从上述讨论中得到什么启示呢？不一定要把速度限制抬得很高，从而使大家乐于遵守。关键在于争取一个临界数目的司机遵守速度限制。这么一来，只要有一个短期的极其严格且惩罚严厉的强制执行过程，就能扭转足够数目的司机的驾驶方式，从而产生推动人人守法的力量。均衡将从一个极端(人人超速)转向另一个极端(人人守法)。在新的均衡之下，警方可以缩减执法人手，而守法行为也能自觉地保持下去。这一讨论隐含的更具普遍意义的启示在于，一个短暂而严厉的执法过程的效率，可能大大高于一个投入同样力量进行的一个长期而温和的执法过程。

美国城市没有几个种族混合居住的社区。假如一个地方的黑人居民的比例超过一个临界水平，这个比例很快就会上升到接近100%。假如这一比例跌破一个临界水平，我们可以预计，这里很快就会变成白人社区。维持种族和谐居住需要一些富有独创性的公共政策。社会动力将一直推动整个社区向一个极端的均衡移动。谢林将这一现象称为“颠覆”。现在我们就来看看为什么会出现这种现象。

假定中间的均衡是70%的白人和30%的黑人。偶然地，一户黑人家庭搬走了，搬进来一户白人家庭。于是这一社区的白人比例就会稍稍高出70%。下一个搬进来的人也是白人的概率就会高于70%。这个新住户加大了向上移动的压力。假设种族混合比例变成75∶25。颠覆的压力继续存在。这时，新住户是白人的概率超过75%，我们可以预计整个社区将会变得越来越隔离。这一趋势将一直发展下去，直到新住户种族比例等于社区人口种族比例，这一情况只在整个社区变成全白人社区的时候出现。假如反过来，变化过程从一户白人家庭搬走而一户黑人家庭搬进来开始，就会出现相反方向的连锁反应，整个社区将会变成全黑人社区。

问题在于70∶30的种族混合比例不是一个稳定均衡。假如这一混合比例或多或少遭到破坏，而这是很有可能发生的事情，就会出现向其中一个极端移动的势头。令人遗憾的是，无论到达哪个极端，都不会出现类似的回到中间的势头。虽然隔离是一个早已料到的均衡，但这并不意味着人们会在这一均衡过得更好。每一个人大约都希望住在一个混居社区。但这样的社区几乎不存在，即便找到了多半也维持不下去。

这里我们再次看到，问题的根源在于一户人家的行动对其他人家的影响。从70∶30的比例开始，若有一户白人家庭取代一户黑人家庭，这个社区在打算搬进来的黑人家庭看来就会减少一分吸引力。但造成这一结果的人不会被罚款。用道路收费站打个比方吧，我们也许应该设立一个离开税。不过，这么做将与一个更具根本性的原则发生矛盾，这一原则就是选择在何处居住的自由。假如社会希望防止出现“颠覆”，就不得不另找其他政策方法。假如我们不能向一户打算搬走的家庭收缴罚金，说他们对仍然住在那里的住户以及现在可能不想搬进来的住户造成了损害，那么，我们就要采取措施，降低其他人跟随照搬的激励。假如一户白人家庭走了，社区不该就此对外面的另一户白人家庭减少一分吸引力。假如一户黑人家庭走了，社区不该就此对外面的另一户黑人家庭减少一分吸引力。公共政策有助于阻止这个颠覆过程加速。

顶尖律师事务所通常会从自己内部资历较浅的同事当中选择合伙人，使之成为新的股东。没被选上的人必须离开，而且通常会转到一家不那么有名的律师事务所。在虚构的贾斯廷-凯斯律师事务所，选择标准是如此挑剔，以至于多年来根本选不出一个新股东。资历较浅的同事对职位停滞不前的状况提出抗议。股东们的回应则是推出一个看上去非常民主的新体系。以下就是他们的做法：到了一年一度的决定股东人选的时候，10名资历较浅的年轻同事的能力会按1到10打分，10分为最高分。这些资历较浅的同事私下得知了自己的最后得分，然后被请进一个大会议室，他们将在那里自行投票决定成为股东的必需得分。

他们一致认为，大家都能当上股东是一个好主意，当然他们更愿意回到从前人人都不是股东的日子。于是他们将必需得分定为1分。接着，其中一个得分较高的同事建议将必需得分定为2分。他的理由是这样可以提高整个股东团体的平均素质。这一建议得到9票赞成。唯一的反对票来自能力最差的同事，而这个人就这样失去了成为股东的资格。接下来，有人提议将标准从2分提高到3分。这时，还有8人得分高于3分，他们一致赞成这一改善整个股东团体的提议，只得到2分者的反对，因为这一提议使他失去了成为股东的资格。令人惊讶的是，得分最低的同事对提高标准的提议投了赞成票。无论这一提议能不能通过，他反正不能成为股东。不过，若是这一提议通过，他就能跟得分为2的同事一起成为落败者。这么一来，其他律师所虽然知道他落败了，却没办法搞清楚他究竟得了积分，有多大本事。他们只会猜测他可能得了1分或2分，而提高这一不确定性对他本人有利。于是，提高得分标准的提议以9票赞成、1票反对获得通过。

以后每通过一个新的得分标准，都有人建议提高1分。所有得分超过这一建议标准的人都会投票支持，希望提高整个股东团体的素质(而又不必牺牲他们自己的利益)，而所有得分低于这一建议标准的人也愿意投赞成票，希望自己的落选原因变得更加扑朔迷离。每一回合都只有一人反对，就是那个刚好处于现有得分标准、一旦建议通过就没有机会入选股东的同事。但他的反对以1∶9的悬殊比数败下阵来。如此下去，直到得分标准一路上涨为满分10分。最后，有人建议将得分标准提高为11分，因为这样一来就没人可以成为股东了。所有9分或低于9分的同事都觉得这个建议不错，因为这个建议和前面的建议一样，可以使落选者的平均素质看上去更好一些。外人不会认为他们当不上股东就是一个水平低劣的信号，因为这家律师事务所里面谁也没有当选。唯一的反对票来自能力最高的同事，他可不想失去成为股东的资格。可惜，他的反对以1∶9的比分落败，没能扭转局面。这一系列的投票，最后使每一个人都回到起点位置，他们认为这个结果比大家都得到提升的结果更糟糕。不过，即便如此，这一系列投票的每一个决议还是以9票赞成、1票反对的大比数通过。这个故事有两个启迪。

1989年，美国国会在投票决定要不要为自己加薪50%的时候遭到失败，由此亲身领会了这一危险。最初，加薪看起来得到了参众两院的广泛支持。当公众听说他们的打算后，就向代表自己的国会议员发出了强烈抗议。结果呢，国会的每一位议员私底下都有了反对加薪的想法，假如他们以为即便自己投反对票，加薪提案也能获得通过。最好的结果当然是加薪提案在自己投反对票的情况下仍然获得通过。(对他们来说)不幸的是，国会有太多贾斯廷-凯斯的案例还有一个非常不同的启迪。假如你将要遭到失败，你可能愿意败在一项艰巨的工作上。失败会使其他人降低他们对你的前途的期望。这个问题有多严重，取决于你究竟败在什么地方。没能跑完10公里显然会比没能爬上珠穆朗玛峰更容易遭到耻笑。关键在于，假如其他人对你的能力的了解确实非常重要，那么，你最好增大自己失败的机会，从而降低遭到失败的严重性。向哈佛而不是一般当地大学提出入学申请的人，邀请全校最受欢迎者而不是一个普通学生做你的正式舞会伴侣的人，采用的就是这一策略。

从社会的角度看，一个牙医不应该担心降低同行的收入。每一个牙医应该设法使自己的收入达到最高。由于每一个人都做出自利的选择，从而在不知不觉之间实现了牙医在城市与乡村的恰当的分布。于是，城市和农村的牙医都能得到同样的收入。假如能有多一些的牙医在乡村开业，那么，在城市行医的潜在优势就不会被竞争和拥挤“浪费”一空。从整体来看，假如我们有可能将城市牙医的数目维持在自由市场水平以下，那么牙医的收入总和就会提高。虽然牙医们不能向选择在城市行医者收取费用，不过，创立一笔基金用于补贴愿意投身乡村的牙科学生，倒是符合这个职业的利益的。

民主政府的基石在于尊重人民通过投票箱表达的意愿。不幸的是，这些崇高伟大的想法实现起来并不那么容易。和其他类型的多人博弈一样，投票当中也会出现策略问题。投票者常常不愿表达自己的真实倾向。无论是少数服从多数的规则，或是任何其他投票机制，都不能解决这个问题，因为现在尚不存在一个完美无缺的体系，可以将个人的倾向会聚成人民的意愿。

我们以一家公司的董事局为例进行说明。该公司面临敌意收购，董事们准备投票表决。他们的当务之急在于如何应对。一共提出了四种选择，每一种都有支持者。

不同人的偏好是顺序如下：

面对这些选择，董事局必须做出抉择。每一个人都知道，投票过程很可能影响最后的结果。即便如此，他们还是认为，在决策过程中存在一个自然的次序：先是比较采取行动的积极方案，然后决定最佳方案是不是值得采纳。他们首先比较MBO与白衣骑士，然后取其中得票高者与毒药进行比较。若是确定了最佳行动方案，他们就要决定是不是值得采纳，是不是胜过坐等观望。

我们假定，5名董事局成员具备足够的远见，可以意识到自己在连续各轮投票中的行动会产生什么后果，并且按照他们的真实偏好进行投票。倒后推理使这个问题变得易于解决。你可以找到答案，发现白衣骑士方案将会最终胜出，不过，这不是我们讲这个故事的用意。我们的用意在于向读者解释创办人怎样通过做出一个歪曲偏好的承诺的办法，使最后结果在他看来有所改善。

白衣骑士方案怎么会在具有远见的投票中胜出呢？最后投票一定是在坐等观望与另外某种方案之间进行。而在这最后一轮投票中，每一个人都有诚实投票的激励，因为这将决定最后结果。很容易就能算出3种可能性：

现在我们回到前一轮。对立双方要么是毒药对白衣骑士，要么是毒药对MBO。若是第一种情况，大家更倾向于毒药和白衣骑士，而不是坐等观望。因此，无论第二轮哪一个方案胜出，都会得到采纳。董事局成员喜欢白衣骑士胜于毒药，3比2。若是第二种情况，投MBO一票实际上等于投坐等观望一票。董事局成员可以预计到，假如MBO压倒毒药成为入选的行动方案，它将在下一轮与坐等观望较量时落败。因此，在决定究竟投毒药还是MBO一票的时候，董事局成员其实是在毒药和坐等观望之间进行选择，结果是毒药胜出，4比1。这么一来，第一轮较量实际上是在毒药与白衣骑士之间进行。白衣骑士以3比2的比分胜出，并且成为以后各轮的选择。

一旦创办人意识到将会发生什么事情，他有一个策略可以帮助他得到自己最想要的结果，即毒药。现在我们就来看一下，假如创办人“采纳”外来董事局成员的偏好，又会发生什么事情。当然了，他的这一偏好转变必须可信，而且要让所有其他投票者知道。假定创办人干脆把自己的投票权交给那位外来董事，自己离开了会议室。乍看上去，这么做简直就是疯狂，因为他将采纳的偏好几乎与他的真实偏好完全相反。但是看看效果吧。投票结果会变成下面的情况：

唯一可以压倒坐等观望的行动方案是毒药。从一开始，董事局成员就应该预计到，假如毒药也会输掉，最后结果就是坐等观望。不过，MBO和白衣骑士的支持者都倾向于毒药，而不是坐等观望。他们被迫投票给毒药，因为这是他们唯一可行的选择；于是毒药胜出。通过将自己的支持转向对立面，创办人有能力做出一个可信的威胁，说要么是毒药，要么是坐等观望。结果呢，除了死心塌地支持坐等观望的人，其他人统统抛弃了白衣骑士方案(因其不能击败坐等观望)，转而支持毒药方案。表面看来，这一票的改变使坐等观望的支持者的力量加倍，实际上却导致一个在他们看来更加糟糕的结果——毒药入选，而不是白衣骑士。当然，假如那位外来董事能够洞察这一博弈，他应该拒绝成为创办人的代理人。

几个有关讨价还价过程的重要问题：会不会达成一致？能不能友好地达成一致，还是非得来一场罢工不可？谁将得到双方争夺的这张利益大饼的多大部分？

我们从简要复习工会与管理层就工资展开的谈判的基本概念开始。为了做到向前展望、倒后推理，从未来某个固定点开始考察会比较方便，因此，现在就让我们设想一家拥有自然资源的公司，比如一个夏季度假村的酒店。其旺季持续101天。每开门营业一天，这家酒店就能赚到1000美元的利润。旺季开始之际，职工工会与管理层就工资问题发生矛盾。工会提出自己的要求。管理层要么接受，要么拒绝，并于次日提出一个反建议。酒店只能在达成一致之后开门营业。

此外，谈判过程的第一天就会达成一致。由于双方向前展望，可以预计到同样的结果，它们就没有理由不达成一致，否则双方每天共损失1000美元。并非所有工会对管理层的讨价还价都会以圆满的结局收场。谈判破裂确实有可能发生，工人罢工或业主停业屡见不鲜，还有可能达成偏向其中一方的协议。但是，我们只要进一步分析前面提到的例子，对其前提做一些必要的修改，就能解释这些事实。

决定如何划分利益大饼的一个重要因素是各方的等待成本。虽然双方可能失去同样多的利益，一方却可能有其他替代做法，有助于部分抵消这个损失。假定工会与管理层谈判期间，工会成员可以外出打工，每天挣300美元。于是，每次轮到管理层提出反建议的时候，出价不仅不能低于工会将在次日得到的收入，同时当天的数目至少要达到300美元。

在其他情况下，管理层也有可能处于有利地位。比如，管理层一边与工会谈判，一边发动不愿参加罢工的工人维持酒店营业。不过，由于这些工人的效率比较低或者要价更高，又或是由于某些客人不愿意穿越工会竖立的警戒线，管理层每天得到的营业收入只有500美元。假定工会成员在外面完全没有收入。这时工会愿意尽快达成协议，根本不会当真发动一场罢工。不过，发动不愿罢工者维持酒店营业的前景会使管理层处于有利地位，它将因此得到每天750美元的收入，工会只得250美元。

假如工会成员有可能外出打工，每天挣300美元，同时管理层可以在谈判期间维持酒店营业，每天挣500美元，那么，余下可供讨价还价的数目只有区区200美元。管理层最后得到600美元，而工会得到400美元。一个具有普遍意义的结论是，谁能在没有协议的情况下过得越好，谁就越是能从讨价还价的利益大饼中分得更大一块。

一旦一名策略谈判者发现，外部机会越好，他能从讨价还价当中得到的份额也越大，他就会寻找策略做法，希望改善他的外部机会。与此同时，他还会留意到，真正影响大局的是他的外部机会与他的对手的外部机会的相对关系。他即便做出一个承诺或威胁，导致双方的外部机会同时受到损害，也还是可以从讨价还价中得到更好的结果，前提是相比之下，他的对手的外部机会受到更严重的损害。

在我们提到的例子里，假如工会成员可以外出打工，每天挣300美元，而管理层则通过由不愿参加罢工者维持酒店营业，每天挣500美元，那么，讨价还价的结果是工会得到400美元，管理层得到600美元。现在，假定工会成员放弃外出打工的100美元，转而加强设置警戒线，阻止客人进入酒店，导致管理层每天少收200美元。于是，讨价还价一开始，工会的起点是200美元(300美元减去100美元)，管理层的起点则为300美元(500美元减去200美元)。两个起点相加得到500美元，正常营业所得利润1000美元当中只余下500美元用于平均分配。结果，工会得到450美元，管理层得到550美元。工会加强警戒线的做法实际上等于做出要损害双方利益的威胁(只不过对管理层的损害更大)，它为此多得50美元。

在原有合同到期之前，工会与公司就会为达成一份新合同开始谈判。不过，这一期间没有理由着急。大家继续工作，产量方面没有损失，早一点达成协议与晚一点达成协议相比没有任何明显的好处。看上去双方都应该等到最后一刻，等到原有合同就要到期而罢工的阴云笼罩之际，再提出自己的要求。有时候确实会发生这样的事情，不过，人们通常都会更快达成协议。实际上，即便还在原有合同继续有效的平静时期，延迟达成协议也可能造成沉重的代价。谈判进程本身就存在风险。对于另一方的不耐烦、外部机会、紧张情绪或个性冲突，都有可能产生误解，同时怀疑对方没有老老实实进行讨价还价。哪怕双方同样希望谈判取得成功，谈判仍然有可能中途破裂。

以罢工形式出现的边缘政策造成代价的方式不同，但效果却是一样的。一旦罢工开始，与其说存在一种遭受大损失的小可能性，不如说存在一种遭受小损失的大可能性，甚至是必然性。随着罢工持续得不到解决，小损失不断变大，从光滑斜坡跌落的可能性也随之增长。证明自己决心的办法是接受更大的风险或者白白看着罢工的损失增长。只有当一方发现另一方确实更强大，它才会考虑退让。力量可能有很多形式：

理论上，许多这样的问题可以简化至等同于金钱总数问题的地步，但存在一个很重要的区别，即各方对这些问题的重视程度可能各不相同。类似这样的区别，为达成一致接受的讨价还价带来了新的可能性。假定一家公司有能力签下一份团体医疗保险合同，而这份保单的条件优于工人自己可能签下的保单，比如一个四口之家每年只要交付1000美元，而不是2000美元。这样的话，工人可能更愿意接受医疗保险，而不是年薪提高1500美元，同样，公司也宁可为工人提供医疗保险而不是额外多支付1500美元工资。

看起来，谈判者应该将所有有关共同利益的问题放在一起进行讨价还价，利用各方对这些问题的重视程度的不同，达成对大家来说都更好的结果。这有时候行得通；比如，以贸易自由化为目标的关税及贸易总协定的更加广泛的谈判，其成效就超过了局限于某个特定领域或产品的谈判。不过，将各种问题混合起来的做法，也使得利用其中一个讨价还价博弈创造可用于另一个讨价还价博弈的威胁成为可能。比如，美国若是威胁日本说，要打破美日军事关系，任凭日本面对俄罗斯入侵的风险而不顾，也许可以在迫使日本打开进口市场的谈判中取得更大的进展。美国当然不会坐视日本遭到入侵，因为那样并不符合它的利益；它那样说不过是一个威胁而已，目的是迫使日本在经济方面做出让步。因此，日本可能坚持要把经济与军事分开谈判。

折中妥协或平均分配是解决讨价还价问题的一个常见办法，却并非唯一途径。向前展望、倒后推理给出了一个理由，说明了我们为什么可能会看到不平等的分配。特别地，它暗示了在提出建议的时候，“施比受更好”。

比如一家钢铁公司。一场罢工正在进行。如果能够结束罢工，公司每周可以赚取300万美元利润。工会和管理层正就这笔钱的分配讨价还价。谈判每周进行一次，双方交替提出建议。

我们通过一组例子说明设计激励方案的重要思路。假定你自己是加利福尼亚一家高科技公司的老板，打算开发和推出一种新的电脑象棋游戏，名为“巫师1.0”。如果你成功了，你将得到20万美元的销售收入。如果你失败了，你将一无所获。成功或失败完全取决于你的专业棋手兼程序员的工作。她要么全神贯注，全力以赴；要么敷衍了事，得过且过。假如她有高质量的工作表现，那么，你成功的机会将达到80%；假如她只是得过且过，这一比率将降到60%。

象棋程序员只要5万美元就能请到，但他们喜欢做白日梦，这样的工资只能让他们敷衍了事。要得到高质量的工作表现，你不得不支付7万美元。得过且过的工作表现带来20万美元收入的概率只有60%，结果等于平均12万美元；减去5万美元工资，平均利润等于7万美元。假如你请到的是一个具有高质量工作表现的专家，通过同样的计算，得到平均利润等于9万美元(即20万美元×80%-7万美元)。很显然，你用高工资请一个有高质量工作表现的专家比较合算。

不过这里有一个问题：单是观察这位专家每一个工作日的表现，你看不出她究竟是全力以赴了还是在得过且过。既然你看不出高低质量工作表现的区别，怎样才能防止这名专家领取付给高质量工作表现的7万美元工资，却只给你低质量的工作表现呢？即便这个项目失败，人们总是可以怪运气不好。毕竟，就算有了全心全意的投入，这个项目还是有20%的概率遭到失败，这确实只能怪运气不好。

由于你看不出工作表现的质量是高还是低，你不得不将你的回报机制建立在一个你可以看得出区别的东西的基础之上。你要做的是向这名专家提供一份取决于最后结果的报酬：若是成功，报酬数目大一些；若是失败，报酬数目小一些。这一区别，也可以看做成功的奖金，它应该达到这样的水平：让这名专家意识到，向老板提供高质量的工作表现符合她自己的利益。出于这一考虑，奖金数目应该足够大，让这名专家知道，高质量的工作表现将使她多赚2万美元，即收入从5万美元上涨为7万美元。至于成功或失败的时候应该支付多大数目的报酬，仍然是一个问题。答案在于，若是成功，你应该向这名专家支付9万美元，若是失败，她应该向你支付1万美元的罚金。按照这个激励机制，这名程序员的成功奖金为10万美元，这是促使她提供高质量工作表现的最低数目。因此，你向她支付的平均数目为7万美元(即9万美元×80%－1万美元×20%)，其中，9万美元是你支付的数目，80%是成功的概率，而1万美元是她支付的罚金，20%是失败的概率。假如你有办法通过亲自监督看出工作表现的质量高低，这就是你应该确定的数目。这一激励机制非常管用；难以观察到的工作表现的特征对此毫无影响。

不过，这些解决方案可能实现不了，原因可能是向职员收取罚金并不合法，也可能是工人没有足够的资本，用于支付她的那一半价值1万美元的股份。这时候你该怎么办？答案是尽你所能，执行一个最接近罚金/奖金机制或股份平分方案的做法。由于有效的最小奖金为10万美元，因此，若是成功，工人得到10万美元，若是失败，工人一无所获。现在，工人的平均收入是8万美元，你的利润跌到8万美元。若是采取股份平分方案，工人只有自己的劳动力可以出卖，却没有任何资本可以投资在这个项目中。但是，你仍然不得不给她50%的股份，目的是激励她提供高质量的工作表现。于是，你的最佳做法就是卖给她一半的股份，单单换取她的劳动力。不能强制实行罚金制度或工人没有能力投资的事实意味着，从你的角度来看，最后结果不尽如人意——在这个例子里就是10000美元。这时，努力程度的难以观察性就会起作用了。

罚金/奖金机制或股份平分方案的另一个难处在于风险问题。工人一旦参加这个10万美元的博弈，她的激励就会提高。但是，这个重大风险可能无法通过最后结果的统计平均值进行评估。遇到这种情况，工人因同时提供高质量工作表现和承担风险，应该得到补偿。风险越大，补偿越高。这一额外补偿是一家公司由于不能监控工人工作表现而产生的另一项额外成本。通常，最好的解决方案就是达成妥协；向工人提供低于理想激励数目的激励，从而降低风险，同时接受由此导致的低于理想质量水平的工作表现。

在原有合作关系中，加上强制性的惩罚条款，以打消事后反悔的念头。本章主要讲述怎样设计这样的条款。人际合作关系的问题与商业合作关系如出一辙。假定有一对双职工夫妻，双方都不喜欢做饭，却又负担不了每周外出就餐超过一次的开销。他们出于直觉或经过协商决定大家平等分担家务活，每人每周做饭三天。但是，打个比方，假如妻子知道，丈夫不会因为她把自己承担的义务减为两天就跟她分手。她就有一种激励，希望发掘额外的工作，好使自己在一周中总有几天不得不在办公室多呆一小时，这么一来，她无论是如何也来不及回家做饭了，哪怕当天确实轮到她做饭。反过来，丈夫应该向前展望，预计到这个结果，然后尝试从一开始就使这个交易有助于降低妻子以后偷懒的激励。

商业合作关系情形的基本特征是什么？首先，这类情形涉及需要两个或两个以上个人或公司同时参与的项目。各方必须事先投入一笔资金，若是合作关系终止，他们就不能收回这笔资金，否则对方退出合作关系也就不会造成任何威胁。其次，在重开谈判的前提条件上一定存在某种不确定性，否则，只要一个就任何违约处以高昂罚金的简单条款就能达到这个目的。

假定开发一个电脑系统的工作包括两个部分，即开发一对相互兼容的硬件和软件组成部分。两家分别擅长上述其中一个领域的公司正在考虑这个项目。初期开发需要分别在硬件部分和软件部分投入220万美元和110万美元。初期开发以后，还将发生完成这一开发项目必需的其他成本。而在此时，潜在的合作伙伴们只知道可能产生的成本有低、中、高三种档次的区别。假定在硬件部分，低、中、高三种档次的成本分别为1800万美元、2400万美元和3000万美元，软件部分则为900万美元、1200万美元和1500万美元。完成的电脑系统预计可以创造3900万美元的经营利润。

由于硬件公司承担的成本恰好是软件公司的两倍，因此，答案看上去应该很简单。就让它们两家各自承担自己那部分开发成本好了。假如这个项目继续下去，就要首先补偿两家的开发成本，然后按照二比一的比例分配余下的利润，硬件公司得二，软件公司得一。

不幸的是这根本行不通。假定硬件公司的初期开发显示其开发成本将会降低，那么，如果它说谎，宣称自己的成本属于中的水平，就能占便宜。不管这家公司有没有说谎，该项目总会进行。不过，夸大成本将使这家公司得到额外的600万美元补偿，而分配利润的时候只会少得400万美元。无论软件公司提交怎样的成本数字，硬件公司都会多得200万美元。因此，对于硬件公司，在成本位于低水平的时候宣称成本达到中水平就是一种优势策略。软件公司面临同样的诱惑；它想把成本数字夸大为高水平。不过，由于双方都在说谎，开发阶段永远不会出现经营利润，一旦双方在开发阶段就知道这个事实，它们根本不会将这个项目进行下去。

现在我们设想一个替代方案。干脆以二(给硬件公司)比一(给软件公司)的比例分配经营利润，由两家公司各自承担自己的开发成本。这样一来就不会存在抬高成本的激励。不过，我们却失去了做出正确的取消计划的决策的步骤。软件公司得到1300万美元的经营利润。若它的成本达到高水平(1500万美元)，它当然希望取消这个计划，哪怕硬件公司的成本属于低水平，而继续下去可能给大家带来收益。而另一方面，假如软件公司的成本位于中水平(1200万美元)，它一定想将计划继续下去，哪怕硬件公司的成本位于高水平，而取消这个计划的决定可能对大家更有好处。这份合同应该允许在一方提出请求的时候取消(一方申请即判离婚)，还是应该在双方同时提出请求的时候才能取消(双方同意才能离婚)？无论采纳哪一种规则，在有些情况下都会产生违背人们意愿的结果。怎样才能将有效的启动决策与真实报告己方的成本或收入信息的激励结合起来，这是设计一份理想的合同面临的两难问题。

按成本付账

我们先将重点放在硬件公司的激励之上。最简单的解决方案是，假如硬件公司决定将开发项目继续下去，它必须补偿软件公司的成本，然后保有余下的全部利润。无论双方的成本总和是不是低于利润目标，硬件公司都将决定继续下去，它的收入为总收入减去自身开发成本，再减去对软件公司的补偿之后的数目。这一激励机制能给予硬件公司做出有效决策的激励。

硬件公司怎样才能知道软件公司的成本呢？双方可以同时宣布成本数字，并且，只在这两个数字之和低于利润目标的前提下，双方才同意将这个项目继续下去。由于硬件公司保有补偿软件公司开发成本之后的全部利润，只要余下的利润高于它的真实成本，它就希望继续下去。确保得到这一结果的唯一做法是，硬件公司宣布真实的成本数字。假如软件公司夸大其成本，那么，继续下去未必总是一个正确决策。不过，无论软件公司采取什么策略，硬件公司仍然愿意宣布真实的成本数字：说实话是硬件公司的优势策略。

同样的技巧可以用来解决软件公司的激励问题，假如情况完全相反，即软件公司得到总利润减去它自己的成本，再减去硬件公司宣称的成本数目之后余下的部分。如前所述，只要利润超过两家宣布的成本的总和，这个项目就会继续下去。一个同样的证明过程显示，宣布真实的成本数字是软件公司的优势策略。

不过，这还没完。我们还得将两个激励机制结合起来，使它们可以同时起作用。否则只能是一方说实话，却不能保证产生有效的结果。同时运行两个激励机制的问题在于，无论哪一种决定继续下去的情况，其总支出总是超过总收入！所有可以用来分配的东西就是经营利润。但这个由两个激励机制结合形成的综合激励机制却计算了两次经营利润，然后减去两家公司的成本。不足的部分等于经营利润减去两家的成本，而这个数字只要项目继续下去便是正值。解决这个问题的一个办法是让两家公司事先投入一笔合适数目的款项，用于弥补不足的部分。假如两家公司事先投入相当于预计不足部分的统计平均值的款项，那么，它们将在某些情况下有盈余，而在另一些情况下出现亏损。在我们提出的例子中，事先投入的数目应为400万美元。

如果一方在终止合作关系的时候，必须承担对方的全部支出，那么这一方就会得到正确的激励，以维持合作关系。有时候合作关系可能解除，但一方的收获并非建立在另一方的损失的基础之上。支付你加在对方身上的成本的理念，在很多情况下都非常有用。它甚至有助于我们理解拍卖当中的出价策略。

许多制造或供应合同，尤其是来自政府方面的合同，有时也有私营公司的合同，是通过密封投标的招标决定判给哪一家。每一家公司提交一个密封的信封，里面开出它愿意接受这项工程的价码。然后，所有标书放在一起进行比较，开价最低的公司胜出，同时得到它所要求的价码。假定现在有这么一份合同，比方说是建设一段高速公路，而你是一个投标者。你的成本(包括正常情况下你希望投资能够获得的回报)是1000万美元。你并不知道你的竞争者的成本，可能甚至不晓得他们究竟都是些什么人。不过，你有理由相信，他们的成本应该介于500万美元到1500万美元之间。他们当中，最佳投标者的开价落在两个极端之间任意一个数目的概率均等，也就是说，以这一范围为横轴，以每百万美元为一点，那么，落在任意一点的概率都是1/10。这时，你应该怎样开价？

你永远不会开出一个低于你的成本的价码。比如，假定你开价900万美元。如果你没能胜出，当然没问题；但若是你赢了，你得到的价码将低于你的成本。那么，开出一个高于你的成本的价码又如何？假定所有投标者都会诚实开价，我们看看如果你开价1100万美元，会发生什么事情。你必须分别考虑三种可能性。从概率角度看，十次机会里面，有五次可能遇到一些投标者开出低于1000万美元的价码，这时，你抬高开价的做法已经无法左右最后的判决；十次机会里面，有四次可能遇到最厉害的对手也开出超过1100万美元的价码，这样你可能通过开价1000万美元或1100万美元胜出，不过，较高的开价能使你多得100万美元的利润；十次机会里面，有一次可能遇到最厉害的对手开出介于1000万美元和1100万美元的价码，这时，你抬高开价的做法将使你付出痛失合同的代价。不过，若最后定价是1000万美元，这个数目只够弥补你的成本，那么这份合同对于你则可有可无。现在将上述三种情况放在一起，你可以看到，开出一个抬高的价码对你而言是一个好的策略；用博弈论的术语来说，这个策略优于诚实开价。其他参与者其实也在打同样的主意，到了最后，所有开价都被抬高了。

如果开价等于真实成本，社会就能对这段公路做出一个精确的成本效益分析，而建设这段路的决策也就有经济效益。有没有其他出价机制可以消除夸大开价的策略激励呢？有的。一个简单的机制就是将合同判给开价最低者，但付开价第二低者的价码。我们看看这一机制是怎样起作用的：假定你的成本还是1000万美元，而你打算开出1100万美元的价码。如前所述，有三种情况需要考虑。假如最厉害的对手开价低于1000万美元，你抬高开价的做法已经无法左右最后的判决。假如最厉害的对手开价也超过1100万美元，你将赢得这份合同，不过这回你将得到与最厉害的对手开价相等的价码，因此，抬高开价的做法并没有为你带来任何好处。假如最厉害的对手开价介于1000万美元和1100万美元之间，你的抬高开价的策略将使你痛失合同，而你若是说实话，将至少得到一点利润，确切地说就是最厉害的对手开出的价码超过1000万美元的那部分。概括起来，抬高你的成本在两种情况下都不会给你带来任何好处。因此，你有一个优势策略，即开出一个数目等于你的成本的价码。

我们可以从另一个角度考察这一点，从而给这个机制带来某种新的有价值的认识。当你将自己的开价从1000万美元抬高到1100万美元的时候，你是在将一个成本加在社会身上，确切地说，是在创造将合同判给一家成本比你更高的公司的机会。这里和前面提到的一样，由一方加在他人身上的成本被称为界外效益。一个好的激励机制必须促使你将你的行动的真实的社会成本考虑在内，包括你加在别人身上的一切界外效益。为达到这个目的，可以向你收取这些成本，或由于你避免了这些成本的发生而给予你的奖励。回到目前的例子上，第二种方法是有效的。由于你没有抬高开价，你就使社会避免了实施一个不必要的、代价高昂的项目的风险，由此你将得到回报，即判给你的合同价码将等于较高的开价。

对于这个案例，有效的解决方案是让开价最低的公司得到合同。这么一来，开价第二低的公司也就不会产生成本，而这笔省下的费用是一个正的界外效益。只要胜出的投标者能由这笔界外效益得到补偿，它就有说实话的激励，从而有效的决定也能顺利做出。不过，要能从投标者那里听到实话并非没有代价。美国交通部就不得不向开价最低者支付超过它自身成本的价码，确切地说就是次低开价。

我们通过这一类型的招标拍卖不仅可以购买物品，也可以出售物品。每人用密封的信封提交自己开出的价码，投标物品将售予开价最高者，但价码等于次高开价。这一方法是由哥伦比亚大学经济学家威廉·维克利发明的，称为“维克利拍卖”或“集邮家拍卖”(因为集邮杂志用这一方法以邮递途径拍卖邮票)。这里，大家还是应该开出一个真实估价。抬高开价可能使你以高于实际价值的价码赢得这场拍卖，另一方面，压低开价并不能为你省钱，反而有可能使你出局，虽然你本来非常愿意支付次高开价。实际上，这个只有一个步骤的方法可以产生与一场传统英式招标拍卖完全相同的结果。在英式拍卖中，所有投标者聚集在同一个房间，拍卖官依次叫出越来越高的价码。出价过程一直持续到只剩下一个投标者为止——一次，两次，成交！倒数第二个投标者应该只在价码超出自己估价的时候退出。于是，对该项物品估价最高者将如愿以偿，而他只需支付次高开价。不过，这其实就是“维克利拍卖”的结果。

在政府为一个道路工程征集标书的案例中，将合同判给出价最低者而非出价次低者的做法，表面看来似乎具有节约预算的优势，但只要我们明白投标者有怎样的对策，确切地说就是抬高他们的出价，这一优势也就荡然无存。开价最低者得到合同，同时得到他开出的价钱，但这个价码早已被抬高了。若是对这一问题进行一个全面的数学分析，结果将显示，这个常规做法带来的预算影响，恰好等同于以第二开价支付胜方的做法的影响。这么一来，我们讨论的这一机制与常规做法相比毫无优胜之处。造成这一等同状况的直觉理由在于，两种类型的拍卖永远应该得到同一个有效率的结果；成本最低者永远应该胜出。不过，只有在人们将自己加在他人身上的界外效益考虑在内的时候，效率才会出现。因此，在赢得招标拍卖的条件下，一家公司的最优化开价应该是次佳竞争者的预期成本，胜出的公司以预期的或平均的界外效益价码投标，而不是以实际界外效益开价。

赌博必然存在的一个事实是一人所得意味着另一人所失。因此，在参加一场赌博之前，非常重要的一点是从另一方的角度对这场赌博进行评估。理由在于，假如他们愿意参加这场赌博，他们一定认为自己可以取胜，这就意味着他们一定认为你会输。总有一个人说错了，不过，这个人究竟是谁呢？本案例分析将探讨一个看起来对双方都有利的赌博。当然实际情况不可能对双方都有利，可是，问题究竟出在哪呢？

现在有两个信封，每一个都装着一定数量的钱；具体数目可能是5美元、10美元、20美元、40美元、80美元或160美元，而且大家也都知道这一点。同时，我们还知道，一个信封装的钱恰好是另一个信封的两倍。我们把两个信封打乱次序，一个交给阿里，一个交给巴巴。两个信封打开之后(但里面的数目只有打开信封的人知道)，阿里和巴巴得到一个交换信封的机会。假如双方都想交换，我们就让他们交换。假定巴巴打开他的信封，发现里面装了20美元，他会这么推理：阿里得到10美元和40美元的概率是一样的，因此假如我交换的话，预期回报等于25美元（(10+40)/2），大于20美元，对于数目这么小的赌博，这个风险无关紧要，所以，交换信封符合自己的利益。通过同样的证明可知，阿里也想交换信封，无论她打开信封发现里面装的是10美元(她估计他要么得到5美元，要么得到20美元，平均值为12.50美元)还是40美元(她估计他要么得到20美元，要么得到80美元，平均值为50美元)。这里出了问题。双方交换信封不可能使他们的结果都有所改善，因为用来分配的钱不可能交换一下就变多了。推理过程在哪出了错呢？阿里和巴巴是否都应该提出交换呢？阿里或巴巴是否有一方应该提出交换呢？

美国政府遇到一个大问题，即如何激励数以百万计到了法定年龄的青少年去注册，等待政府征召入伍。法不责众。由于平民百姓大规模违反征兵法，对违法者进行处罚成了不可能的任务。不过，政府还是有一个很有利的条件：规矩是由它制定的。要想考察先行的好处，不妨想象人民只允许政府惩罚一个没有注册的人。政府怎样才能利用这唯一一个威胁促使大家都去注册呢？

政府可以宣布它要按照字母顺序追究违法者。但，真正有威胁的方式是禁止预先宣布任何顺序。如果一场博弈的参与者按照某种顺序排列，通常就有可能预计到排在一头的人会怎么做。这一信息会影响到下一个人，接下去影响到第三个人，如此沿着整个行列一直影响下去。按照字母顺序追究违法者有点极端化了。等我们数到朱可夫们的时候，一定有人没有注册，而且已经受到惩罚。于是朱可夫们就不必担心了。在人数众多的情况下，我们可以预计到会有一个很小数目的人群出差错。关键一点在于可以实施惩罚的数目，完全不必接近需要激励的人群的数目。将1000名示威者关进监狱的能力(和意愿)可以对数以百万计可能示威的人群产生阻吓作用。

话说有三个仇家，分别叫做拉里、莫和卷毛，他们决定来一场三方对决。总共有两个回合：第一回合，每人得到一次射击机会，射击次序分别为拉里、莫和卷毛；第一回合过后，幸存者得到第二次射击机会，射击次序还是拉里、莫和卷毛。对于每一个参与对决的人，最佳结果都是成为唯一幸存者；次佳结果则是成为两个幸存者之一；排在第三位的结果，是无人死亡；最差的结果当然是自己被对方打死。拉里的枪法很糟糕，瞄准10次只有3次能够打中目标。莫的水平高一点，精确度有80%。卷毛是神枪手，百发百中。那么，拉里在第一回合的最优策略应该是什么？在这个问题里，谁有最大的机会幸存下来？

虽然倒后推理是解决这个问题的一个稳妥途径，但我们可以运用一点向前展望的论证，向前跳一步。我们从依次讨论拉里的每一个选择开始。假如拉里打中莫，会发生什么事情？假如拉里打中卷毛，又会怎样？假如拉里向莫开枪并打中对方，他等于签下了自己的死亡保证书，因为接下来轮到卷毛，而他百发百中。卷毛不可能放弃向拉里开枪的机会，因为开枪将使他得到自己的最佳结果。拉里向莫开枪似乎不是一个非常吸引人的选择。假如拉里向卷毛开枪并打中对方，接下来轮到莫。莫会向拉里开枪。于是，假如拉里打中卷毛，他的幸存概率仍不足20%(等于莫失手的概率)。到目前为止，上述选择没有一个显得很有吸引力。实际上，拉里的最佳策略是向空中开枪！若是这样，莫就会向卷毛开枪，假如他没打中，卷毛可以向莫开枪，并把他打死。于是进入第二轮，又轮到拉里开枪了。由于只剩下一个对手，他至少有30%的概率保住性命，因为这是他打中剩下这个对手的概率。

这个案例的意义在于，弱者可能通过放弃自己的第一个成功机会取得更好的结果。如果你的幸存机会不仅取决于你自己的本事，还要看你威胁到的人。一个没有威胁到任何人的弱者，可能由于较强的对手相互残杀而幸存下来。卷毛虽然是最厉害的神枪手，他的幸存概率却最低，只有14%。莫幸存的概率是56%。拉里的最佳策略使他能以30%的精确度换取41.2%的幸存概率。

海贝壳先生的修改提议包含下列三种情况：

欧佩克的一个重要特点是其成员的生产能力各不相同。沙特阿拉伯的生产能力远远超出其他成员。同属一个卡特尔的大成员和小成员，它们的作弊激励是不是一样大？为了简化这个问题，我们只看一个小成员，即科威特。假定在合作的情况下，科威特应该每天生产100万桶石油，沙特阿拉伯则生产400万桶。对于它们两家，作弊意味着每天多生产100万桶。换言之，科威特有两种选择，分别是100万桶和200万桶；沙特阿拉伯则为400万桶和500万桶。基于双方的不同选择，投入市场的总产量可能是500万桶、600万桶或700万桶。假定相应的边际利润(每桶价格减去每桶生产成本)分别为16美元、12美元和8美元。科威特有一个优势策略：作弊，每天生产200万桶。沙特阿拉伯也有一个优势策略：遵守合作协议，每天生产400万桶。沙特阿拉伯一定遵守协议，哪怕科威特作弊也一样。囚徒困境就此破解。为什么会这样？

沙特阿拉伯出于纯粹的自利心理，有一个合作的激励。假如它生产一个较低数量，则市场价格攀升，欧佩克全体成员的边际利润上扬。假如它的产量只占欧佩克总产量一个很小的份额，它自然不会发现，原来向整个卡特尔提供这种“公共服务”对自己也有好处。不过，假如它的份额很大，那么，上扬的边际利润会有很大一部分落在它手里，因此，牺牲一些产量也是值得的。这个例子描述了走出囚徒困境的另一个途径：找出一个大慈善家，让它遵守合作协议，并容忍其他人作弊。

同样的事情见之于许多联盟。在许多国家，一个大政党和一个或多个小政党必须组成一个联合政府。大政党一般愿意扮演负责合作的一方，委曲求全，确保联盟不会瓦解，而小政党则坚持它们自己的特殊要求，而选择通常可能偏向极端的道路。以色列联合政府的小宗教团体的影响就是一个很好的例子。北约内部有另一个例子：美国承担了防务开支一个不恰当比例的份额，大大便宜了西欧和日本。美国经济学家曼库尔·奥尔森将这一现象非常简洁地称为“小国对大国的剥削”。

父母经常遇到一个难题，就是怎样惩罚做坏事的孩子。孩子们总有一种奇怪的念头，并且不相信父母真能说到做到，实施惩罚。他们认为惩罚对父母的伤害可能就跟对自己的伤害一样大(尽管受伤的原因并不相同)。父母对待这一矛盾的标准对策是强调惩罚完全是为孩子着想。父母说了要惩罚做坏事的孩子之后，怎样才能更好地使这一威胁变得可信呢？

若是一对父母加一个孩子的家庭，我们面对的是一个三人博弈。团队合作有助于父母做出一个可信的威胁，要惩罚做坏事的孩子。假定孩子当真做了坏事，按照计划，父亲应该实施惩罚。如果儿子以为，只要指出父亲这一行动的“不合理性”，即双方都将受到伤害，就能逃脱惩罚，父亲可以这么回答：假如他真有选择余地，他当然不愿意惩罚自己的儿子；但是，假如他没能实施惩罚，他就破坏了他和妻子达成的一个协议，而破坏这个协议产生的代价将超过惩罚孩子带来的代价。由此，惩罚的威胁就变得可信了。

即便单亲家庭也能玩这个博弈，只不过论证起来比较费事，因为惩罚的协议必须在父亲(或母亲)与孩子之间达成。和上面一样，假定孩子当真做了坏事，按照计划，父亲应该实施惩罚。如果儿子以为，只要指出父亲这一行动的“不合理性”，即双方都将受到伤害，就能逃脱惩罚，父亲可以这么回答：假如他真有选择余地，他当然不愿意惩罚自己的儿子；但是，假如他没能实施惩罚，这就等于他失职了，而他要为失职遭到惩罚。因此，他惩罚自己的儿子的目的在于避免自己遭到惩罚。不过，谁来惩罚他呢？答案是他的儿子！儿子会说，如果父亲原谅他，他也会原谅父亲，不会因为父亲没有惩罚自己而惩罚他。父亲会说，假如儿子不能惩罚他的过分宽容的做法，这就等于儿子在一天之内第二次做出了应受惩罚的行为！就这样，在你来我往之间，父子相互监督，都保持了诚实。这听上去可能有点牵强，却并不比大多数用于支持惩罚孩子坏行为的论证过程来得简单。

1987年，纽约市长埃德·科克成功地增加了曼哈顿的持照出租车的数目。此前50年，曼哈顿人口增加了300万，但出租车只多了100辆。出租车短缺的一个迹象是，1987年，合法经营一辆出租车的权利(俗称“大奖章”)在公开市场标价125000美元。与此同时，出租车按每天两班、每班12小时出租，每班价格约为60美元(合每年约45000美元)。假如市政府拍卖100个新的大奖章，就能轻松地赚到1250万美元。问题是，所有这些新的大奖章获得者就会担心，市政府已经发现了一个好得难以置信的发财机会。既然如此，为什么明年不再拍卖100个新的大奖章呢？如果市政府不能承诺限制大奖章的颁发数量，以保证大奖章不会变得一文不值，那么第一个后果就是再也不会有人愿意为大奖章出高价了。科克市长想知道怎样才能同时增加出租车的数目和库房收入。他正在寻找办法，使自己做出一个承诺，并以此约束自己(以及以后的政府)不要再源源不断地印制新的许可证，防止旧的大奖章大大贬值。当时，出租车与轿车委员会正左右为难，但谁也不会单单听信一个政客的话。你有什么建议？

在美国，许多私有房主都拥有自卫用的枪，而在英国，几乎没人有枪。文化差异无疑提供了一个解释。策略行动的可能性则提供了另外一个解释。在这两个国家，大多数私有房主都喜欢住在一个非武装社区。但如果他们确实有理由害怕会遇到武装歹徒，他们都愿意买一支枪。许多歹徒喜欢带上一支枪，作为他们这个行业的一个作业工具。

假如不存在任何策略行动，我们应该把这个案例当做一个同时行动的博弈，运用第3章学习的技巧进行分析。首先我们应寻找优势策略。由于歹徒在第二列的排名永远高于第一列的对应数字，我们可以说歹徒有一个优势策略：不管私有房主有没有枪，他们都愿意带上一支枪。私有房主却没有优势策略；他们愿意区别对待。如果歹徒没带枪，那他们也就没必要配枪自卫。假如我们把这个博弈当做同时行动的博弈，预计会出现什么结果？根据法则2，我们预计，拥有优势策略的一方会采用其优势策略，另一方则会根据对手的优势策略，采取自己的最佳回应策略。由于持枪是歹徒的优势策略，我们应该预计到这就是他们的行动方针。私有房主针对歹徒持枪选择自己的最佳回应策略；他们也应该持枪。尽管双方利益彼此冲突，但仍然可以就一件事达成一致：他们都倾向于谁也不持枪的结果，而不是双方都持枪的结果。怎样的策略行动才能使这个结果出现，并且怎样做才能使这个结果变得可信呢？

我们暂时假设歹徒有本事在同时行动的博弈里先发制人，首先采取一个策略行动。他们将承诺不带枪。而在这个相继行动的博弈里，私有房主并不一定非要预测歹徒可能怎么做。他们将会发现，歹徒已经采取行动，而且没有带枪。于是，私有房主可以选择回应歹徒这一承诺的最佳策略；他们也不打算带枪。这一结果对双方而言都是一种改善。歹徒通过做出一个承诺可以得到更好的结果，这并不出奇，而私有房主的结果也有了改善。双方共同得益的原因在于他们对对方行动的重视胜过对自己行动的重视。私有房主可以允许歹徒实施一个无条件行动，从而扭转其行动。

在现实当中，私有房主们并不会结成一个联合的博弈参与者，歹徒们也不会。即便歹徒作为一个阶级，可以通过采取主动、解除武装得益，这个集团的任何一个成员也还能通过作弊获得额外的优势。这一囚徒困境会破坏歹徒们率先解除武装之举的可信度。他们需要某种其他的方法，使他们可以在一个联合承诺里结为一体。如果该国历来就有严格管制枪支的法律，枪支也就无处可寻。私有房主可以自信地认为歹徒应该没带枪。英国严格的枪支管制迫使歹徒不得不“承诺”不带枪“干活”。这一承诺是可信的，因为他们别无选择。而在美国，枪支广为流行，这等于剥夺了歹徒承诺不带枪“干活”的选择。结果，许多私有房主不得不为自卫而配备枪支。双方的结果同时恶化。

这个博弈从同时行动转向相继行动之际，某种不同寻常的东西产生了。歹徒们选择按他们的优势策略先行。在同时行动的博弈里，他们的优势策略是带枪。而在相继行动的博弈里，他们却没有这么做。理由是在相继行动的博弈里，他们的行动路线会影响私有房主的选择。由于存在这么一种互动关系，他们再也不能认为私有房主的回应不受他们影响。他们先行，所以他们的行动会影响私有房主的选择。在这个相继行动的博弈里，带枪不再是一种优势策略。

THE END

策略思维sjmuvx

2022年最快一天挣300500元的4个方法，收好了！

分享三个一天挣300

来钱快的偏门赚钱路子没文化做什么工作来钱快？

投资10元一小时赚50010块钱怎么花一个月？

手机一天赚300到500的兼职(每天花一个小时就能赚钱的兼职)

训练营减肥多少钱一个月？关于减肥训练营的收费情况：一个月多少钱

策略思维sjmuvx

11个瘦子习惯，帮助你养成易瘦体质减肥身体

归元寺1~500罗汉解签大全2025