开通VIP,畅享免费电子书等14项超值服
首页
好书
留言交流
下载APP
联系客服
2010.08.28
本章主要讨论决策的准则问题。首先分析应用期望收益值作为决策准则存在的一些问题,从合理行为假设与偏好关系出发,引入效用函数的概念,从而把期望收益值推广到期望效用值。最后引入主观概率的概念,把决策准则进一步推广到主观期望效用值。这部分内容是决策分析的基础。
一般来讲,求解任何类型的决策问题,最后都归结为对各被选方案进行选择。而对方案的选择,我们可从两个方面来考虑:后果值、自然状态出现的概率。
由于方案后果在许多情况下,特别是经营管理决策中都用盈利、亏损这类指标,所以期望收益值成为决策分析发展过程中提出最早和应用最广泛的一种准则。收益值往往采用货币单位。当然,也可采用货币以外的定量单位。
期望收益值准则如下。
设为m个被选方案,为各个自然状态发生的概率,为方案在自然状态j下的后果值。
从统计学的角度出发,用数学期望来权衡方案的各种可能结果,希望从多次决策中取得的平均收益最大。
方案期望收益值为:
(10.1.1)
若方案满足
(10.1.2)
则决策者选择为最优方案。对于成本之类的后果,式(10.1.2)应为,但其原理相同,不再另行讨论。
1.后果的多样性
后果可能反映直接经济效益、间接经济效益,也可能是生态效益、社会效益。当后果值是盈利、支出等可量化的指标时,采用期望收益值的方法是可行的,但当评价指标是一些不容易量化的软指标,如在例9.3中,如何确定期望收益值将是一个难以解决的问题,或者说期望收益值将变得没有意义。
2.决策往往是一次性的,采用期望后果值是否合理?
从概率论中我们知道,概率是频率的极限。也就是说,事件发生的概率是大量重复多次试验体现出的统计学意义上的规律。这有两层含义:其一,试验必须是可在完全相同的情况下重复进行的;其二,试验必须多次进行。而决策问题,特别是战略性的决策问题,往往不满足这样的要求。比如我们说:航天飞机的发射,其可靠性是99.7%,是指通过理论上的计算得出,多次发射中成功发射出现的次数占99.7%。而对于一次发射而言,结果只能是要么失败要么成功。
下面我们来介绍数学史中的一个著名悖论。
例10.1圣.彼得堡悖论(St.PetersbergParadox)
1
正面
2
反面
22
3
23
n
2n
图10.1圣.彼得堡悖论
上式表示,不管赌徒应先交多少钱,他都是有利可图的,因为他不管每局交多少钱,都小于它可能得到的回报。然而,如果真有这样的赌局,又有哪个赌徒真地会这样做呢?这就产生一个悖论:理论上平等的赌博,在现实上是不可能有人敢于参加的,实际上也是无法实现的。
让我们考虑可猜的次数是有限的情况,设赌徒可猜10次,那么它的盈利的数学期望是10元,即交10元就有权参加这样的赌博,这样的赌博使参加的人不会感觉有多么大的风险,因为只有0.5的概率输8元,而最多可赢1024元,会有很多人愿意参加。然而,若赌徒可猜的次数是10000次,那么赌徒须交10000元才有权参加这样的赌博,同时,有1/2的是可能性输9998元,最多可赢元(概率为)。从理论上讲,同一人在多次参加这样的赌博之后,不会有什么盈利或损失(回报的期望为0),但恐怕没有哪个赌徒愿意参加。
问题在于数学期望是建立在大样本基础上的,人们在参加次数较少的情况下,当然会更在意概率较大的事件。另外一方面,人们对同样理论上都是平等的赌博,在可能输的数额不大的情况下,愿意参加的人较多;而在可能输的数额巨大的情况下,就没有人愿意参加了。这实际上也是一个人们行为动机的心理的问题,人们对风险的认识并不一定与理论结果相符。
伯努利提出了精神价值即效用值的概念。人们在拥有不同财富的条件下,增加等量财富所感受到的效用值是不一样的。随着财富的增加,其效用值总是在增加,但效用值的增长速度是递减的。他建议用对数函数来衡量效用值。
其中,w表示现有财富,A表示愿意支付的最大可能赌金。和货币期望值不同的是,该式的和不是无穷大而是有限的。
尽管伯努利的解释并不完善,但他所发现的这一悖论和提出的效用值概念,却是决策理论的奠基石。
3.实际决策与理性决策是有差异的。
彼得堡悖论中人们不认可小概率收益,Pascal赌注则恰好相反,对小概率收益寄以厚望。
4.负效应
5.决策者的主观因素(价值观)
经济学中的边际效用递减规律是指随着某种物品消费量的增加,心理满足程度会以越来越缓慢的速度增加。在这里,这个规律在决策者的决策中当然会体现,即期望收益值的增加程度,并不一定等价于决策者心理上满足感的增加程度。从另一个方面讲,对于不同的决策者,同样的收益,不一定带来同样的心理上的满足。比如买衬衣。某甲原来的衬衣都已破旧,买了一件新的。某乙原有十几件新衬衣,再买一件。同样一件衬衣,在甲看来这件新衬衣比乙心目中的价值要高得多。
而且,不同决策者,对同样数额收益或损失的心理上的反应,会随着其个人经历、知识背景、性格特点及其他主观因素的不同而不同。经历过新中国成立初期困难时期的人,与改革开放后在较好的经济条件下成长的新一代,他们对同样物质生活水平的满足感是显然不同的。前者更能感受经济发展带来的生活水平的提高;而后者会认为这样的生活水平是理所应当的,并不觉得有什么太好。
综合以上五点,我们得出以下两点结论:
1)需要一种能表述人们主观价值的衡量指标,而且它能综合衡量各种定量和定性的结果;
2)这样的指标没有统一的客观评定尺度,因人而异,视各人的经济、社会和心理条件而定。
因此,需要探求一种较期望收益值更为完善的决策准则,使其能体现实际决策中决策者对方案的衡量指标,更适合于为决策者提供更加合理、有效,也更加体现决策者意图,更加人性化的决策分析中对方案的评价指标。这既是理论上的完善,也是决策理论向实际应用迈进的重要一步。
本章的目的,就是介绍这样一种合理的评价准则,即将后果值转换为效用值,以期望效用值作为方案选择的判别准则。为此,我们在下一节中先讨论行为假设与偏好的关系。
对于一个决策问题来说,每一种方案下对应于不同的自然状态都有一个后果值,于是每一方案的后果值可用一个向量来表示,但要评价各方案的优劣,我们必须将每一方案下的这个向量合并成一个数来反映方案的优劣。在此基础上,我们才能来对各方案进行优劣评价。因此,决策分析的首要问题在于建立一种有效的方法或模型来评价备选方案,而这种方法或模型必须要有可靠的理论基础,这就是下面将要介绍的关于决策的合理行为的假设以及由此引出的结论。
考虑风险型决策问题,即各自然状态的出现概率已知的情形。首先我们引入一些新的概念,以用来描述一个方案的结果,以及方案之间的关系和运算。
定义10.1把具有两种或两种以上的可能结果的方案(行为)称为事态体,其中的各种可能结果为依一定概率出现的随机事件。如用记号来表示一个事态体,则
其中表示该行为的n中可能的结果,它们分别以的概率出现,且满足;。
时的事态体称为简单事态体,由于,可由所确定,故可简记为。
全体事态体的集合F,称为事态体空间。F中所有可能后果的集合
称为后果集。
在单目标、多目标风险型决策问题中,每一个备选方案均可用一事态体表示。如果各自然状态的顺序已定,则就是第i种自然状态出现的概率,表示该方案在第i种自然状态出现时的结果(后果值)。
例10.3有奖发票鼓励消费者索要发票,促使商家依法纳税。假设一消费者消费99元,商家此时有两种选择:
2)给100元发票(一张100元面额)
设有两种可能的结果:中奖,不中奖。这两种选择下不同的可能结果分别用表示。
假设每张发票的中奖概率为p,奖金10元,发票的税率为1%。为了分析的方便,我们设定顾客最多中奖一次。则这两种撕票的方案可用下面两个事态体表示
其中后果值为当天营业额的减少量:,,,。
我们通过下面三个步骤建立一种合理的公理化的评价准则。
第一步一个概念——偏好关系
对于后果集中任意两个可能的结果和,总可以按照既定目标的需要,前后一致地判定其中一个不比另一个差,表示为(不比差)。
1)自反性(一个方案不会比它自己差)
2)传递性
3)完备性任何两个结果都可以比较优劣,即
,二者必居其一。
在此基础上我们定义:
若,且,称与无差别,记为。
若不成立,则称有差别,记为。
若且,则称优于,记为。
例如在例10.3中,显然有。
下面我们基于偏好关系提出三条假设,将偏好关系推广到一般事态体的比较,由此得出一般事态体间的比较、运算法则。
第二步三个假设――把后果集J中结果的比较推广到标准事态体间的比较。
假设10.1设、是两个有相同可能结果(和)的简单事态体,即
,
其中。
1)当p=q时,事态体无差于事态体,记为~;
2)当p>q时,事态体优越于事态体,记为;反之,则有。
例10.4两组有奖储蓄,均发行储蓄券1万张,两组中奖者均获得同样数目奖金(400元)。所不同的是,第一组拥有可中奖彩券150张,而第二组中只拥有可中奖彩券100张,试问你愿参加哪一个组?
设和分别代表两组有奖储蓄。参加者有以下两种可能结果:中奖,获奖金;未中奖,只获少数利息。显然,。若、两个组都发行储蓄券一万张,但组内中奖个数为,组内的中奖个数为,即
于是,当时,意味着两组中出现和的可能性是相同的,即,这对于任一个储蓄者来说,参加组和参加组的中奖机会是完全相同的,因此储蓄者对于参加哪一个组是无所谓偏好的,也就是说,事态体和没有差别,~.
当时,例如=120和=150时,p=0.12,q=0.15,于是,第二组内的中奖可能性要大一些,储蓄者肯定会选择第二组,也就是说,事态体优越于,。
假设10.2(连续性)设有两个事态体,,,如若,则存在,使得当时,。
这一假设同样可以用储蓄的例子来解释。
例10.5如同例10.4,若两组中奖数额不同。设组奖金元,组奖金=400元。。两组都发行1万张。若中奖个数与中奖个数相同(均为100个),显然。若组中奖个数不是100而降为小于100的某个数,储蓄者是否有可能改变主意?
具体解释请读者自己完成。
假设10.3(无差关系、优越关系的传递性)设为三个事态体,则
1)当,时,有。(无差关系的传递性)
2)当,时,有。(优越关系的传递性)
这三条假设将后果的偏好关系推广到了事态体间的偏好关系。
从上述三条假设出发,我们可以推出下面两条重要结论。这两条结论实质上是以后内容的基础。
第三步两个定理――决策分析的理论基础
定理10.1设,--必然事件,,则必存在,使得当时,事态体无差于必然事件,即。
证明:实际上是一个p=1的特殊事态体,。比较事态体与,因为,根据假设10.2,必存在,使得当时,,又根据假设10.3的无差关系的传递性,。证毕。
如若,则称为关于、的无差概率。
例10.6(掷硬币事件)掷一枚硬币,假设掷出正面H(正)和掷出方面T(反)的概率均为0.5,A1(500,0;0.5),A2(200,200;0.5)。A1为风险型事件,A2为确定型事件。二者何为优先?
此时,A2-200元。若A2-500元,肯定不接受A1。若A2-0元,什么机会也没有,接受A1。
是否参与A1取决于另一个收益为确定值的方案,此确定值在0与500之间。可以推断,从肯定不参与到参与之间,此确定值相应有个转折点。这个转折点就是和事态体方案等价的确定值,即称为等价确定值。
如若,则;,则;假设,则的等价确定值为300。于是在本例中,A1优于A2。
定理10.2(简化性)任一有n种可能结果的事态体无差于某一简单事态体,即
(10.2.1)
其中,,为关于与的无偏概率,,。
证明:,且为关于与的无偏概率,所以根据定理10.1,
,(10.2.2)
对中所有可能的结果都利用上式进行无差代换,即:
因为,代入上式可得
定理得证。
~
T
这个定理告诉我们,任意一个标准事态体都可以转化成一个简单事态体,从而任意两个有多种可能结果的标准事态体之间的比较可以转化成与之无差的两个简单事态体的比较,且这两个事态体具有相同的结果,即可由假设10.1得出比较结果。基于无差关系和偏好关系的传递性,对于多个事态体的排序,也可由此方法完成。
上述三个假设和两个定理作为决策分析的理论基础具有十分重要的意义。在求解含有不确定因素的决策问题中,每个方案因不确定的自然状态都有若干种可能的结果。因此可被看成一个个的事态体,当它们满足前面三个假设时,由上面的两个定理可知,这些事态体都是可以进行比较的,因而这类决策问题的备选方案都可以排出优劣顺序。也就是说,对于理性的决策者,决策总可由这样一个结构化的过程完成,具体的说,对于方案集,
,(10.2.3)
(10.2.4)
其中,,
(10.2.5)
比较之间的大小即可对方案集进行排序,从而定出最优方案。
由此可以看出,对于方案集中各个备选方案的评价与排序,关键在于给出一个便于确定无差概率的一般方法和技巧。
在给出效用函数的定义之前必须说明,由于效用概念出自于经济学,决策理论及其它一些学科按照自身需要引入了这一概念,所以对它的定义是不可能都一样的。本书只是从决策分析的角度,利用效用这一概念来表示决策分析中的价值形态观念。如果它与其它学科或论著中的定义有所不同,也不妨碍我们的讨论。
若定义在集上的实值函数,满足
1)单调性:当且仅当;当且仅当
2),
3)若,则
其中。则称函数为效用函数。
特别,若取,,则,
效用函数定义中的条件3)亦可换成:
定义了效用函数,要比较m个方案
的优劣,由上节定理10.2,,其中满足。根据效用函数的定义,,从而比较各方案的优劣转化为比较的大小。称其为方案的期望效用值,记为。至此我们建立了方案评价与排序的标准。
我们看到,效用函数的定义并没有限制其唯一性。也就是说,同一事态体空间可以有不同的效用函数。这是因为效用函数体现的是方案的后果值对决策主体所能提供的作用或价值,强调决策主体主观的满意程度,因此,同样的后果对不同的决策者自然可以有不同的效用。即使是同一决策者,在不同的环境下对同一结果的主观体验也可能不同。这种与决策者主观的统一,使得决策的结果更加有效,但也使得效用函数的确定变得困难。
我们知道效用函数的定义没有限制其唯一性,效用函数没有正误之分,只体现决策者的主观偏好;但是,在具体的环境下,方案后果的效用值是可以确定的,而且效用值的大小最终取决于决策者的估算。但若对每一个结果的效用值都由决策者估算,显然是繁琐甚至是不可能的。根据经验我们发现,决策者对效用值的估计,主要决定于其对风险的态度,并且有一定的模式和类型。
确定效用函数的思路是:对于方案空间,首先找到决策者最满意和最不满意的后果值,令。然后对一有代表性的效用值,通过心理实验的方法,由决策者反复回答提问,找到其对于的后果值,它满足效用函数的性质3,即与无差:。这样就找到了效用曲线上的三个点。重复这一步骤,对之间的有代表性的另外一个效用值找到其对应的后果值。反复进行,直到找到足够多的点,将它们用平滑曲线连接起来,便可得到效用曲线。下面以一个例子具体说明。
例10.7为设计鲜花,考虑某人对一束鲜花中花的数目的效用函数,我们的后果值空间是[0,100],该决策者对其定义的偏序关系等价于。设计一系列问题供决策者回答,根据其答案确定效用曲线。
第一步,确定最优及最差的后果值。
显然,。
第二步,确定0枝与100枝之间的若干个点的效用值,并对决策者进行问答,以测定决策者对不同方案的反应。
1)假设有两个方案:①决策者可获赠一束50枝的鲜花;②以0.5概率获得一束100枝的鲜花,或没有;简写为(100,0;0.5)。供决策者选择。
回答:选择方案①
得出50枝的鲜花的效用优于方案(100,0;0.5)的效用,即。
2)将方案①变为可获赠一束30枝的鲜花。
回答:选择方案②
得出30枝的鲜花的效用差于方案(100,0;0.5)的效用,即。
3)方案①变为可获赠一束40枝的鲜花。
得出40枝的鲜花的效用优于方案(100,0;0.5)的效用,即。
4)方案①变为可获赠一束35枝的鲜花。
回答:无所谓,两种方案均可。
此时我们认为方案①无差于方案②。根据效用函数定义的性质2,得出
记。
5)将方案②变为(100,35;0.5),问与之无差的确定性获赠的枝数。
依上述方法反复提问,得到当可获赠60枝时,与新的方案②难以取舍,所以
即。
此时我们已得到效用曲线上4个点:,,,。
如此反复进行,可找到点,,,,等等。
图10.2鲜花的效用曲线
图10.3三种类型的效用曲线
1)风险中性型:曲线斜率为常数。表明决策者在每增加1单位产出时所得到的满足感都是相同的,而每减少1单位产出时的失望也是相同的。如图10.3中C2所示。
2)风险规避型:曲线的斜率在差的产出水平比好的产出水平大。说明摆脱差的产出带给决策者的欢乐程度比放弃好的产出带给决策者的痛苦程度大。如图10.3中C1所示。
3)风险偏好型:曲线的斜率在好的产出水平比差的产出水平大。说明决策者更关心方案的结果较好时其结果的变化。如图10.3中C3所示。
还有一些由基本类型组合而成的类型,如S形曲线。
L-A模拟法就是根据上面的假设,即假设决策者的效用函数符合某种特殊类型的曲线,得出的一种简便的得到决策者效用曲线的方法。其基本思想是:根据假设的效用函数类型,通过得到几个效用函数点,确定其函数的参数。
图10.4S型效用曲线
此外还有其他一些类型的效用函数,如
幂函数表达式:
对数函数表达式:,其中x为的归一化结果,即
图10.5火灾保保险问题的决策树