本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 8 P7 }7 }8 n; I2 d+ p
( Y& p" N. C2 j+ u* m严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
6 D8 x" V& h! f) p* K 以下三个定义:6 u1 v+ R+ y( K6 N4 [, P7 K& {6 o. s
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 4 F c0 T; j! w
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 2 b D9 T$ D' x U
所谓的双方优势策略则是指双方利益总和最大的策略。 . I8 ^$ s* n. u7 l5 e J. x% }
[编辑本段]严格优势策略举例分析
5 j0 d: n9 W* T- L 一、经典的囚徒困境 - Q- E& p" ~0 J- T( }% ^; P
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: * J& s u* m! F' _% o7 w* i+ E
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
" x( H' z! r5 c" b* }/ m8 T 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 + u; R; S. L5 C% o# c8 c8 y
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 " m3 S$ s$ m$ @/ Z' C8 h
若二人都互相检举(互相“背叛”),则二人同样判监2年。
! B7 C+ v a- P) t* [# }7 u7 c7 ^4 l + x4 [: A9 ~7 }$ G
用表格概述如下:
% [6 J+ a& H' l# ~
- B. ? j4 [1 p q' { 甲沉默(合作) 甲认罪(背叛)
) H, ^! w* x: ?乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ' N6 d, N* B [8 n6 L4 n
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
% o4 p$ v; s3 ~% u& B( c9 Z8 ]1 J, `- e' |
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ! D/ x7 C/ ]1 X' P" B' t
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: H& S+ z0 _+ m6 `7 }/ ^" D
若对方沉默、背叛会让我获释,所以会选择背叛。
% W5 W4 S- y0 A% b; i4 E0 K4 Z 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
" ^9 m4 ?( m3 v. \3 H0 i 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 0 Y% i% A; z3 F5 f* r
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
' p9 q0 r# }5 h; Z' o% K 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。- h5 D: C* u8 ^* u& S
[编辑本段]二、智猪博弈理论
4 a P- s7 l0 _, s3 U! K 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
, P5 F o: M' b3 I6 R, B! w 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; H3 p8 V+ @) l: A, U; S! N" X4 r 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
. t; |) W; {$ T" I* k$ {1 F. `9 S 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 2 [7 C; a/ r/ T: _( [1 V
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 9 j* J: N* W* P8 ^# Y
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ! d) U% i$ G, b- B# [
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
, [8 j2 _8 p8 ~
+ T' H/ i \' p" O6 z' U' m三、关于企业价格策略4 b. e+ y" d7 `2 c0 f
3 r& `6 v; ~9 r6 B
: p5 N1 e( X$ J
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 5 E# d/ u3 T; Q8 l% T. F
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
* x- m$ Y( n3 y% H0 z2 z 以下三个定义:
# T/ W* ~7 e- g H/ W, f/ [6 J 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 7 R ~4 O) \, {$ v; I( |0 q
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
, a. N6 Q9 k5 n2 ~4 b# b 所谓的双方优势策略则是指双方利益总和最大的策略。 ( T Y* v% p! h' S3 D
[编辑本段]严格优势策略举例分析) B7 k" i" e* I( P" {. _4 J. _
一、经典的囚徒困境
# d C) v! t4 \" r0 N+ q3 m% i 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
+ D6 O0 A; a$ U9 Y& k 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
& ^/ e5 t1 s$ p" a 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 & b S# t! @$ F/ x' ?5 G- N; |* d
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
/ Z4 t- ]. W9 c' [ 若二人都互相检举(互相“背叛”),则二人同样判监2年。
5 V& v4 N" S5 C$ e: R
- e: S0 z8 G- J2 s( t# k; |' B! f( |用表格概述如下:0 [: @ b* e. F4 R+ G
+ q. H# @4 t d2 [* ^$ {4 M0 M 甲沉默(合作) 甲认罪(背叛) . P& G; Q$ Q$ E. \! f+ b" E
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 " C- r9 D4 y6 S: t) |
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 2 \. H9 x) e1 r6 m+ b" y' w$ s. p) k
. V, h+ A4 @1 o( A6 v' k5 D6 M. i 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 & k. P2 |8 M; g. s3 ?
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
$ h: O0 ?( e' c4 h, Z, d 若对方沉默、背叛会让我获释,所以会选择背叛。 , p( @3 H4 u- Q; K: Z. h" B
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
9 h' I7 e# y% Z: c5 j- z! | 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 / k$ y5 Q3 F# n p
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
- `! Q5 q( g: n$ O2 q1 ^ 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。# R. X6 o7 W1 x, f8 x8 Y" b
[编辑本段]二、智猪博弈理论8 A- F8 m5 r h x
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
% C R2 z. H. v G4 }' {, u% N 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
% e. t0 v6 H) L$ X2 j3 G 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 3 E) x0 n3 ?/ ~0 z/ g! l
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
; B, ` |/ b- e6 {& |# H: k( ^8 `: T “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
- C( I# s1 [& F" | 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
: p- m9 |7 R! d P: N 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 ~) ?3 U. @. Y( k8 m # B6 \) b4 F: ] ~0 Z, Z9 c% \
三、关于企业价格策略) S% ~1 S m/ N! O$ K& b" c
1 Y! a& D9 |' U& K9 p 0 ?& Y( ~& K# [5 b" a7 L
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? % B, t1 e9 t! s7 j
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);4 U; [% x9 R6 o' j$ v7 n& F6 `
以下三个定义:
& d+ l+ U8 H3 a, H% C& x 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
. g) I a' ~/ ~ ?1 j2 W( v8 { 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 - f1 x% H+ N* K& m5 `
所谓的双方优势策略则是指双方利益总和最大的策略。
0 _$ o, [8 B3 x. k* H[编辑本段]严格优势策略举例分析
: c5 B$ }4 u1 p. e 一、经典的囚徒困境 ( [8 S& ^% R3 L$ Q/ v0 t
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: % S0 X$ k# S5 N- d' p# ]" L
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: # e: A3 v! ]( F1 m0 z k- J) d* c
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; j$ _ e6 q) H* N' v8 N 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
8 c: X) _* b. n8 `5 R 若二人都互相检举(互相“背叛”),则二人同样判监2年。
1 ]; f6 Y9 F$ r' w 3 @; T/ ~ c% q/ k* T1 W( y! r
用表格概述如下:
2 v1 O! R" V7 N0 E5 a
/ o! q# q4 ?9 u7 W; k0 m 甲沉默(合作) 甲认罪(背叛) # d x* k7 I, @% o0 ^1 J" I
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ' B3 e2 S- }! ^# z: _0 F1 K
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
# w+ h+ v: ~" d5 C( B
* n4 ~" n$ S t) n 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
5 S3 ~3 s3 a, S 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
& \/ i9 I; ?* x0 d$ S! v 若对方沉默、背叛会让我获释,所以会选择背叛。 & f R# ~9 |4 Z5 ^! y5 Z
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 - C4 t8 a9 B5 W* `3 ^/ R+ D
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
3 D" a% w1 z3 _ M2 b2 v# {5 Y 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
1 z- t8 e% T5 A$ ^: v6 w7 h" @/ O# A 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
. v G: F/ ?" ]5 o[编辑本段]二、智猪博弈理论
" Q0 U. e# A( y3 y! C5 d2 W 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 3 \& _/ }4 s3 G" O
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
4 y0 h6 d- _/ o1 W 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
0 ?4 x" R- {, i; k* z8 \9 d- F 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
9 t, V* p, h9 u5 S “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 7 o9 v2 Y# \/ R/ v5 b3 l3 i
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 9 ^$ t$ X7 z* K; d& d& C2 X
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。& m. E6 i V# U' A" c2 E
3 h& j' u7 }" T0 a
三、关于企业价格策略' x4 P+ V1 |% \: O6 Q# S) J
2 a1 \! G; T* U
& I2 {+ ]& ]: P [ 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? + \2 x5 c% N# X, B
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);* Z5 q ?# x0 G9 i
以下三个定义:) z& D; v+ L9 u& m
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 5 K' _" g1 t2 w
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 . W: Z; w& U" X9 @
所谓的双方优势策略则是指双方利益总和最大的策略。
; x$ z- }/ b4 c O. H[编辑本段]严格优势策略举例分析
3 W, S+ C; P0 ^; T8 t 一、经典的囚徒困境 ' V; E s' v% d
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
9 n. Y2 Z* _5 s 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
* H+ f! B) y: Q6 t9 o. J6 h, ? 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
: b% H% l# ^ ?5 d5 r 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 9 o8 c. s% O% j5 N) Z: v
若二人都互相检举(互相“背叛”),则二人同样判监2年。
, q4 k0 t! c' @
8 `+ _% E! J# J7 Y用表格概述如下:
% T7 g+ i3 f) n5 o
+ ]4 W0 D6 |* o* B( V6 C 甲沉默(合作) 甲认罪(背叛)
% e) j; I: {# s+ m+ r$ I乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 0 O' V! x( \6 T+ z7 P( Z
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ) ^8 _) T) y( ^( H: A
( f; i- A" G4 p/ A9 | 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ! F0 r; Q$ Z5 P/ c# x8 n
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 1 f' M" F- [9 ~
若对方沉默、背叛会让我获释,所以会选择背叛。 ' Z! z- r7 Z# W
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
- J3 l' a+ J% N 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 3 e0 x8 a: u5 G5 y H
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ) A/ E8 m* ~7 S& e" s- X" ]
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
q1 W9 @# D2 g; y1 |% l# F[编辑本段]二、智猪博弈理论
8 s2 C7 t; c2 \6 k; { 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ; y/ R7 r7 Q! v
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 # {$ X/ _! M( j* h
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 : q3 V7 `, d# ~# |# F; S1 w% l5 `% P
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 Q o4 b4 p) ~
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 & |: z4 J2 ^7 ]
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
* e4 S- M: K" ?( Z; ^! g" x 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
6 a( c/ `/ Y/ g
$ @/ i4 c$ M, o三、关于企业价格策略
7 w0 P0 ~7 I) [: F2 E M& z8 H
8 V) _' N% R7 t) w! @! x/ d
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? : Z& R& ]: {, D$ d! c# t
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |