本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
! n' s( y) q; \6 i4 g3 h, }* S7 X: W) }2 |7 h
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
4 K3 x- f. I' ^1 h$ V$ n# o; j 以下三个定义:% o5 D9 u. ^2 }' N
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
6 ]. f3 j% a) {, R9 j: l. W 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 & z1 n8 ~; F+ w
所谓的双方优势策略则是指双方利益总和最大的策略。 8 M( w8 T5 l, F
[编辑本段]严格优势策略举例分析% i. x: S* c- ~. M, ?9 A
一、经典的囚徒困境 ; h9 T+ t$ w) q4 i0 X: v; k7 |
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
! @( O9 l+ D" b1 T6 q! |. X% H 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
K* s, O8 X7 |( b$ {6 j 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
+ a8 @, H' A9 }, u 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 # N$ X& t7 i0 B
若二人都互相检举(互相“背叛”),则二人同样判监2年。
. t" Q( W1 G: v
$ q6 R8 X2 J; u8 B- P/ @用表格概述如下:
* H4 Y/ f; g; M
0 k; B% c9 a# {# y8 M' I0 @2 s, D 甲沉默(合作) 甲认罪(背叛)
" U9 `* F# z( N( [5 m( Y乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ( T1 A+ F$ K; p* u% W& v
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 + y" o0 h( S b4 u1 |
+ g" h' O# n7 @9 E* a) z! c6 E8 k
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
5 K, ?! y! R3 y* c; J 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: % k8 G3 W& \- g& I0 S& ]
若对方沉默、背叛会让我获释,所以会选择背叛。 # z- P j& m8 N$ ?
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 7 z6 C9 e2 m8 W7 _ W
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 $ A" f7 g+ j* R2 Y. M
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 . `& l- U0 R6 {
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。% \' y4 @% `, d. M+ C
[编辑本段]二、智猪博弈理论0 u/ U0 z* E$ ^6 G" n, R2 B( b
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
. ]6 E# Z4 j& Y& v; n' g% D 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ) c2 l$ w* C1 [0 x$ D
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
% f/ k* ~) P, B2 T. r: \4 t 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
; A* u6 z, L. b3 ~% j% w! L) c1 D “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 % ?/ {6 |1 }: a3 S) s6 Q3 m3 o0 [9 L, C
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 0 K4 W0 @/ Q: o' P6 q1 t
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
5 R9 k0 Q _: E0 S: u6 A 4 c Q# w: e* {+ c, U
三、关于企业价格策略
1 Q" r0 M m- O/ F/ r/ F% A0 U/ D- H$ D1 [) l1 k$ O
, ]+ s @, \; \6 b
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
/ M% O5 p) Q9 z. l3 `! | 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
- Y" y0 D4 z& S$ W) E 以下三个定义:
! b. ?" N2 r0 O( B4 P. q9 ?& J 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 3 [/ t- T8 H; @, |/ j4 d8 |; L
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ' L, }. R9 M% @# J' L! E2 d
所谓的双方优势策略则是指双方利益总和最大的策略。
2 w: R+ [& w+ h# }! p% I[编辑本段]严格优势策略举例分析
6 j2 v! b" h: t, A. N6 Z3 q 一、经典的囚徒困境
2 H; g6 L" o0 c7 b# \ 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 7 ^ T7 f4 ~" I. X$ Z
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
" G$ }7 v. h# C/ D- u" k/ ? 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 4 Z& ~! z2 I, X& b$ K0 B0 [
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 : J: X, |$ p% w- L4 L
若二人都互相检举(互相“背叛”),则二人同样判监2年。$ n$ d% `/ m2 K$ P+ W( h. L+ B$ V
2 [' k8 x4 U8 t4 a! K! |. h
用表格概述如下:& [' m0 g2 f N' K
1 ]. k2 O$ U8 Y
甲沉默(合作) 甲认罪(背叛)
+ M$ x: F3 v+ }5 K3 z1 i' @$ Y乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 0 r# W m( u, [. ?3 y" W
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 1 w ]# T2 l9 l {/ m( O" L
D3 t0 K; m7 n% S2 B 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 & E( g7 ^4 U5 J2 f# a a
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: / p) U$ T1 B* O7 {' D$ M
若对方沉默、背叛会让我获释,所以会选择背叛。
: ]: J: v, X8 x 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 1 T0 b/ k* \% _& Q7 J
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 0 A3 H5 @! R& N/ p3 J# F: k/ X/ \
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 3 S9 G' s% ^0 l# i/ A \1 ]6 j% L
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。4 R# K6 @& r. Z5 G
[编辑本段]二、智猪博弈理论1 {7 ~4 l( ^( |5 Z* p+ \( q
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 / X4 m* |, t6 A3 m0 w8 ~; d `/ v& v
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
" m' I+ V* H6 Z 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
3 H8 N4 a9 h& U( Y: ` b4 U1 G. | 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ! ?; v/ b5 ^- F0 X
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 / a0 {" a0 l$ K& }' A b
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
' W3 i& b+ `! k( R) F( T 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
' v3 l1 Z$ T4 M( u, u6 _
: e7 w6 X4 T) q: l三、关于企业价格策略, N6 p5 k9 t5 J% ^+ k5 i
9 w( S2 N Z; P! I" e
$ j, M% b) T* k 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
3 \, Q7 x& V# y& s6 K- K& L 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
# S7 c7 }& q/ ?9 \: c' ` a% O 以下三个定义:
8 g$ A$ ~ n- E L3 H8 L 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 & e! C5 K. q+ G
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
# K" N# w' [6 {! ~ 所谓的双方优势策略则是指双方利益总和最大的策略。 ) h" H7 h7 F) `
[编辑本段]严格优势策略举例分析2 j% ` I* {/ X
一、经典的囚徒困境 / d" M& [7 I9 W: v# ?9 d% M
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
( h: i6 M" f/ i0 z# V" |* p) A# ~ 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
: c' t5 `2 z! t* V 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
) i) P$ l- h( L 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
" d: ]5 m1 V! ^* ^% c3 V7 g6 t! W 若二人都互相检举(互相“背叛”),则二人同样判监2年。" g+ ?. c! E; s% h! z# J% w
4 F4 {& Y I7 u( b* Y
用表格概述如下:$ i0 F- l+ n. o" }, V: p; }
6 L0 J! O# d8 [" l! t
甲沉默(合作) 甲认罪(背叛)
* V0 V8 \4 L! o& g' c5 {- W乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ; i3 _$ Q( X2 R' e( t
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 , z p2 `, Y, L" X
|4 l2 t' K) a1 D, V9 _% z 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 9 N" P8 E# L# w. ?) f. X# m' t' Z
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
5 G! B* i5 ~: _7 Y 若对方沉默、背叛会让我获释,所以会选择背叛。
) U4 L- \ d# r7 N3 j 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
" {; s7 S" h, I2 Q+ Y# F, q 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
# ?3 C0 e; K L- w, T* P0 @" G( L2 X 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ) ~9 L5 {& e( t i0 ~: A: v m7 T
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
3 i! j8 s& }3 M1 N0 `; w[编辑本段]二、智猪博弈理论/ v4 z$ ]1 q( u1 W" |2 @4 J( G6 V e
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 / x, M; Q% M: T* g( s1 ^
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
Q) j; t. F* [* ` 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
3 A9 ?# g1 ^! h2 F) \" z 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ; y0 z! Y4 q/ Z# B) R1 D& u2 F+ t
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ) m- Z+ O4 x$ P' m1 X% b. n
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
6 H! o, S1 Y6 T9 g- z" `0 z 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
# p. \1 L$ h5 w- K' E& P& x
6 T" P7 ^) z" D三、关于企业价格策略 ]. Q O4 u$ c
' N1 J p0 _2 g( a! P. e$ t
% x( [( a6 k8 Z
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 7 `5 i- Z! f+ h/ |6 \
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
9 H/ y7 G4 J- e; H8 L$ N/ j" @ 以下三个定义:2 }9 A+ f5 ~2 [( P% `) w$ U" m& X, Z
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
9 y0 N- T; |/ q* ^- M! j& i1 } 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
1 p' ~) n) V6 ^7 f( k; X 所谓的双方优势策略则是指双方利益总和最大的策略。 4 r# Y! p' g$ A+ S) @$ j0 ~
[编辑本段]严格优势策略举例分析
% _8 V0 P& t& R- ? L 一、经典的囚徒困境
" d# I+ `8 i: U- f6 X/ { 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: # s" t* t4 g* w: x4 l0 E( _
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: " v- {" U( H2 v" n$ W P
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 1 C# `8 _7 J+ `: `1 ^
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
: I9 ?! J2 O/ x7 R0 d: a+ F 若二人都互相检举(互相“背叛”),则二人同样判监2年。( B8 Y! M1 p1 l$ [8 [! M
0 F( e( m( k; `$ u1 ?- a" E; t
用表格概述如下:
; I& G- I& U' v; l( y# x9 L$ O! a$ a# k( ~9 ]
甲沉默(合作) 甲认罪(背叛) , L0 D) D, W7 N: `9 n
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
0 [0 h' @* f7 f3 x1 h& N乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
7 E+ k, p! P, E0 C( {
2 _; s, N1 v% W& { 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 5 t y. v3 L0 K0 ?7 G5 R ~
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
9 l& @ \% _" M- k( P/ P 若对方沉默、背叛会让我获释,所以会选择背叛。
5 Q- S1 F' P& Z' N. P 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
; B) M% y+ V' i5 q 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
7 r) y: ^8 e3 ^; M% M; g: R 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 3 ~) Z. N5 n8 H9 X: w
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。4 |. Z2 H9 O7 e9 y8 z; ^( m
[编辑本段]二、智猪博弈理论
8 e& D" ~4 \: \* _1 E8 k9 V- f5 @3 U 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
9 ~! m u' \/ w) e$ x$ u9 X$ z9 h 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 3 i1 x- E/ A; @, Y
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
3 A; ^1 P9 L+ B 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ' ~' n. |+ a- e- I7 z; S% g
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 % ?. {, K, ~2 V1 E) b' G
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 8 U2 d k @* H$ |4 ], j
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
' }1 i7 [5 _' B% c# M " s6 ~, T! q- _0 a7 L
三、关于企业价格策略
7 ?% {0 p- t3 z7 C
, ~0 b) i3 G% n
4 [! M% s; ^4 r; a 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 3 @7 B' k$ q$ W9 b j
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |