关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 9 J) U0 D& M' L
+ k* L$ @5 X, N! u2 \
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
7 k. A1 v$ j; w9 l! @  以下三个定义:
% l" E/ S+ `* B9 d  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 # ^6 k. h- u! t1 s( b1 \* t
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 , f" |4 B: B- E8 i* f! z
  所谓的双方优势策略则是指双方利益总和最大的策略。  + S' J8 W5 \# W
[编辑本段]严格优势策略举例分析
" i4 ]( T3 `' K  一、经典的囚徒困境 ' h, m' h' n" {8 S4 T$ l9 B- F
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
, h* A% K: K) l: E7 ?: B; O  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
$ l& V5 [  P2 s  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 7 G. e( z0 U5 Q& _5 M
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 & e9 L- N9 \0 ?% P/ F
  若二人都互相检举(互相“背叛”),则二人同样判监2年。+ V/ ?& K( \& N
  
7 D3 k2 y" ]! y' ^# }- e用表格概述如下:
* W% S' a- q/ f  p" P& I
0 b. L0 \) p# _* X4 o) n4 t" T    甲沉默(合作)  甲认罪(背叛)  
9 y2 `3 t) H8 ~6 Q乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  2 r' A1 i5 l- q
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  5 x* f$ R9 b$ B/ k( V9 C

3 W' I2 U" i% g6 O' G8 k1 x' z  z  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
$ _& j4 I9 V$ e' Y! H  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: : B  h0 M+ W! H: N
  若对方沉默、背叛会让我获释,所以会选择背叛。 1 t+ S$ l# \9 X; w
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 - m  X0 s" ^; R* v
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
# G4 k4 r" p- o  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ! r0 Q+ b# V5 q5 c9 y3 O% F
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。7 g6 N' B7 w+ ?# Z$ Q" f
[编辑本段]二、智猪博弈理论6 |7 T. X' c9 R  r
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ( W/ m6 l4 ?3 `  u3 z
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 , ^% C0 n! N2 x4 X
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ; A; P& m- @' l- H
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 & C  s$ C7 F3 t# m9 w" U- H
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
! u; V" S8 z2 T8 T! d/ q. o8 W  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
: i7 F4 M! q/ \, T& y+ |$ T3 R. t  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。$ l! |6 _( G* f0 ]9 X8 i
  ( M4 ^# I) k5 a
三、关于企业价格策略6 ?0 W+ o0 V& n% B- y4 h- q; ?
/ q$ h8 i; \7 E7 T% X$ }
  0 W) e& |# H! `  \7 O' }8 |0 O: v' G
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? $ U, o9 D. B8 X* C, q* O
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
- H( Y6 ~! d9 G& B4 c9 L: J1 J  以下三个定义:$ Y0 K3 O& P- E5 [1 {1 v
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 , d( n9 J/ h- B" |
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
, I+ c" b0 s& [0 c7 o* j  所谓的双方优势策略则是指双方利益总和最大的策略。  
. G/ n/ t( b6 j; d1 r( L, z[编辑本段]严格优势策略举例分析, S! o( P/ |' A8 n
  一、经典的囚徒困境
2 R4 w; {* ^' H  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 0 _" d1 H' I0 V; g' ]: p
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: " ?' R( I, w4 X7 g( `! Y- B
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
! a$ I  Y1 q# e* j4 D4 D( e  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
# f: v; h& m. @  若二人都互相检举(互相“背叛”),则二人同样判监2年。
' x5 T4 v3 ?* m, e5 A7 r, u' `' K  
. G5 r, a' Q1 |* b% `8 o3 \6 w用表格概述如下:
* t+ u0 Q. o3 Y! j( _6 }( @9 I4 o# i! J$ I; E9 v
    甲沉默(合作)  甲认罪(背叛)  : _+ p6 `% _  P0 E
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ' r* @" D: ^* z2 X
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  1 ~# d1 {- j7 F& B5 n. ^: f
2 V( l  y, d8 f7 }
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 0 u* M( X7 k0 H# W/ b8 v: m7 v
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
* ~- b' }* j6 B3 U8 u  若对方沉默、背叛会让我获释,所以会选择背叛。
0 Q+ n2 p7 K5 ], R  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ; I# N' }3 D, P, L: k$ n# j' _
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 - L/ B& @6 g5 \& D6 C0 C
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 . z! w0 ^5 A$ P' K+ y+ x: n- C
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。- ^& }5 ?; F* F9 Y" m6 a7 V2 k
[编辑本段]二、智猪博弈理论
' G& d: P4 Q! W) M$ Z( A8 G  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
0 a& _" T$ U  J  u  ^# h  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ( O2 z7 P/ T# Z
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 5 C8 y9 `6 f/ l5 m8 `  Z
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
" j5 A  {# e; _! c4 n  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 - `4 W3 e: Z9 W/ o
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ) [8 ?$ u" e9 F' F( Y  `4 |1 @
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。/ K9 s3 }8 A: t% S3 x" f
  : ]2 E7 k4 }( l5 W1 s
三、关于企业价格策略7 n$ A  q6 p: W! r: Z1 }* A
, N+ Y2 Q9 S- }  D
  2 ~* T, r* w- }; `* R8 z. {1 v
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 1 w3 n$ t5 F1 l) g1 `+ c
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);& p" p; e1 P$ E5 `) t/ U
  以下三个定义:
, O/ B! ^/ ~: D3 o4 p  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
2 `; i* t" h* L3 w  ]  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 # J9 x0 }) A4 ^1 q, b7 I% l
  所谓的双方优势策略则是指双方利益总和最大的策略。  ' K! |- ?5 Q: B5 k
[编辑本段]严格优势策略举例分析! V) ^. x- ]% [5 O+ }0 P& y
  一、经典的囚徒困境
  y/ O% S. @- D  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: $ [+ C* g/ W+ z  f# \
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 7 j/ y7 }, f- F1 c/ ]/ Q
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 : R% U2 N+ a# _; d8 c
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
6 P. I9 L8 s  C& ~  若二人都互相检举(互相“背叛”),则二人同样判监2年。" i  j) R. q6 Y' h8 j+ U9 T0 k
  
$ Z4 [" ], z( V) M2 A用表格概述如下:
' u0 h, h7 a, |
% l8 H  r2 a- J4 ?9 z0 N    甲沉默(合作)  甲认罪(背叛)  1 M) k' _$ d) n+ J% i: H
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
' R& {" E0 o3 p1 E乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
8 m# s" g5 l- d: N' d. r4 W* Y' g7 v7 U7 v  H" e/ P  I9 x' V6 r: l
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 7 Q! }. b; t6 C8 ?
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ' e" u5 f/ V- Z3 \/ e) F
  若对方沉默、背叛会让我获释,所以会选择背叛。
# ]4 i* X  e1 v6 ]1 t! k  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 6 M! n; u/ {0 ?' X1 r* @
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 $ |! Y, f4 P, ~. Y% i
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
! ?6 w# o% p5 b5 O  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
7 h2 l! T* R3 G- Z/ ~[编辑本段]二、智猪博弈理论
* h. Q8 ]- h6 D7 T% H* q  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
9 f, Q$ [7 B  v0 w1 ?# x  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 # P. s. c+ C2 K6 r1 l2 b" }& ~; K6 \
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 * k" b- r3 Z4 l- [* A
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 4 R* Q& H. z  a1 U0 i
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 5 [$ {+ C3 v' \7 [# G( P& s
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 0 v  N* ]! E0 I; y# d
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。8 d( B, A6 E3 R9 G3 V5 {
  
+ Y' T2 ^+ J7 g$ A! p3 ]  m1 {  K三、关于企业价格策略) |2 u! G! e7 C: A
0 w# p! b' M1 n8 t+ W
  2 G" t# [! v1 V  k* o- I; c! ]
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
2 Y9 z* V1 ^; V4 G& m4 e' j  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
/ o* n# i1 j( F4 k9 p  以下三个定义:
# Z1 [" }$ j% ~9 N9 P8 p  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
( Z! j, S" x8 ~: _  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
) P2 l# [7 N. u- b( y( S# B  所谓的双方优势策略则是指双方利益总和最大的策略。  
% L9 R2 p# h# Q5 r/ l5 w[编辑本段]严格优势策略举例分析
& ]% r3 h; `+ q6 j8 E, Q4 o. @. T  一、经典的囚徒困境
1 `; K0 x4 a0 X% t3 P, S! D' r4 q  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
  ]" T) l. M. X  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
6 ~# r# e) {% |! {  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 / J( c: z& \- x. V2 @& X
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
* T6 Z) c( z5 k4 t; ^  I  若二人都互相检举(互相“背叛”),则二人同样判监2年。$ q! @  h* l7 A6 A" @2 _  P
  
. r6 ^6 c! `% ?3 i/ W( D, ^用表格概述如下:0 F8 F- v4 _4 G( o4 b

# K6 }8 q. v3 L: y# b3 p' l  {    甲沉默(合作)  甲认罪(背叛)  
4 P$ V5 v0 X+ @: }+ K乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  & _9 \. z. X5 P
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
2 X$ |8 c6 c% N: [1 j
( r! p: w( W8 s1 ^  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
, [, l! J* i- g  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
* u! Z% ^: u& }: q8 @8 X  若对方沉默、背叛会让我获释,所以会选择背叛。
0 @% }* ?: ?4 i! Z  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
+ F0 Z$ C: L$ J* U0 {+ J  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 1 [) d# U& O3 `8 n, p9 S! p" |6 s
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
8 b$ s7 O2 V% C( Z. D4 K4 Y* p. I  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
& b& H- H. G2 _[编辑本段]二、智猪博弈理论( w/ {$ ?7 w2 U  r' z/ S0 t
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
/ ]# M( q1 I! N2 K. Q" g  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
3 t3 G& `5 n$ u  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
: r) s7 T) r6 j& }1 R& B" z  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
9 l( u9 O5 Z0 L  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ) m7 }) }( ^/ n6 m" p
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 % f5 D; o0 q! p( b
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。7 c9 z$ m" z1 g1 h& O, q: }6 m+ f
  
! x8 Z, l1 C4 B: T, b* M7 O# L三、关于企业价格策略
9 K; x' L4 o1 a: t
; i" b" v3 g; ^5 r; T) [  
# l, c0 E3 `5 u5 x1 `  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? # X. Y: z% f8 f, ~8 y2 N( `
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )