- 阅读权限
- 30
- 精华
- 最后登录
- 1970-1-1
- 在线时间
- 小时
- 主题
- 好友
- 相册
- 分享
- 日志
- 记录
- UID
- 210922
- 帖子
- 0
该用户从未签到
|
比尔盖茨与沃伦巴菲特在一次晚宴上相遇,主持人让他们玩一个游戏:每个人都把钱包放在桌子上,钱包里钱较少的人赢得全部的钱。这个游戏看起来很简单,但一不注意,可能就要产生所谓的钱包悖论了。
4 N% x9 Y4 v- q& B悖论的产生比尔盖茨先生或许会这么想:可以选择自己的钱包里有更多或者更少的钱,那么他就有一半的机会来赢得游戏。如果他输了,只是输掉他钱包里的钱。而如果他赢了,他能够赢得比自己钱包里更多的钱。这样他的期望收益是大于零的。
' m, @6 z1 c9 H* @与之类似地,沃伦巴菲特在考虑这个游戏的时候,能够用相同的理由来说服自己。他感觉自己有公平的机会来赢得比口袋里更多的钱,这么看来,他在这个游戏中是占优势的。$ D7 Y9 [+ z, m6 z9 Y
两位亿万富翁都认为这个游戏是有利的,这显然是一个悖论。该游戏很明显是一个零和博弈:一个人得到的收益恰好是另一人的损失,并不存在使二者同时期望获利的可能。4 |8 e+ G# K6 A: h n; @# T
那么我们应该怎么样解决这个推理过程和这个显而易见的悖论呢?8 W* V1 l3 P( d) w" H
纠正错误推理比尔盖茨和沃伦巴菲特不大可能通过这样错误的方式来推理。他们会看到之前逻辑中的错误:每个人在考虑的时候都认为自己钱包里的钱可以同时是较多的和较少的。事实上,一个钱包里只可能有较多的钱或者较少的钱。
" Z" U/ b2 Z, C' x" @* X- x所以正确的逻辑应为:
6 q" X" Z5 G; g/ M$ C! L& w如果我的钱包里有较多的钱,那么我参加这个游戏,会输掉自己的更有价值的钱包。 如果我的钱包里有较少的钱,那么我参加这个游戏,会赢得另一个更有价值的钱包。这两种情况的可能性是均等的。而且,由于总有一个人赢得另一个人输掉有更多钱的钱包,这个游戏是均衡的。这个游戏的结果应该是比尔盖茨和沃伦巴菲特各有一半的可能获胜。这样,没有一方是有利的,而这个游戏则是公平的。( a+ r. k" L' y
我们可以简化一下这个模型,假设更有价值的钱包里有 x 美元,可以认为其中一人赢得游戏的机会为50%。当一方赢得这个游戏时,他从另一人的钱包里赢得了 x 美元。当一方输掉了一个游戏,他输掉的正是他的钱包里更有价值的那部分,即x美元。于是期望收益:
' `1 [9 Y' R6 a# eE = x * p1 + (-x) * p2 = 0.5 x - 0.5 x=0! O! K: Y# c1 l, m8 g
其中p1和p2分别为获胜和失利的概率。
# h( l7 C9 G& T* y; b* L L这个式子说明该游戏对任何一个参与者来说有期望收益为零,所以游戏是公平的。
2 s# J, W2 c9 U2 z; I& _4 I" X当游戏反复玩时的获胜策略当游戏可以重复的时候,它变得更有趣了。即使当参与者同意带平均数量相同的钱,它仍然不一定是公平的。在某些场次上,一方更有优势获胜。
1 V9 p' e4 s# f' X考虑这样一个例子,比尔盖茨和沃伦巴菲特同意带平均为100美元的钱。假设他们把策略限在一下三种:
) W9 j* p. R C4 C策略A:每次都带100美元;9 @# e3 t0 f; q7 ^$ l
策略B:一半的场次带75美元,另一半带125美元;
4 S) d9 @! P u% ~. M策略C:三分之二的场次带75美元,另外三分之一带150美元。. A; K$ C C. x# d( l+ U% m
我们可以来评估一下当互相作用时这几个策略的表现。
" o2 h- W/ P/ `. ~* s5 q# `5 u! g有趣的是,评估的结果是这几个策略竟然陷入了“剪刀石头布”的情况:策略A>策略B,策略B>策略C,策略C>策略A。
, A3 ? `0 _3 }3 k! d, w策略A vs. 策略B:: d' ?) b1 e/ r% }" i8 G9 m" G# w
这时两人的钱包里可能有(100,75)或(100,125)数量的钱,概率均为0.5。& D+ f5 E1 H- N2 x, b) e
在(100,75)的情况下,策略A损失100美元。在(100,125)的情况下,策略A获利125美元。
& L, o4 `+ p' ?+ w; B/ |" b在针对策略B时,采用策略A的收益期望为0.5 (-100 + 125) = 12.5 > 0。这样策略A针对于策略B来说更能够获利。
; O/ }6 s' a, p. t8 ^' V8 {( r策略B vs. 策略C:. o7 `" ~* @7 {* C
计算这个期望要稍微复杂一点,有四种可能的结果。下面是策略B的结算关系:
1 b& S1 b3 o: e* v5 r L' |1 d0 R(75,75)发生的概率为1/2 * 2/3 = 2/6,这是一个平局;; X7 y4 o6 m) A- ?# I' N: @* z
(75,150)发生的概率为1/2 * 1/3 = 1/6,策略B获利150美元;
( g4 L. _) b; n(125,75)发生的概率为1/2 * 2/3 = 2/6,策略B损失125美元;0 n6 d5 }, k: a4 }" s
(125,150)发生的概率为1/2 * 1/3 = 1/6,策略B获利150美元;
2 s0 Q- ^$ \5 d$ t, M/ {" |7 c把这些加起来,期望收益为:
8 w! M O1 v3 X9 e, E+ M2/6 * 0 + 1/6 * 150 + 2/6 * (-125) + 1/6 * 150 = 25/3 > 0" ~6 I! [: V0 B! z9 d1 p, E% K
所以在针对策略C时,策略B是可以获利的。
& W4 O s0 c6 | w: J* p9 T, l策略A vs. 策略C:
; W, @- l$ B# V: w- L0 G1 G4 d下面是策略A的结算关系:: f1 I) l Y1 E" `9 }) l
(100,75)发生的概率为2/3,策略A损失100美元;
7 k% z9 M0 Y( @* l2 c5 ^# c: D. u(100,150)发生的概率为1/3,策略A获利150美元;8 Y8 q- g, R2 l1 f- b, v% H
把这些加起来,期望为(2/3 * -100 + 1/3 * 150)=-50/3
& R/ ?3 U) B- i8 S( M# M这样可以看出针对策略C,策略A是一个失败的决定。
4 v4 e% y* q5 I7 \- J0 q; I u: C不存在最优策略由于策略A优于策略B,策略B优于策略C,策略C优于策略A,以此为线索这个游戏可能并不存在一个单一的获胜策略。 对任意给定的有固定均值的策略 ,可以找到另一个有相同均值却可以相对获利且更好的策略。这意味着,这个游戏不存在纳什均衡。
# |8 R* e6 }% ]3 }最终结论好吧,说到这里,我们对这个游戏本身有什么结论呢?4 V1 U( Q) ]) R5 [0 V+ y% [
如果有人叫你玩这个游戏,你应该保持警惕,他的钱包里可能一毛钱都没有,在这种情况下,盖茨或者巴菲特是绝对不会玩这个游戏的。只有在一些好玩的派对活动中,当双方都是在事先不知道要玩这个游戏时被邀请,玩这个游戏才是可取的。或者在一晚的宿醉之后,双方都不大可能记得到底自己的钱包里有多少钱时,这个游戏也许是个不错的选择。
+ J" y( G8 K9 N% b) x/ }6 D) [本文来自 Mind Your Decisions; c0 e. |: ^: b1 t) v0 ^
本组讨论帖里也有相似讨论:
, f+ m2 a: z+ x过年红包悖论 http://www.guokr.com/post/6940/南通0 |
|