纯技术贴 Civ4是个很单纯的小游戏（博弈论分析）[翻译完毕]

Mr.GameTheory · 发表于 2008-7-30 18:37:48

所以我的问题就是，我把囚徒困境改一下，一人坦白一人抵赖，坦白8年，抵赖16年；
两人坦白，都8年；两人抵赖，1年。
在这个关系中，每个人可以做出的选择依然是有限的，这里面的纳什平衡在哪里？

Mr.GameTheory · 发表于 2008-7-30 18:43:22

是不是说基于每个人都是完全理性的，所以这两个囚徒中的任何一个都是完全理性的而且他非常清楚对方也是完全理性的，而只有一起抵赖才会有对双方都最有利的结果，基于这一点，他们2人一定都会选择抵赖，而这就是其中的平衡?或者说因为他们双方理性的选择必然是共赢，这就不属于非合作博弈研究的范畴了？

[ 本帖最后由 Mr.GameTheory 于 2008-7-30 19:02 编辑 ]

Mr.GameTheory · 发表于 2008-7-30 19:15:54

原帖由 RP_MAN 于 2008-6-22 15:35 发表
in mixed strategy （中文叫混合策略？）
双方都以1/3的几率出剪刀，锤子，和布……
可以证明这个Nash equilibrium 是单一的……
多看看博弈论的书吧……

原来是这样。。。这也太囧了吧。这样的化我觉得也就包含dominant strategy的nash equilibrium有点用了，否则我们得出文明mirror地图的纳什平衡必然是
“双方采取完全相同的行动，都有50%的几率全灭对方”这也太无聊了吧。（事实上凭感觉我认为高手在永久和平的情况下就是分不出胜负的，一定是克隆般的发展，到最后就是2个移民同时向中线奔去，谁手快先建城谁赢，几率各50%，lol）

???? · 发表于 2008-7-30 20:02:13

原帖由 Mr.GameTheory 于 2008-7-30 19:15 发表

原来是这样。。。这也太囧了吧。这样的化我觉得也就包含dominant strategy的nash equilibrium有点用了，否则我们得出文明mirror地图的纳什平衡必然是
“双方采取完全相同的行动，都有50%的几率全灭对方”这也 ...

应该是谁先行动谁赢吧

RP_MAN · 发表于 2008-8-1 23:30:40

如果要讲得稍微技术一点，在所有博弈中，dominant strategy equilibria的集合是Nash equilibria集合的子集。
前面已经说过了，任何博弈，只要满足一些很简单的条件，必定都有纳什均衡——但是很多博弈没有dominant strategy equilibrium——不过空集也是任何集合的子集。
在82楼中你提到的问题，如果要技术性的解释起来，相当麻烦，不过这么说吧：
如果让一大群人反反复复的玩同一个博弈。在每次博弈开始的时候重新分配对手。（每次你的对手不同是为了避免这个单次博弈进入变成repeated game，那个需要不同的分析方法。）时间长了以后，玩家会有经验，就会去选择其中的纳什均衡策略。原因很简单，如果别的玩家学会了均衡策略，而你知道对方会才用某个均衡策略，那么你最好的办法就是也玩对应的均衡策略。（即时一个博弈有几个纳什均衡也没有关系，至于到底玩家会去选择哪一个，上面的例子过于简单了，无法解释。不过搞博弈论的人自然有更高级的模型。）比如说你和你的女友出去吃饭，如果交往时间长了，可能她不说，你也知道她喜欢吃什么了……如果要说的更技术一点，这个叫common belief: From playing the game over and over, I know you will do A, you know I know you will do A, etc...

另外，对85楼问题的回答，正因为很多博弈没有dominant strategy，所以才有研究的意义……否则一切博弈岂不是都太trivial了……

RP_MAN · 发表于 2008-8-2 13:20:08

原帖由 Mr.GameTheory 于 2008-7-30 18:43 发表
是不是说基于每个人都是完全理性的，所以这两个囚徒中的任何一个都是完全理性的而且他非常清楚对方也是完全理性的，而只有一起抵赖才会有对双方都最有利的结果，基于这一点，他们2人一定都会选择抵赖，而这就是 ...

如果你这里面的payoff是你在83楼所写的话，那么这个游戏有两个纳什均衡组合：(抵赖，抵赖)，（坦白，坦白）。

都抵赖是帕累托最优（pareto-optimal）。

一般的博弈论是假设完全理性的，但是完全理性不能保证帕累托最优的纳什均衡一定会出现，我上面一楼已经解释了一下所谓的common beleif，可能不够清楚,那么就这样想：

囚徒A想：B会坦白，那么我该坦白。

囚徒B想：A会想我会坦白，那么他会应对以坦白，那么我最好还是坦白。

那么，纳什均衡（坦白，坦白）就出现了。至于为什么会有这样的belief，如果以前类似的审判也有过，而以前的审判的时候大家都坦白了……

这种被称为Self-enforced belief，在现实生活中很多见：比如中国现在有不少时候大家会见死不救，因为以前见义勇为的人往往结果却很惨。于是我认为如果我出手了，别人不会帮我，别人也这么想……最后的结果往往是悲剧……

guotch · 发表于 2008-8-2 14:28:24

这个....看完这长篇大论......我觉得..........除了这是一个受人要求而发的贴之外，我所能知道的就是：纳什的确可以用在很多地方，虽然拿去用了也没有结果（这完全是由于时效性或者信息不全，选择价值判断不一造成的）。
就这样..

RP_MAN · 发表于 2008-8-2 15:20:58

我只想指出一点，自1994年，至少已经有4次的诺贝尔经济学奖是被授予研究博弈论的人了……现代大多数的微观经济学的研究也脱离不了博弈论这个应用工具。

很多时候再应用博弈中，单纯的只看纳什均衡，用处的确不大，博弈论中别的更深的solution concept有很多：subgame perfect nash equilibrium, Baysian Nash equilibium, correlated equilibrium, perfect baysian nash equilibrium, epsilon equilibrium, proper equilibrium, trembling hand perfect nash equilibrium... 等等。信息不全，动态博弈完全可以解决。但无论哪个solution concept，都属于纳什均衡的精练。至于那个选择价值不同，那在更早的微观经济理论里面早就被解决了……

guotch · 发表于 2008-8-2 16:01:32

那么就按照这个说法，还是只能给出一堆算式啊，反正，我觉得前面那个谁谁谁说的很对，更我们的游戏过程一点关系都没有（哪怕是模糊概念上的指导，即大致较高概率范围判断也是达不成的（不使用别的计算工具的话）），只是说明：我们对XXX的认识又进了一大步....
就这样了吧.....

RP_MAN · 发表于 2008-8-2 21:27:53

这就是theory 和 applied science的区别

???? · 发表于 2008-8-3 19:02:48

事实证明万有引力对摘苹果毫无用处...

勃一轮对游戏没任何帮助

RP_MAN · 发表于 2008-8-3 19:07:43

93楼的话的确很经典哪

???? · 发表于 2008-8-3 19:52:13

话说回来RP男九宫棋是不是那时均衡的体现呢

RP_MAN · 发表于 2008-8-3 20:06:31

九宫棋是啥？ Tic-Tac-Toe么？
你可以看看游戏规则是否符合主楼的条件，如果符合，那么纳什均衡一定存在……能不能算出来又是另外一回事了……

???? · 发表于 2008-8-3 23:07:53

九宫都没玩过

就是一个井字格子里面用O或X连一条线...

Mr.GameTheory · 发表于 2008-8-6 10:24:59

其实都一样，common belief也可以变相的理解为游戏的客观规则，因为其他的游戏规则也必须被游戏者认可才有意义而这对于common belief来说是没有差别的。

在common belief确定的情况下，剩下的东西岂不又是确定的了。。。。所以，common belief和dominant strategy一样，都可以理解为是一种确定的规则，而均衡的存在，正是因为这种“确定性”的存在。。。

我的理解是：common belief还是dominant strategy，浮云；它们的本质是其内在包含的一种“确定性”，而正是这种确定性，导致了最终均衡的存在。。。

Mr.GameTheory · 发表于 2008-8-6 10:42:25

至少就以上所有举出的例子来看，纳什均衡并没有摆脱经典的三段论式推理的框架，
只不过它把其中的“前提”改成了不同的名称，比如common belief、dominant strategy。。。。然后推导出了一个结论，它把这个叫做“均衡”。。。

我感兴趣的是，博弈论中有没有真正脱离出这种框架的东西。

Niggham · 发表于 2008-9-27 18:57:16

万恶的博弈论...

啊孟 · 发表于 2008-9-27 19:18:03

纳什均衡经典案例：囚徒困境
（1950年，数学家塔克任斯坦福大学客座教授，在给一些心理学家作讲演时，讲到两个囚犯的故事。）
假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯，对每一个犯罪嫌疑人，警方给出的政策是：如果一个犯罪嫌疑人坦白了罪行，交出了赃物，于是证据确凿，两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白，则两人各被判刑8年；如果另一个犯罪嫌人没有坦白而是抵赖，则以妨碍公务罪（因已有证据表明其有罪）再加刑2年，而坦白者有功被减刑8年，立即释放。如果两人都抵赖，则警方因证据不足不能判两人的偷窃罪，但可以私入民宅的罪名将两人各判入狱1年。表2.2给出了这个博弈的支付矩阵。
表2.2  囚徒困境博弈
——————————————————————————
　　　　　　　　┃　　　　 B　　  ┃　　　　 B　　 ┃
————————┃————————┃————————┃
　　　　　　　　┃　　　　坦白　 ┃　　　　抵赖　 ┃
————————┃————————┃————————┃
A　　坦白　　 ┃　　 –8, –8　 ┃　　　0, –10　 ┃
————————┃————————┃————————┃
A　　抵赖　　  ┃　　–10, 0　　 ┃　　　 –1, –1　┃
————————┃————————┃————————┃

关于案例，显然最好的策略是双方都抵赖，结果是大家都只被判1年。但是由于两人处于隔离的情况，首先应该是从心理学的角度来看，当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论，假设每个人都是“理性的经济人”，都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程：假如他坦白，我抵赖，得坐10年监狱，坦白最多才8年；他要是抵赖，我就可以被释放，而他会坐10年牢。综合以上几种情况考虑，不管他坦白与否，对我而言都是坦白了划算。两个人都会动这样的脑筋，最终，两个人都选择了坦白，结果都被判8年刑期。

基于经济学中Rational agent的前提假设，两个囚犯符合自己利益的选择是坦白招供，原本对双方都有利的策略不招供从而均被释放就不会出现。这样两人都选择坦白的策略以及因此被判8年的结局，纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战：按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。

很经典很精致的分析

heshl · 发表于 2008-10-23 09:28:35

好专业的帖子呀，我不但看了中文，也看了英文，长达6页的对话也看过了，不来贫两句实在难受

首先表达一下崇拜之情

其次，嘿嘿

我一向反科学（虽然我也是理工科出身），科学是西方的舶来品，同我心有戚戚中华文化是有差别的，所以中国人搞不好科学是正常的，特别是整个科研思想和体制都是对西方照猫画虎形成的。

西方科学人为割裂了世界的联系，结论往往是理想状态下的，有一定适应范围。比如牛顿力学定律，在微观、宏观及要考虑空气阻力的情况都不适用。而博弈论由于涉及社会科学，其适用范围更为狭小。若要应用，首先要割裂世界，隔离各式各样的外部条件，创造一个适用范围；当然，还有另一个办法，那就是针对某一环境创造模型，比如纳什均衡不行了，就用别的什么均衡。

感觉西方科学有时候都很接近问题的本质了，但是就是到不了本质。比如这篇文章，感觉很接近“文明”的本质了，但是还是水中月、镜中花。至于由此衍生出的其他平衡，虽然也许可以解决问题，但是离问题的本质渐行渐远。

其实，什么也不懂，一点拙见

		自动登录	找回密码
密码			注册

[原创] 纯技术贴 Civ4是个很单纯的小游戏（博弈论分析）[翻译完毕]

回复 #82 Mr.GameTheory 的帖子

回复 #89 guotch 的帖子

回复 #90 RP_MAN 的帖子

回复 #93 ???? 的帖子