Frmer带你了解博弈基础,用简单的故事告诉你其中博弈的奥妙

如题所述

第1个回答  2022-07-15
本文字数:5009字

阅读时间:12分钟

      博弈本意是:下棋。引申义是:在一定条件下,遵守一定的规则,一个或几个拥有绝对理性思维的人或团队,从各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。有时候也用作动词,特指对选择的行为或策略加以实施的过程。

      博弈论——是二人或多人在平等的对局中各自利用对对方的了解,变化自己的策略,达到取胜的目的。

      博弈可以分析自己与对手策略的利弊,从而确立自己在博弈中的优势,帮助对弈者分析局势,从而采取相应策略,最终达成取胜的目的。

      根据是否可以达成具有约束力的协议,可以分为合作博弈和非合作博弈。他们的区别在于,相互发生的作用的当事人之间有没有达成一个具有约束力的协议,如果有就是合作博弈,反之。

      根据行为的时间序列性,分为静态博弈和动态博弈。静态博弈是指在泊一中所有参与人同时选择,或者虽非同时选择后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。(通俗的说,猜拳属于静态博弈,而打牌就属于动态博弈)

      按照参与人对其他参与人的了解程度,又分为完全信息博弈和不完全信息博弈,完全信息博弈是指在博弈过程中,每一位参与人对其他参与人的特征,策略及收益有准确的信息,如果参与人对其他参与人的特征,策略及收益信息了解不够准确,或者不是对所有参与人的特征,策略及收益都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。

等等

博弈论的英文单词是“game theory”,直译就是游戏理论。

任何博弈都是由三部分组成

1.    一组局中人(即必须需要两个或者两个以上的人做博弈方)

2.    局中人可以采取的行动

3.    局中人能够得到的回报

在博弈论的世界里,每个博弈方都会选择最佳的行动,以获取最大的回报,而且每个博弈方也总认为,其他的博弈参加者也在设法争取最好的收益

勾践“卧薪尝胆”,诸葛亮“七擒孟获”。同样是打败敌人军队,为什么夫差释放了勾践却落得被灭国的下场,而诸葛亮释放了孟获却得到了后方的安宁?

奥妙就在于两者的遇到的博弈各不相同。夫差与勾践的博弈是“零和博弈”(二中会论述)两者之间是你死我活的关系,并不存在相互合作的可能。而孔明和孟获之间去可以通过合作来提高两个人的满意度,属于“正和博弈”

1+(-1)=0,这就是零和游戏的基本内容,游戏者有输有赢,一方所赢正式另一方所输,游戏的总成绩永远是零。

一方收益必然意味着另一方的损失。

“鸿门宴与乌江自刎”—在项羽和刘邦的这场博弈中,只有刘邦和范增清楚的认识到两者之间是零和博弈。在这种情况下双方不可能存在合作,在鸿门宴的时候范增一度想将刘邦拿下,而项羽没有认清这个是零和博弈,以为放了刘邦一条生路,他会对之间感恩戴德,然而刘邦却明白这个博弈是你死我活的“零和”战争

俾斯麦海战也是一个零和博弈,一方所得恰好是另一个所失,这种在实际的生活中却并不多见。因为现实中往往会有第三方的因素来破坏这个博弈的单纯性,比如离婚的夫妇为了分割财产,不得不付钱给律师,这就会造成收益总额的减少。

重复博弈在现实中是很难完全的实现的,一次性博弈的大量存在,引发了很多不合作的行为,而对策的一方在遭到对方背叛之后,往往没有机会也没有还手之力去进行报复。

“烽火戏诸侯”—第一次诸侯们都赶来帮忙,而第二次的时候诸侯们无动于衷,他们认为周幽王还在戏耍他们。所以在重复博弈时,别人可以选择在下次博弈时报复你,所以你这次说了谎,下次别人就不会再相信你。而在一次性泊一中,别人不可能报复到你,所以说谎就成了每个人的重要选择之一了。这也说明了为什么在赌桌上不能相信赌徒的话,但是在和别人长期交往中,说谎会给自己带来伤害。

——囚徒彼此合作,坚不吐实,可为全体带来最佳收益,但在资讯不明的情况下,因为出卖同伙可以给自己带来收益缩短刑期。

“战国七雄”抗秦联盟无法组建,我们分析六个国家的处境。可以知道,在理性人的假设下,大家为了追求自己的利益,不选择与其他五国出战,可能以后会灭亡,但是起码现在得以保住,作出了对自己最有利的抉择,但是最终会导致共同的毁灭。如果六国都是非理性的,各个君王都是好战分子,不管自己国家子民的死活,也不管国家是否灭亡,只想打败秦国,反而会与其他五国共同出兵,达到集体的最优结果,击败秦国。

唐僖宗年间,盗贼横行,老百姓怨声载道。崔安就从府库中拿出一大笔钱,放在市集上,并悬挂告示:提供线索协助官府捕捉盗贼者赏钱。盗贼之间,把同伙解送到官府,不仅赦免原先罪行同样赏钱。在这种情况下,盗贼只可能出现两种情况:一是所有盗贼结盟对抗官府,但是结盟的盗贼能一定确定同伙和自己拥有可以遵守吗;二是盗贼争先恐后把同伙送到官府。这个时候就是盗贼们之间的博弈了。这个策略下去后,没过多久,就再也没盗贼了。因为大家都是理性的。

人与人之间的行为会相互作用,每个人在面对各种矛盾和冲突时,都会制定相应的应对策略,给自己利益最大化。

大家都知道“价格战没有赢家”,因为现实生活中你不能觉得竞争对手比你傻,大家都是理性的。所以经营行为还是应该按照行业规则和市场需求操作。

“破釜沉舟”—项羽把锅砸了,船烧了,每个士兵只带上3天的口粮。这让士兵们意识到已经没有退路了,只有打败敌人才能生存下去,楚兵以一当十,锐不可当,大败秦军,救了赵国。在这里大家想一下,难道项羽不怕吗?在烧了船后,秦国也知道了他们不会撤退,使得秦军相信项羽所发出的信号。

“空城计”—诸葛亮因错用策略失掉了战略要地,司马懿乘势引15万大军向诸葛亮的西城扑将过来。诸葛亮传令士兵原地不动,城门打开,领两个小书童带上一张琴到城上望敌楼前凭栏坐下,然后慢慢谈起琴来。对于诸葛亮来说,他没有选择权,他的收益完全取决于司马懿的策略。最好的结果就是让司马懿相信自己有兵,从而使司马懿撤军,避免了一场灭顶之灾。

“羊群效应”现在有很多网红店都是靠老板经常请人在门前专门排队。由于顾客对信息缺乏了解,很难对市场做出正确的选择,所以他们往往通过周围的人群行为来提取信息。在这种信息的不断传递中,许多人的信息将大致相同并且彼此强化,从而产生从众的行为。

序贯博弈—是指参与者选择策略有时间先后的博弈形式。因此,某些对局者可能率先采取行动,他是一种较为典型的动态博弈。

博弈的双方同时做出决定的博弈叫做同时(静态)博弈。如果一方在知道对方的决定之后,才做出自己的选择,这种博弈就叫做序贯博弈。最开始博弈的分类已经提起过。序贯博弈就是一方在做出决策时,会考虑到另一方的反应行为,并在这种考虑的基础上做出自己最有利的决策。

“田忌赛马”—孙膑替田忌将上、中、下等马调换了位置,与齐威王再赛了一场,最终2比1取胜。孙膑就是在知道齐威王的马出场顺序后,采取的序贯博弈。

经济学中的“外部性”—是指自己在生产和消费活动中产生了一种对他人的影响。如果是好的就是正的外部性(或者外部经济性)。反之是负的外部性(或者外部不经济性)。

在博弈论里面外部性效应又叫大规模协调博弈,它集中讨论的是由成千上万的人进行的协调博弈。大规模协调博弈就是指,当其他很多人在做出了选择之后,如何让自己的利益最大化。

“QQ与UC“—UC是新浪网曾经推出的聊天工具,当时确实比QQ好用,其场景和表情也比QQ丰富很多。但是使用QQ的太多了,在UC上的好友却是门可罗雀。迫不得已一些使用UC的人纷纷转向QQ了。这其中就有外部性效应,人们也顾不上UC是否的确比QQ好用。

“柠檬”在美国俚语表示“次品”或者“不中用的东西”,柠檬市场就代表“次品市场”。当产品的卖方对产品的质量比买房有更多信息时,柠檬市场就会出现。低质量产品会不断驱逐高质量产品,使得好的商品遭受淘汰,最终导致市场中都是劣等品。比如“劣币驱逐良币”

柠檬市场最典型的例子就是二手车市场

—现在市场上有100辆二手车,50辆质量较好,50辆质量较差。质量好的价值30万,质量差的价值10万。但是在二手车市场,由于信息的不对称性,客户是不会知道自己看中的车是否为质量好的(经理肯定是会宣称自己的车是“好车”)。因此二手市场上车的价格最高愿意出的价格就是20万。那么此时质量好的车就会选择退出市场,因为质量好的车不止20万啊。所以市场上只剩下了坏车在交易。

在博弈的分类中,我们提及过合作博弈和非合作博弈了。

一个博弈只有在博弈双方的利益都有增加;或者至少是一方的利益在增加,而另一方的利益不受损害的情况下,才有可能达成合作。

“欧佩克”—是由伊朗、伊拉克、科威特、沙特阿拉伯和委内瑞拉5国决定联合起来共同对抗西方石油公司,成立的石油输出国组织。欧佩克的宗旨就是协调统一各成员国的石油政策,并以最适宜的手段来维护他们各自共同的利益。他们使用的主要手段就是通过遵守共同协议,减少欧佩克各成员国的石油产量,将石油的价格维持在一个较高的水平,从而保证各成员国之间的利益。

如果大家都遵守低产量,总体上是一个对大家都有利的选择。但是对于任何一个成员国来说,如果其他成员国保证低产量而自己增加产量,自己就会有更多的收益(这就是前面讲到的市场中大家都是理性的)。所以对于任何一个成员国来说,背叛协议就意味着高收益。如果任何一个成员国知道其他国家已经选择了高产量,那么对于自己来说,最好的选择也是提高产量。这就是为什么欧佩克组织成立之后,并没有有效的发挥其职能的主要原因。

“知己知彼,百战不殆”在生活中人们为了获得某种结局,往往会定制出一系列的制胜策略,即在分析对手可能采取的讲话,有针对性地订制自己克敌计划。

“帕累托效率”—指的是经济的效率体现于配置社会资源以改善人们的境况。如果资源已经被充分利用,就是当你想改善任何人都必须损害他人的利益的时候,这个时候经济体已经实现了帕累托效率。

目前世界上比比皆是的企业强强联合。这种强强联合使得企业资金雄厚,生产技术更加先进,从而达到1+1>2的效果。

在一个博弈中,一方给另一方一些利益,希望就此达成合作,但是另一方在选择时,必定不会为了感恩而放弃自己原有的利益。

麦当劳为了激励员工的工作热情,给勤奋上进的年轻员工提供了不断晋升的机会。但是也设立了一种:无论管理人员多么优秀,如果他没有预先培养自己的接班人,那么他在的公司的升迁将不被考虑。这一机制保证了麦当劳的管理人才不会出现青黄不接的情况。由于这关系到每个人的前途和声誉,所以每个人都会尽自己所能培养接班人,并保证为新来的与昂提供成长的机会。这个激励机制就好像“马蝇效应”。

这种博弈重点在于管理人员是否要为了自己的利益去花时间去帮助公司培养接班人。如果不培养接班人自己的晋升机会就得不到。

有句话说的很好“只有永远的利益,没有永远的朋友”

纳什均衡指的是一种战略组合,这种战略组合由所有参与人的最优战略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡实质上是一种非                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    合作博弈

“大企业搞研发,小企业搭便车”。华为的科研经费投入占据了企业2018年营业额的14.7%,他们的研发经费达到了150多亿美元。在这种情况下,小公司想要生产就成了非常难得事情。所以他们只能选择搭便车,由大企业研发新技术,小企业从这些技术中获益。

共同知识—是指一个群体的每个人不仅知道这个事实,而且每个人都知道该群体的其他人知道这个事实。正所谓“我知道你所知道的”

共同知识必须满足的条件:大家都知道它,相互都知道对方知道它,相互都知道对方知道自己知道它……

这就是一个无线推理的国产。共同知识队对博弈的结果有举足轻重的影响。共同知识依赖于共同的获取知识的渠道,也依赖于每个人获取知识点的主观意识和能力

本文大部分参考了李志新作者的看法,如果想了解或者是初学者想知道博弈,我推荐大家可以看《图解博弈论》李志新。

好了,博弈第一站到此先告一段落。日后我还会读更多的关于博弈的书籍,有时间一定会跟大家一起在分享!也希望自己下次分享的时候可以是大部分以我自己的看法给大家分享。

参考内容:

《图解博弈论》,李志新,全国百家出版社,中央编译出版社。

相关了解……

你可能感兴趣的内容

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 非常风气网