您现在的位置是:网站首页>人文人文
《博弈论》理性与策略的智慧交锋
铛铛铃2025-08-30【人文】17人已围观
简介
博弈论是研究决策互动的数学利器,揭示个体在竞争与合作中的最优策略。从囚徒困境到纳什均衡,从商业竞标到国际外交,本书以通俗语言拆解经典模型,展现如何用理性思维破解复杂局势。它不仅解释了为何“以牙还牙”能主导进化,更揭示了拍卖设计、股市博弈背后的深层逻辑。无论是职场竞争还是人际协作,掌握博弈论思维,便能在不确定世界中预判对手、掌控主动,将冲突转化为共赢的智慧艺术。
今天我要为您解读的书籍是《博弈论》。
说到博弈,大家或许并不陌生。博弈以此拆解来看的话,“博”可以代表赌,“弈”则是下棋对弈,所以博弈的思想其实早在古代就产生了。古代时候的象棋、围棋、赌博,都牵扯到一个博弈与胜负的问题。
直视千百年来,人们对博弈的认知,大多停留在经验积累上,并未上升到理论高度。直到20世纪初期,著名科学家约翰·冯·诺依曼才首次提出了博弈论的思想,并证明了博弈论的基础原理。
约翰·冯·诺依曼是一位传奇的科学家,是20世纪最赫赫有名的科学全才之一。如果用现在的话来说,约翰·冯·诺依曼绝对是一位标准的斜杠青年。他不仅是一名杰出的数学家,还是一名出色的物理学家、计算机学家、经济学家、化学家。他出生于一战前的匈牙利,从小天资过人,因出众的才智,成为美国普林斯顿高级研究院年纪最年轻的教授。之后入选美国原子能委员会,当选美国国家科学院院士。
第二次世界大战期间,冯·诺依曼担任导弹弹道研究顾问时,研制出了世界第一台电子多用途计算机。同时,冯·诺依曼还受邀加入美国原子能委员会,解决了原子弹临界质量确定的核心难题,对原子弹的研究做出了举足轻重的贡献。
当然,说到冯·诺依曼的贡献,就不得不提到他对博弈论的研究。1928年,冯·诺依曼通过对博弈论基本原理的证明,正式宣告了博弈论的诞生,他本人也因此被称为博弈论之父。16年后,他又将博弈论的运用扩展到经济学领域,与摩根斯坦合著《博弈论和经济行为》这本旷世名著,解决了经济学长期以来依赖数学、物理复杂运算的问题,为经济学的研究开辟了一条全新的道路。
今天给大家分享的这本书,集合了博弈论之父冯·诺依曼的经典论述,是一本关于博弈论的起源之作,它的名字就叫做《博弈论》。冯·诺依曼结合了我们生活中的实例,来阐释博弈论的原理,语言深入浅出,既适用于初学者的入门,又适用于专业学者的研究。书中有大量核心定理与数学运算支撑,让每一个人都能从中汲取到博弈论的营养,并运用到我们的日常生活中。可以说啊,它是一本用途广泛的科普书籍。
接下来呢,我们将《博弈论》这本书拆分成三个方面,一一来讲解。让我们一起进入博弈论的世界吧。
第一部分:什么是博弈论?博弈由哪些部分构成,又可以分为哪些种类呢?
博弈论,顾名思义,是关于博弈的理论。而博弈的思想,其实早已经存在于我们的生活之中。从日常的游戏、赌博,到文人之间的下棋、对弈,甚至到战场上的军事理论,无一不涉及到博弈。著名军事家孙武所作的《孙子兵法》,从某种意义上来说,可以称得上是最早的博弈论专著之一。孙子的“知己知彼、百战不殆”的思想,便是博弈论中关于信息收集、影响博弈结果的一个最好的实例。
博弈论直译就是游戏的理论,所以呢,通俗来说,我们可以把博弈理解为游戏。这里的游戏不仅是指狭义中我们日常的生活娱乐,广义来讲,它指代一切有输赢、对抗性质的竞争行为。在游戏中,我们需要为了目标努力,充分考虑环境与对手的策略,从而制定出最好的应对方法,以此赢得游戏的胜利,这就是博弈行为的本质。
拓展到实际环境中,就是某一个人或组织在所处的环境之下,充分运用所掌握的信息,在符合自身条件和外部规则的情况下,运用不同的策略组合,做出最佳选择,并加以实施,从而获得收益或结果的过程。而博弈论所研究的,就是在一个博弈行为中,充分考虑博弈各方参与者所有可能的行动方案,并运用数学方法,找出最合理行动方案的一种理论。
那么博弈一般需要具备哪些要素呢?博弈的构成主要分为五个方面:局中人、策略、得失、次序、均衡。
局中人,顾名思义啊,就是博弈的参与者。局中人在博弈中,需要通过自身情况进行决策,所制定的计划与方案需要针对整个对局,同时对整体的策略细分成某种单一的行动方案,我们称之为一个“招”。而每场博弈结束之后呢,都会有一个博弈的结果,这个结果称之为得失。任何一场博弈的得失,都与所有局中人在博弈过程中的策略密不可分,它代表着局中人策略的函数解。
而次序则是指博弈的顺序。在一个博弈赛局中,所有局中人的决策,无论是同时还是先后进行,在其他要素相同的情况下,博弈次序的改变,会对最终结果产生非常大的影响。因此呢,次序也是博弈的一个关键要素。
最后呢,每场博弈都会涉及到均衡的问题。均衡是一个经济学常用术语,是指一个平衡值。在博弈中如果达到均衡,就代表博弈的局中人处于一个稳定的状态,双方出于对整体情况的判断和自身收益的考量,不会采用进一步的行动来改变目前的平衡。
根据不同的分类标准,博弈可以分为不同的类型。首先是零和博弈和非零和博弈。根据博弈结束时,所有局中参与者所得到的报酬相加,如果是零的话,就称之为零和博弈,即博弈的双方有一方赢,就一定有一方输,并且他们的输赢是等价的。反之则是非零和博弈。由于非零和博弈更为复杂,在现阶段呢,我们先针对零和博弈进行探讨。
其次是合作博弈和非合作博弈。简单来说呢,合作博弈就是博弈的参与者制定了明确的合作协议,与之相反的则是非合作博弈。从研究难易度来说,非合作博弈也比合作博弈更为简单。因此,这次解读我们主要探讨的是非合作博弈,后面讲到的零和二人博弈和零和三人博弈,就是属于这个范畴。
此外呢,根据局中人行为的先后次序,可以分为静态博弈和动态博弈。静态博弈是指博弈双方并不知道对方所做的选择,而同时做出决策的情况,比如囚徒困境中,囚犯是不知道对方是否招供的。而动态博弈则是局中人在明确对方做出的选择之后,再进行行动,比如我们日常的扑克牌、下棋。
最后,根据局中人对参与者情况以及当下环境的了解程度,博弈还可以分为完全信息博弈和不完全信息博弈。我们前面提到的“知己知彼”,便是一种博弈中的信息优势。
第二部分:如何找到最优策略?零和二人博弈和零和三人博弈有什么具体区别呢?
在了解到博弈的要素和分类之后呢,我们又如何找到博弈中的最优策略呢?这里呢,让我们先来了解一下纳什均衡的概念。纳什均衡由著名科学家约翰·纳什提出,他指出在博弈中存在一个均衡点,即所有博弈的参与者会遇到一个特殊情况,在这一临界点下,博弈各方达到了一个平衡状态,只要对手不改变自己的策略,那么当前的策略就是最优的策略,一旦改变,任何一方的利益都会受损。因此呢,所有参与者都不会有进一步的行动。
当然,纳什均衡的建立更多是在数学理论的基础上,它有一个前提,就是所有参与者都必须保持理性。也就是说,博弈的参与者都是从自身利益出发,以获得自身收益最大化为目的来进行的决策,这就是博弈论最基础的理性人假设。
然而,在现实生活中,我们面对的情况往往更为复杂。拿下棋举一个例子,在这场博弈中蕴含着巨大的玄机,对弈双方不仅要根据对方的走位判断自己的策略,更要揣度推断对方的想法,同时呢,被揣度的一方也要预判对方的想法,思考出其不意的制胜之招。用一句流行语来说,就是“你预判了对方的预判”。
在这样复杂的情况下,博弈论是如何将现实问题转变为数学问题,来求出最优解的呢?我们这里省略复杂的数学推论,用一个最通俗易懂的答案来回答,就是“抱最好的希望,做最坏的打算”。
冯·诺依曼通过对下棋、乒乓球等最经典的二人零和博弈的研究,得出了最优策略——最大最小策略,即通过对对手的预判思考,如果让自己最大化失利,对手会做出什么样的策略,并根据这一策略定制自己的最优策略。
我们再来举一个最经典的石头剪刀布的例子,这也是一个零和二人博弈的例子。或许有读者会问,在这个游戏中,如何运用最大最小策略来预判对手呢?这里呢,我们又涉及到冯·诺依曼对零和二人博弈策略的研究及混合策略。它是指在这样的博弈中,策略组合有限,每个人获胜的概率是均等的。因此呢,不去判断对手的策略倾向,而是选择随机的方式来应对,是这类问题的最优解。
除此之外呢,更多掌握博弈中的情报,尽可能地获取更多关于对手、环境、规则的信息,才能制定出更为有效的博弈策略。
我们刚刚提到了零和二人博弈的普遍情况,那么零和三人博弈又有什么区别呢?其实啊,零和三人博弈可以看作是零和二人博弈的一个变形。如果仅有一人参与博弈,其实追求的是一个人利益最大化的问题。而零和二人博弈则代表双方有赢必有输,这就牵扯到一个最终受益的对立问题。那么零和三人博弈中,这个非此即彼的对立关系便不再成立,而是升级到合作的建立。
因此,零和三人博弈与零和二人博弈的本质区别在于,局中人是选择单独行动,还是与其他局中人达成合作。就如同我们常玩的斗地主,实际上是形成了一个二打一的阵营,从三人博弈变成了二人博弈。同时呢,这个问题同样也可以拓展到零和N人博弈,比如西方的桥牌,一三阵营和二四阵营需要结盟等。因此呢,合作在许多博弈中往往是必然的选择。
第三部分:你听说过枪手博弈和囚徒困境吗?是否选择合作,会对博弈结果有什么样的影响呢?
让我们一起来回顾一下那些博弈论中的经典案例,看看其中哪些原理可以运用到我们的日常中。
我们先来讲一个有趣的博弈论案例,叫做枪手博弈。假设有甲、乙、丙三位枪手,打算以决斗的形式进行一场博弈。三人中甲的枪法最准,十发八中;乙的枪法屈居第二,能够十发六中;丙的枪法最差,只能十发四中。如果三人都了解彼此的实力,在同时开枪的情况下,谁活下来的可能性最大?
或许啊,我们第一反应是枪法最好的甲,但实际情况是什么样的呢?让我们用博弈论的方法来分析一下。甲的最佳策略肯定是先对准乙,因为乙的枪法比丙好。同样呢,由于甲枪法好,乙和丙要先对准甲。由此呢,我们可以分别计算三人活下来的概率。甲活下来的概率是乙、丙皆未命中的情况,即40%乘以60%,等于24%;乙活下来的概率为甲未命中的概率,即20%;而枪法最差的丙,由于没人对准他,他的存活概率竟然是百分之百。是不是很神奇呢?
当然了,现实中很少遇到如此极端的情况,有时为了共同利益,许多人会选择合作。说到合作,就不得不提到一个大家或许都耳熟能详的经典案例——囚徒困境。
两位共谋的囚徒被捕后,关在两个单独的房间受审。如果两个人都不揭发犯罪事实,则两人会被从轻处罚,皆判处一年监禁;如果两人互相揭发,则每人判处8年;如果一个人揭发另一个不揭发,则揭发的一方可以被当庭释放,另一方则要面临10年监禁。在二人信息完全不通的情况下,出于对对方的不信任,和对自身处境最优化的考虑,两人都会选择揭发对方。然而最终都要被判监禁8年,对于双方来说,显然这并不是一个合理的结果。明明只要两个人都守口如瓶,就可以将刑罚减轻到最轻,可为什么双方还是选择不合作呢?这里边涉及到个人利益与群体利益之间的矛盾,有时利于个人的选择,并非是有利于群体的。
美国博弈论专家阿克塞尔·罗做过一个很有意思的实验,回答了博弈的参与者是否会选择合作、为什么要合作,以及什么情况下会合作的问题。与囚徒困境类似,在这个实验中,有两名参与者梅伦,双方皆可以自由选择合作或不合作。若两个人都选择合作,则各得三分;若两人都选择不合作,则各得一分;若一方选择合作另一方不合作,则选择合作的人得零分,选择不合作的得五分。
如果这个游戏只有一轮,在不知道对方选择的情况下,根据概率计算,选择合作最终得分为0.1:0.5分,而选择不合作最终得分为三分。和囚徒困境中的囚徒一样,很明显你一定会选择不合作。但是有趣的是,如果这个游戏不止一轮呢?为了最终尽可能地得到高分,你又会如何选择呢?
如果你一直选择不合作,那么双方永远都只有一分,这显然不是最优解。但选择合作的话,如果有一方突然背叛了呢?这里其实就涉及到了一个重复博弈的问题。为了解决这个问题,阿克塞尔·罗德设计了不同的程序,邀请了多名志愿者来进行实验,最终在实验过程中进行上百轮后,观测每组的得分。最后发现“一报还一报”的程序在长期情况下有最优的表现。
能够在实验中获得高分的程序,都有以下三个特点:一是倾向长期合作,具有善良性,不主动背叛;二是具有可激怒性,对于对方的背叛会进行报复;三是具备宽容性,不会无休止报复,而是及时止损,继续合作。
其实呢,这一个结果同样在生物学领域得到了验证,生物的群体进化是向着越来越合作的方向进化的。可以想象,那些具有恶意、不愿合作的策略,会一步步在无限的博弈循环中,因为更低的得分而被淘汰,而那些懂得合作的人则会获得更多的优势。
其实,中国传统文化中许多思想也与这一结论一脉相承,如《诗经》中的“投桃报李”,孔子《论语》中提出“以直报怨、以德报德”。而运用到我们的生活中,也是一样的道理。现实中的博弈永远不是只有一次的,因此,无论是个人,还是上升到群体乃至国家,都需要本着互惠互利、合作共赢的态度,共同交流、进步。其实这就是我们学习博弈论的意义。
在日常生活中,我们经常可以看到一些与博弈论经典原理相悖的行为,比如商家无底线的价格战,虽然某种程度上使消费者获益,但对于商家来说却是一种恶性竞争。经济发展与环境污染也是一对矛盾博弈,企业为了追求自身利益最大化,不会花费高额成本投入到环保里面,因而陷入一种低效率的均衡中。只有政府出台政策,加大污染治理,把绿水青山变成金山银山,提高社会整体效益后,才能使得经济发展的更好。
此外,贸易战更是一种不太理智的博弈,因为贸易战一旦打响,对两国利益都有极大的损害,是一种双输的行为。因此,面对中美贸易战,我国一致秉持“不想打、不愿打,但必要时不得不打”的态度,即开放磋商,也不惧怕对方挑衅。
到这里呢,《博弈论》这本书我们就讲完了。当今社会中,我们生活在一个机遇与挑战并存的世界里,竞争无处不在,博弈也如影随形。大到国际合作、外交谈判,或是企业决策、商业竞争,小到个人人生选择、目标实现,甚至是日常与他人的接触、交往、切磋,都不可避免的需要用到博弈论的相关知识。
通过对本书短短15分钟的解读,我们学到的不仅是博弈论的基础知识和基本原理,更重要的是博弈论的思维方式,让我们能够运用博弈论正确看待生活中的每一个机遇与挑战,从大局观角度把握时代全貌,在竞争中积极守住底线,掌握核心优势,主动进行最优的策略规划。
希望所有听众在听过今天的读书会分享后,都能学会用博弈论的知识武装自己,不打无准备之仗,在未来的竞争中独占鳌头。
那好了,今天的分享就到这里啦。我是应由,下期读书,我们再一起解读精品好书,记得收听哦。
"感谢喜欢,赞赏支持是对我的鼓励。"
很赞哦! (0)
下一篇: 《棉花帝国》血色棉絮中的全球资本狂飙
相关文章
发表评论
点击排行
- 《生活的陷阱》以实用的方法和深刻的智慧,带你走出人生至暗时刻,找到内在满足与持久
- 投资必看《反脆弱》学会如何从不确定性中获利, 塔勒布的“不确定性”系列丛书 已被
- 斯坦福大学最实用的心理学课程《自控力:和压力做朋友》压不死你的只会使你更强大!_
- 《什么都不做的习惯》如何通过休息提升生活质量? 不明原因的身体不适! 繁忙且压力
- 23分钟讲解《对大脑有害的12个习惯》
- 《自卑与超越》成人与青少年心理成长必修课,阐明人生道路和人生意义,超越自卑感实现
- 一然22分钟精读《终结阿尔茨海默病》全球首套预防与逆转 老年痴呆的个性化程序 纽
- 自我认知、自我管理、自我保护《修复玻璃心》高敏感人士生存法则,帮助你获得内心的平