纳什平衡(英语:Nashequilibrium),又称为非合作赛局博弈,是在非合作博弈(Non-cooperativegame)状况下的一个概念解,在博弈论中有重要地位,以约翰·纳什命名。如果某情况下无一参与者可以通过独自行动而增加收益,则此策略组合被称为纳什均衡点[1]。

1例子2学术争议和批评3相关链接4註5参考6外部链接

其经典的例子就是囚徒困境。囚徒困境是一个非零和博弈。大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被立即释放,而对方将被判刑10年;如果两人均招供,将均被判刑2年。如果两人均不招供,将最有利,只被判刑半年。于是两人同时陷入招供还是不招供的两难处境。但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳什均衡点。这时个体的理性利益选择是与整体的理性利益选择不一致的。囚犯的博弈矩阵囚犯甲招供不招供囚犯乙招供各判刑2年甲判刑10年,乙立即释放不招供甲立即释放,乙判刑10年各判刑半年基于经济学中“理性经济人”的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑半年就不会出现。事实上,这样两人都选择坦白的策略以及因此被判两年的结局被称作是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以「独自行动」(即单方面改变决定)而增加收获。

本条目中立性有争议。内容、语调可能带有明显的个人观点或地方色彩。(2007年10月23日)加上此模板的编辑者需在讨论页说明此文中立性有争议的原因,以便让各编辑者讨论和改善。在编辑之前请务必察看讨论页。第一,纳什的关于非合作博弈论的平衡不动点解(equilibrium/fixpoint)学术证明是非构造性的(non-constructive),就是说纳什用角谷静夫不动点定理(英语:Kakutanifixedpointtheorem)证明了平衡不动点解是存在的,但却不能指出以什么构造算法如何去达到这个平衡不动点解。这种非构造性的发现对现实生活里的博弈的作用是有限的,即使知道平衡不动点解存在,在很多情况下却找不到,因此仍不能解决问题。[来源请求]第二,纳什的非合作博弈论模型仅仅是突破了博弈论中的一个局限。一个更大的局限是,博弈论面对的往往是由几十亿节点的庞大对象构成的社会、经济等复杂行为,但冯·诺伊曼和纳什的研究是针对两三个节点的小规模博弈论(有人称之为tiny-scaletoycase)。[来源请求]这个假设的不完善处,可能比假设大家都是合作的更严重。因为在经济学里,一个庞大社会里的人极不可能全部都是合作的,非合作的情况通常在庞大对象的情形中更普遍,而在两三个节点的小规模经济中倒反而影响较小。既然改了合作前提为非合作前提,却仍然停留在两三个节点的小规模博弈论中,这是一个不可忽视的缺陷。MIT的一位计算机科学博士生的博士论文[2]——获得2008年度美国计算机协会学位论文奖——认为经济学家的推测是错误的,找到纳什均衡点是几乎不可能的事。目前担任MIT电机工程和计算机科学系助理教授的ConstantinosDaskalakis与UC伯克利的ChristosPapadimitriou、英国利物浦大学的PaulGoldberg合作,证明对某些博弈来说,穷全世界所有计算机之力,在整个宇宙寿命的时间内也计算不出纳什均衡点。Daskalakis相信,计算机找不到,人类也不可能找到。纳什均衡属于NP问题,Daskalakis证明它属于NP问题的一个子集,不是通常认为的NP-完全问题,而是PPAD-完全问题。这项研究成果被一些计算机科学家认为是十年来博弈论领域的最大进展。不过在同一篇论文里,Daskalakis也指出,在参与者匿名的情况下,则仅需多项式时间即可逼近纳什均衡。

囚徒困境帕累托最优博弈论P/NP问题PPAD(英语:PPAD(complexity))

若pi(s)=maxri[pi(s;ri)]{\displaystylep_{i}(s)=max_{r_{i}}[p_{i}(s;r_{i})]},,则纳什称s为平衡点(Equilibriumpoint)。—-其中pi{\displaystylep_{i}}为参与者i的收获(payoff),si{\displaystyles_{i}}代表所有参与者之策略,ri{\displaystyler_{i}}代表参与者i的一种可能策略,(s;ri){\displaystyle(s;r_{i})}指参与者i单方面改变策略成ri{\displaystyler_{i}}。—P.287,AnnalsofMathematics1951

《Non-CooperativeGames》,约翰·纳什,TheAnnalsofMathematics1951

纳什博弈论的原理与应用北京晚报(2002年3月21日)

请输入您的评论. 可以使用维基语法:
K S P B D