博弈论

博弈论（英语：Game Theory），又译为对策论或赛局理论，是经济学的一个分支，1944年冯·诺伊曼与奥斯卡·摩根斯特恩合著《博弈论与经济行为》，标志着现代系统博弈理论的初步形成，因此他们被称为“博弈论之父”。博弈论被认为是20世纪经济学最伟大的成果之一。目前可以应用在生物学、经济学、国际关系、计算机科学、政治学、军事战略，研究游戏或者博弈内的相互作用，是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。现代的博弈论的源头是约翰·冯·诺伊曼对于双人零和博弈的混合策略均衡点的发想和证明。

概述

博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。表面上不同的相互作用可能表现出相似的激励结构（incentive structure），所以它们是同一个游戏的特例。其中一个有名有趣的应用例子是囚徒困境。

具有竞争或对抗性质的行为称为博弈行为。在这类行为中，参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益，各方必须考虑对手的各种可能的行动方案，并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋，打牌等。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案，以及如何找到这个合理的行为方案的数学理论和方法。

生物学家使用博弈理论来理解和预测进化（论）的某些结果。例如，John Maynard Smith和George R. Price在1973年发表于《自然》杂志上的论文中提出的“进化稳定对策”的这个概念就是使用了博弈理论。还可以参见进化博弈理论和行为生态学（behavioral ecology）。

博弈论也应用于数学的其他分支，如概率、统计和线性规划等。

数学定义

对于“博弈”有不少可以互换的定义。这里给出简短的介绍和相互关系的说明。

范式博弈

范式博弈又被译为正则形式的博弈、策略型博弈或标准型博弈。

设定 $\mathrm {N}$ 是一个“参与者”（players）的集合。对于每一个“参与者” $i\in \mathrm {N}$ 都有一个给定的“策略”集合 $\Sigma \ ^{i}$ 博弈（游戏）是一个函数，定义为：

\pi \ :\prod _{i\in \mathrm {N} }\Sigma \ ^{i}\to \mathbb {R} ^{\mathrm {N} }

也就是说，如果我们知道了参与者的策略集合是什么，那么就可以有一个实数值与之对应。我们可以把上面的方程拆成两个方程来进一步把它一般化。一个方程是正则形式（Normal form game）的参与者方程，描述策略规定结果的方式。另外一个方程描写参与者对于结果（outcome）集合的偏好（preference）。也就是：

\pi \ :\prod _{i\in \mathrm {N} }\Sigma \ ^{i}\to \Gamma \

这里 $\Gamma \$ 是游戏（博弈）的结果集合（outcome set）。对于每一个参与者 $i\in \mathrm {N}$ 都有一个偏好函数（preference function）

\nu \ ^{i}:\Gamma \ \to \mathbb {R}

。

展开形式的博弈

展开形式的博弈又可译为扩展形式的博弈、扩展式博弈或扩展型博弈。

正则形式的定义为数学家们提供了“均衡”（equilibria）问题的研究一个容易使用的表达式。因为它避免了怎么计算“策略”的问题，也就是说游戏是怎么进行的问题。

若要考虑游戏是如何进行的，展开形式的博弈是一个比较方便的表达式。这个形式与组合博弈论关系密切。这个定义通过一个树的形式给定。在树的每一个节点（vertex），不同的参与者选择一个边（edge）。

博弈论简史

对于博弈论的研究开始于恩斯特·策梅洛（1913）、埃米尔·博雷尔（1921）及冯·诺伊曼（1928），后来由冯·诺伊曼和奥斯卡·摩根斯坦（1944，1947）首次将其系统化和形式化（参照Myerson, 1991）。随后约翰·福布斯·纳什（1950，1951）利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。

约翰·福布斯·纳什、约翰·海萨尼及莱因哈德·泽尔腾因为他们对博弈论的突出贡献而获得1994年的瑞典银行经济学奖。罗伯特·约翰·奥曼、肯·宾摩尔、戴维·克瑞普斯（英语：David M. Kreps）及阿里尔·鲁宾斯坦对于博弈论也做出重大贡献。

博弈分类

博弈的分类根据不同的基准也有不同的分类。一般认为，博弈主要可以分为合作博弈和非合作博弈。它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议，如果有，就是合作博弈，如果没有，就是非合作博弈。

从行为的时间序列性，博弈论进一步分为两类：静态博弈是指在博弈中，参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动；动态博弈是指在博弈中，参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。通俗的理解：“囚徒困境”就是同时决策的，属于静态博弈；而棋牌类游戏等决策或行动有先后次序的，属于动态博弈。

按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息，在这种情况下进行的博弈就是不完全信息博弈。

目前经济学家们现在所谈的博弈论一般是指非合作博弈，由于合作博弈论比非合作博弈论复杂，在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为：完全信息静态博弈，完全信息动态博弈，不完全信息静态博弈，不完全信息动态博弈。与上述四种博弈相对应的均衡概念为：纳什均衡、子博弈精炼纳什均衡（英语：subgame perfect Nash equilibrium）、贝叶斯纳什均衡、精炼贝叶斯纳什均衡（perfect Bayesian Nash equilibrium）。

博弈论还有很多分类，比如：以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈；以表现形式也可以分为一般型（战略型）或者展开型，等等。

博弈论相关概念

参考书目

Harold W. K.(editor), 1997, Classics in Game theory, Princeton, NJ:Princeton University Press ISBN 0-691-01193-1
Myerson, R., 1991, Game Theory: Analysis of Conflict. Cambridge and London: Harvard University Press.
Osborne, M. and A. Rubinstein，1994，A Course in Game Theory, Cambridge and London: The MIT Press.
岡田章,1996,『ゲーム理論』東京：有斐閣 ISBN 4-641-06794-5
金子守『ゲーム理論と蒟蒻問答』日本評論社、2003年4月。 ISBN 4-535-55288-6
川西諭『ゲーム理論の思考法』中経出版、2009年9月。 ISBN 978-4-8061-3470-1
Axelrod, Robert: The Evolution of Cooperation, 1985, ISBN 0-465-02121-2
Axelrod, Robert: The Complexity of Cooperation - Agent-Based Models of Competition and Collaboration, 1997, ISBN 0-691-01567-8
Dixit, Avinash K./ Skeath, Susan: Games of Strategy, 1999, ISBN 0-393-97421-9
Eigen, Manfred / Winkler, Ruthild: Das Spiel, 1976, ISBN 3-492-02151-4
Hargreaves Heap, Shaun P. / Varoufakis, Yanis: Game Theory - A Critical Text, 2004, ISBN 0-415-25095-1
Kelly, Anthony: Decision Making Using Game Theory - An Introduction for Managers, 2003, ISBN 0-521-81462-6
Schlee, Welter: Einführung in die Spieltheorie, 2004, ISBN 3-528-03214-6

外部链接

联盟博弈论在通信系统中的应用（页面存档备份，存于互联网档案馆）（英文）- Tutorial written by Prof. Debbah, head of the Alcatel-Lucent Chair on flexible radio
Economics and Language （页面存档备份，存于互联网档案馆）, by Ariel Rubinstein（页面存档备份，存于互联网档案馆）
Bargaining and Markets, by Osborne, M. （页面存档备份，存于互联网档案馆） and A. Rubinstein（页面存档备份，存于互联网档案馆）

查论编主要的数学领域
历史纲要（英语：Outline of mathematics）列表（英语：Lists of mathematics topics）符号表
数学基础	范畴论集合论数理逻辑数学哲学
代数	抽象交换群论初等代数线性代数多重线性代数泛代数
数学分析	微积分实变函数复变函数微分方程泛函分析调和分析傅里叶分析几何分析
离散数学	组合数学图论序理论博弈论
几何学	代数几何解析几何微分几何离散几何学欧几里得几何非欧几里得几何有限几何学
数论	算术代数数论解析数论几何数论算术几何丢番图几何
拓扑学	点集拓扑代数拓扑微分拓扑几何拓扑
统计学	测度与概率数理统计学数据科学统计推断回归分析统计学习理论机器学习人工智能数据结构与算法
计算数学	计算机科学计算理论数值分析最优化计算机代数
应用数学	控制论信息论计算化学数理生物学数理经济学计量经济学数理金融学数学心理学数学物理学生物统计学
其它	娱乐数学数学与艺术（英语：Mathematics and art）数学教育
注释	数学的领域也可根据“MSC分类标准”或“中国学科分类国家标准”进行分类。
分类主题共享资源专题

查论编博弈论专题
定义	正则形式的博弈 · 扩展形式的博弈 · 图博弈论 · 合作博弈 · 信息集 · 偏好
均衡概念（英语：Solution concept）	纳什均衡 · 强纳什均衡（英语：Strong Nash equilibrium） · 子博弈均衡（英语：Subgame perfect equilibrium） · 贝叶斯-纳什均衡 · 贝叶斯完美均衡（英语：Perfect Bayesian equilibrium） · 颤抖手完美均衡 · 恰当均衡（英语：Proper equilibrium） · ε-均衡 · 相关均衡 · 序贯均衡 · 准完美均衡（英语：Quasi-perfect equilibrium） · 进化稳定策略（英语：Evolutionarily stable strategy） · 风险占优（英语：Risk dominance） · 帕累托最优 · 自我应验均衡（英语：Self-confirming equilibrium） · 马尔可夫完美均衡（英语：Markov perfect equilibrium） · 默滕斯稳定均衡（英语：Mertens-stable equilibrium） · 核（英语：Core (game theory)） · 夏普利值（英语：Shapley value） · 吉布斯均衡（英语：Potentialg ame） · 量子响应均衡（英语：Quantal response equilibrium） · 谢林点
策略	优势策略 · 纯策略 · 混合策略 · 以牙还牙 · 冷酷触发策略（英语：Grim trigger） · 策略复制论证（英语：Strategy-stealing argument） · 逆向归纳法（英语：Backward induction） · 前向归纳法（英语：Forward induction） · 马尔可夫策略（英语：Markov strategy）
博弈类型	对称博弈 · 完美信息 · 序贯博弈 · 重复博弈 · 信号博弈 · 廉价磋商（英语：Cheap talk） · 零和博弈 · 机制设计 · 随机博弈 · 非传递博弈 · 全局博弈（英语：Global game） · 甄别博弈（英语：screening game） · 讨价还价问题（英语：Bargaining problem） · 多人博弈（英语：n-player game） · 大型泊松博弈（英语：Large Poisson game） · 严格决定博弈 · 潜博弈（英语：Potential game） · 位势博弈
博弈模型	围棋 · 国际象棋 · 无限棋（英语：Infinite chess） · 西洋跳棋 · 井字棋 · 囚徒困境（可选择的囚徒博弈（英语：Optional prisoner's dilemma） · 用餐者困境） · 旅行者困境 · 猜均值的2/3 · 协调博弈（英语：Coordination game） · 蜈蚣博弈 · 志愿者困境 · 搭便车问题 · 拍卖美元 · 胆小鬼博弈 · 智猪博弈 · 性别战 · 猎鹿博弈 · 赌便士（英语：Matching pennies） · 最后通牒博弈（海盗博弈） · 剪刀、石头、布 · 独裁者博弈（信任游戏） · 公共物品博弈（英语：Public goods game） · 纳什讨价还价问题（英语：Nash Bargaining Game） · 上校博弈 · 消耗战 · 少数派博弈（El Farol酒吧问题） · 公平分配博弈（切蛋糕问题（英语：Fair cake-cutting）） · 古诺竞争 · 死结 · 库恩扑克游戏（英语：Kuhn poker） · 甄别博弈（英语：Screening Game） · 公主与怪兽游戏（英语：Princess and monster game） · 约会问题（英语：Rendezvous problem） · 囚徒帽子谜题（英语：Prisoners and hats puzzle）
定理	极值定理 · 纯化定理（英语：Purification theorem） · 无名氏定理 · 显示定理（英语：Revelation principle） · 阿罗不可能定理 · 极小化极大算法 · 纳什均衡 · 策梅洛定理
关键人物（英语：List of game theorists）	阿尔伯特·W·塔克 · 阿摩司·特沃斯基 · 阿里埃勒·鲁宾斯坦 · 克劳德·香农 · 丹尼尔·卡内曼 · 戴维·K·莱文（英语：David K. Levine） · 戴维·M·克雷普斯（英语：David M. Kreps） · 唐纳德·B·吉利斯（英语：Donald B. Gillies） · 朱·弗登博格（英语：Drew Fudenberg） · 埃里克·马斯金 · 哈罗德·W·库恩（英语：Harold W. Kuhn） · 赫伯特·亚历山大·西蒙（司马贺） · 埃尔维·穆兰（英语：Hervé Moulin） · 让·梯若尔 · 让-弗朗索瓦·默滕斯（英语：Jean-François Mertens） · 珍妮弗·图尔·蔡司（英语：Jennifer Tour Chayes） · 夏仙义·亚诺什·卡罗伊 · 约翰·梅纳德·史密斯 · 安托万·奥古斯丁·库尔诺 · 约翰·福布斯·纳什 · 约翰·冯·诺伊曼 · 肯尼斯·阿罗 · 肯尼思·宾默尔 · 里奥尼德·赫维克兹 · 劳埃德·沙普利 · 梅尔文·德雷希尔（英语：Melvin Dresher） · 梅里尔·M·弗勒德 · 奥嘉·邦达雷娃（英语：Olga Bondareva） · 奥斯卡·莫根施特恩（英语：Oskar Morgenstern） · 保罗·米尔格龙 · 佩顿·杨（英语：Peyton Young） · 赖因哈德·泽尔腾 · 罗伯特·阿克塞尔罗 · 罗伯特·约翰·奥曼 · 罗伯特·B·威尔逊 · 罗杰·梅尔森 · 塞缪尔·鲍尔斯（英语：Samuel Bowles (economist)） · 苏珊娜·斯科奇姆 · 托马斯·克罗姆比·谢林 · 威廉·维克里
参见	全支付拍卖 · Alpha-beta剪枝 · 伯川德悖论（英语：Bertrand paradox (economics)） · 有限理性 · 组合博弈论 · 对抗分析（英语：Confrontation analysis） · 合作性竞争 · 棋局中的先手优势（英语：First-move advantage in chess） · 博弈机制（英语：Game mechanics） · 博弈论词汇表（英语：Glossary of game theory） · 博弈理论家列表（英语：List of game theorists） · 特殊博弈列表 · 双输 · 国际象棋的解局策略（英语：Solving chess） · 拓扑博弈（英语：Topological game） · 公地悲剧 · 小决定暴政

查论编微观经济学
基本概念	稀缺性财货经济物品免费物品私人物品公共物品商品及服务（英语：Goods and services）商品服务约束最大化经济成本（英语：Economic cost）平均成本（英语：Average cost）边际成本机会成本社会成本沉没成本交易成本利息跨期选择需求与供给供给曲线需求曲线弹性经济均衡一般均衡超额需求超额供给
消费者理论	偏好效用无差异曲线预算线收入–消费曲线（英语：Income–consumption curve）不确定性风险厌恶损失规避效用预期效用假说边际效用需求的价格弹性
企业理论	生产要素分工回报递减生产成本固定成本变动成本利润等成本曲线等产量曲线利润最大化规模经济与规模不经济范围经济（英语：Economies of scope）集聚经济
市场分析	市场市场形式市场竞争（英语：Competition (economics)）垄断性竞争完全竞争双头垄断垄断双边寡头垄断买方垄断寡头垄断买方寡头垄断市场失灵价格经济剩余消费者剩余生产者剩余无谓损失外部性经济效率经济公平（英语：Equity (economics)）社会抉择（英语：Social choice）
研究分支	行为经济学商业经济学计算经济学决策论应用经济学计量经济学工程经济土木工程经济学（英语：Engineering economics (civil engineering)）进化经济学实验经济学博弈论产业组织理论制度经济学劳动经济学法律经济学管理经济学数理经济学宏观经济学的微观基础（英语：Microfoundations）运筹学最优化福利经济学
分类相关主题列表经济学宏观经济学政治经济学

规范控制数据库
国际	FAST
各地	西班牙法国 BnF data 德国以色列美国日本捷克
其他	IdRef 2