策略 (博弈论)

在赛局理论里，玩家在赛局中的策略是指在所有可能发生情况下的一套完整行动计画；这完全决定了玩家的行为。玩家的策略会决定玩家在赛局的任一阶段所采取的行动，不论这一阶段之前是如何演变而来的。

策略组合是每个玩家都完全选定他们在赛局中所有行动的一套策略。一个策略组合对每个玩家都必须包括一个且只能一个的策略。

策略有时会和移动搞混。移动是指玩家在赛局中某一点所采取的行动；策略则是完整的演算法，告诉玩家在赛局中的每一个可能情况下要如何动作。

策略集合

策略集合是个由玩家所能采取的策略所组成的集合。

若玩家有有限个具体的策略可供选择，则称其有个有限策略集合。例如，在单一次剪刀、石头、布里，每一个玩家都有一个有限策略集合 {剪刀, 石头, 布} 。若有无限个具体的策略可供选择，则称其有个无限策略集合。例如，有规范出价增额的拍卖会有个无限策略集合 {$10, $20, $30, ...} 。另外，在分蛋糕问题里则有个连续的策略集合 {在蛋糕的百分之零至百分之百间的任一处切分} 。

在动态赛局里，策略集合是由玩家能够给定机器人如何进行赛局的规则所组成的。例如，在最后通牒赛局里，第二位玩家的策略集合应该是由要接受及要拒绝的各种规则所组成的。

在贝氏赛局里，其策略集合和动态赛局的相似，由任何私有情报所会采取的行动规则所组成。

选择策略集合

在应用赛局理论里，策略集合的定义是使赛局能同时可解及有意义的重要一部份；利用对整个问题的了解来限制策略空间，以简化问题。

例如，严格来说，在最后通牒赛局里，玩家可以有策略如下：“拒绝 ($1, $3, $5, ..., $19)，而接受 ($0, $2, $4, ...,$20) ”。包括所有的策略会使得策略空间变得很大，并且得到一个稍难的问题；但对这赛局的理解，相信是可以限制其策略集合为 {拒绝所有不大于 x 的钱，而接受所有大于 x 的钱；这里的 x 等于 ($0, $1, $2, ..., $20) 的其中一个} 。

纯策略和混合策略

策略集合是由玩家能够施行的纯策略所组成的集合。例如“剪刀、石头、布”中，玩家只有剪刀、石头和布这三个策略。纯策略就是只使用策略集合中其中一条策略。

混合策略是对每个纯策略分配一个机率而形容的策略。混合策略允许玩家随机选择一个纯策略。因为机率是连续的，所以即使策略集合是有限的，也会有无限多个混合策略。

当然，严格来说，每个纯策略都是一个“退化”的混合策略，某一特定纯策略的机率为 1 ，其他的则为 0 。

完全混合策略是个混合策略，其对每个纯策略都分配了一个不为零的机率。（完全混合策略对如颤手完全均衡之类的均衡精细很重要。）

混合策略

例子

	A	B
A	1, 1	0, 0
B	0, 0	1, 1
纯协调赛局

假设一收益矩阵表示如右（为一协调赛局）。这里，一个玩家选择行(Row)，另一个玩家选择列(Column)。行玩家得到第一个收益，列玩家则得到第二个。若行玩家偏向百分之百选择 A ，则称他在玩纯策略。若列玩家偏向以掷硬币来决定，若头朝上则选择 A ，若字朝上则选择 B ，则称他在玩混合策略，而非纯策略。

重要性

在约翰·福布斯·纳什的一篇著名的论文里，他证明出对每个有限赛局，都存在一个均衡。纳什均衡可以分成两类：“纯策略纳什均衡”，之中的所有玩家都玩纯策略；和“混合策略纳什均衡”，之中至少有一位玩家玩混合策略。并不是每个赛局都会有纯策略纳什均衡，例如赌便士就只有混合策略纳什均衡，而没有纯策略纳什均衡。不过，还是有许多赛局有纯策略纳什均衡（如协调赛局、囚徒困境和猎鹿赛局）。甚至，有些赛局能同时有纯策略和混合策略均衡。

争议的解释

在1980年代时，混合策略的概念曾遭受很严重的攻击，被认为是“直觉地有问题”^[1]。混合策略的核心－随机缺乏行为的支持，人们很少会凭运气做决定。此一行为问题在认知的难题上显得更加严重，因为没有人能够在没有随机数发生器的帮助之下做出随机的决定来。

在阿里尔·鲁宾斯坦的一篇论文中^[2]，他描述了另一个了解此一概念的方法。首先，基于纯化理论^[3]，并假设混合策略的解释只是反应了对玩家资讯和决策过程认识的缺乏。明显地，随机决定被认为是不明确、利益无关的外部因素的结果。然而，一个由不明确的因素决定的结果很难令人感到满意。

第二个解释是，想像有许多组玩家在进行赛局，每组玩家都选择一个纯策略，且利益是依赖玩家们选择策略的百分比来决定的。因此，混合策略便表示是每一组玩家所选择的纯策略的分布。然而，这对玩家都是单独的一组时，提不出什么合理的解释。

之后，奥曼和布兰登柏格 ^[4]) 重新将纳什均衡解释成是一种“信念”的均衡，而不是行动的。例如，在剪刀、石头、布里，信念的均衡即每个玩家都“相信”对方会平均地施行每一个策略。然而，此一解释弱化了纳什均衡的预测能力，因为在此均衡里，“确实”地施行石头的纯策略也是可能的。

直至今日，学者们对混合策略的结果依然是很矛盾的。混合策略依然广泛地被应用不存在纯策略均衡的赛局中，以提供其一个纳什均衡，但这些模型都无法说清楚为何且如何玩家能够随机化他们的决定。

参考资料

^ Aumann, R. "What is Game Theory Trying to accomplish?" （页面存档备份，存于互联网档案馆）. Frontiers of Economics, edited by K. Arrow and S. Honkapohja, pp. 909-924, Basil Blackwell, Oxford, 1985.
^ Rubinstein, A. "Comments on the interpretation of Game Theory", Econometrica, July, 1991 (Vol. 59, n°4)
^ Harsanyi, John, Games with randomly disturbed payoffs: a new rationale for mixed-strategy equilibrium points, Int. J. Game Theory, 1973, 2: 1–23
^ Aumann, Robert; Brandenburger, Adam, Epistemic Conditions for Nash Equilibrium, Econometrica, 1995, 63: 1161–1180

另见

纳什均衡

[1] Aumann, R. "What is Game Theory Trying to accomplish?" （页面存档备份，存于互联网档案馆）. Frontiers of Economics, edited by K. Arrow and S. Honkapohja, pp. 909-924, Basil Blackwell, Oxford, 1985.

[2] Rubinstein, A. "Comments on the interpretation of Game Theory", Econometrica, July, 1991 (Vol. 59, n°4)

[3] Harsanyi, John, Games with randomly disturbed payoffs: a new rationale for mixed-strategy equilibrium points, Int. J. Game Theory, 1973, 2: 1–23

[4] Aumann, Robert; Brandenburger, Adam, Epistemic Conditions for Nash Equilibrium, Econometrica, 1995, 63: 1161–1180

[1]

[2]

[3]

[4]

查论编博弈论专题
定义	正则形式的博弈 · 扩展形式的博弈 · 图博弈论 · 合作博弈 · 信息集 · 偏好
均衡概念（英语：Solution concept）	纳什均衡 · 强纳什均衡（英语：Strong Nash equilibrium） · 子博弈均衡（英语：Subgame perfect equilibrium） · 贝叶斯-纳什均衡 · 贝叶斯完美均衡（英语：Perfect Bayesian equilibrium） · 颤抖手完美均衡 · 恰当均衡（英语：Proper equilibrium） · ε-均衡 · 相关均衡 · 序贯均衡 · 准完美均衡（英语：Quasi-perfect equilibrium） · 进化稳定策略（英语：Evolutionarily stable strategy） · 风险占优（英语：Risk dominance） · 帕累托最优 · 自我应验均衡（英语：Self-confirming equilibrium） · 马尔可夫完美均衡（英语：Markov perfect equilibrium） · 默滕斯稳定均衡（英语：Mertens-stable equilibrium） · 核（英语：Core (game theory)） · 夏普利值（英语：Shapley value） · 吉布斯均衡（英语：Potentialg ame） · 量子响应均衡（英语：Quantal response equilibrium） · 谢林点
策略	优势策略 · 纯策略 · 混合策略 · 以牙还牙 · 冷酷触发策略（英语：Grim trigger） · 策略复制论证（英语：Strategy-stealing argument） · 逆向归纳法（英语：Backward induction） · 前向归纳法（英语：Forward induction） · 马尔可夫策略（英语：Markov strategy）
博弈类型	对称博弈 · 完美信息 · 序贯博弈 · 重复博弈 · 信号博弈 · 廉价磋商（英语：Cheap talk） · 零和博弈 · 机制设计 · 随机博弈 · 非传递博弈 · 全局博弈（英语：Global game） · 甄别博弈（英语：screening game） · 讨价还价问题（英语：Bargaining problem） · 多人博弈（英语：n-player game） · 大型泊松博弈（英语：Large Poisson game） · 严格决定博弈 · 潜博弈（英语：Potential game） · 位势赛局
博弈模型	围棋 · 国际象棋 · 无限棋（英语：Infinite chess） · 西洋跳棋 · 井字棋 · 囚徒困境（可选择的囚徒博弈（英语：Optional prisoner's dilemma） · 用餐者困境） · 旅行者困境 · 猜均值的2/3 · 协调博弈（英语：Coordination game） · 蜈蚣博弈 · 志愿者困境 · 搭便车问题 · 拍卖美元 · 胆小鬼博弈 · 智猪博弈 · 性别战 · 猎鹿赛局 · 赌便士（英语：Matching pennies） · 最后通牒赛局（海盗博弈） · 石头、剪子、布 · 独裁者赛局（信任游戏） · 公共财赛局（英语：Public goods game） · 纳什讨价还价问题（英语：Nash Bargaining Game） · 上校赛局 · 消耗战 · 少数派博弈（El Farol酒吧问题） · 公平分配博弈（切蛋糕问题（英语：Fair cake-cutting）） · 古诺竞争 · 死结 · 库恩扑克游戏（英语：Kuhn poker） · 甄别博弈（英语：Screening Game） · 公主与怪兽游戏（英语：Princess and monster game） · 约会问题（英语：Rendezvous problem） · 囚徒帽子谜题（英语：Prisoners and hats puzzle）
定理	极值定理 · 纯化定理（英语：Purification theorem） · 无名氏定理 · 显示定理（英语：Revelation principle） · 阿罗不可能定理 · 极小化极大算法 · 纳什均衡 · 策梅洛定理
关键人物（英语：List of game theorists）	阿尔伯特·W·塔克 · 阿摩司·特沃斯基 · 阿里埃勒·鲁宾斯坦 · 克劳德·香农 · 丹尼尔·卡内曼 · 戴维·K·莱文（英语：David K. Levine） · 戴维·M·克雷普斯（英语：David M. Kreps） · 唐纳德·B·吉利斯（英语：Donald B. Gillies） · 朱·弗登博格（英语：Drew Fudenberg） · 埃里克·马斯金 · 哈罗德·W·库恩（英语：Harold W. Kuhn） · 赫伯特·亚历山大·西蒙（司马贺） · 埃尔维·穆兰（英语：Hervé Moulin） · 让·梯若尔 · 让-弗朗索瓦·默滕斯（英语：Jean-François Mertens） · 珍妮弗·图尔·蔡司（英语：Jennifer Tour Chayes） · 夏仙义·亚诺什·卡罗伊 · 约翰·梅纳德·史密斯 · 安托万·奥古斯丁·库尔诺 · 约翰·福布斯·纳什 · 约翰·冯·诺伊曼 · 肯尼斯·阿罗 · 肯尼思·宾默尔 · 里奥尼德·赫维克兹 · 劳埃德·沙普利 · 梅尔文·德雷希尔（英语：Melvin Dresher） · 梅里尔·M·弗勒德 · 奥嘉·邦达雷娃（英语：Olga Bondareva） · 奥斯卡·莫根施特恩（英语：Oskar Morgenstern） · 保罗·米尔格龙 · 佩顿·杨（英语：Peyton Young） · 赖因哈德·泽尔腾 · 罗伯特·阿克塞尔罗 · 罗伯特·约翰·奥曼 · 罗伯特·B·威尔逊 · 罗杰·梅尔森 · 塞缪尔·鲍尔斯（英语：Samuel Bowles (economist)） · 苏珊娜·斯科奇姆 · 托马斯·克罗姆比·谢林 · 威廉·维克里
参见	全支付拍卖 · Alpha-beta剪枝 · 伯川德悖论（英语：Bertrand paradox (economics)） · 有限理性 · 组合博弈论 · 对抗分析（英语：Confrontation analysis） · 合作性竞争 · 棋局中的先手优势（英语：First-move advantage in chess） · 博弈机制（英语：Game mechanics） · 博弈论词汇表（英语：Glossary of game theory） · 博弈理论家列表（英语：List of game theorists） · 特殊博弈列表 · 双输 · 国际象棋的解局策略（英语：Solving chess） · 拓扑博弈（英语：Topological game） · 公地悲剧 · 小决定暴政