日报标题:总是有先手优势,但我们想了很多办法保证游戏依然好玩
首先上很多人知道的策梅洛定理:
任何透明的、确定性的双人有限游戏,定有一方存在必不败的策略。
一般地,为了保证玩家的游戏体验,回合制游戏中玩家的行为本身应当与“优势”有直接关联,游戏目标也经常是两类显性的目标:“率先达成目标”或者“尽量多得分”,或者两者的混合。
率先达成目标:(举例)
- 先把对面的生命打到零。
- 先凑足五个子。
- 先赚他一个亿。
尽量多得分:(举例)
- 规定时间内尽量多打倒对方。
- 在局数耗尽前多赚钱。
- 在双方无处可下之前,尽量多占地盘(围棋)。
因此第一个进行行动的玩家在绝大多数时候也意味着第一个得到优势,而在上述环境里,很容易就变成先手必胜(或不败)的游戏。当然世界上也存在后手必胜的游戏,比如“石头 - 剪刀 - 布”变成先后手回合制,比如特定堆数组合的 Nim 游戏(轮流从堆中拿走棋子 / 火柴,直到有一方无子可拿)。
(三堆火柴组成的 Nim 游戏)
确切地说,我个人会将回合制游戏分为“行动主导”和“反制主导”,来区分这两类游戏。
行动主导:
- 玩家的行动回合本身被视为游戏中珍贵的核心资源。
- 玩家可以执行的行动中绝大多数都会直接往游戏目标靠近,并且很多时候可以直接量化。(局部最优解与全局最优解很接近,因此允许“贪心法”简化决策空间。)
- 允许 Strategy-stealing,也就是先手可以在第一轮进行明显带有优势的行动,然后复制后手的必胜策略(如果存在),因此普遍存在先手优势。
反制主导:
- 玩家根据对手前一行动的策略来进行互动和反制,对游戏目标有决定性的作用。
- 相比之下,玩家执行的行动未必对胜利都有贡献,有时反而会帮倒忙。(局部最优解与全局最优解关联不高)
- 可以从先行者的策略中做出针对,或者从先行者身上学习失败经验,因此许多情况下存在后手优势。
过于强调反制主导的游戏有个致命缺陷,就是即时的反馈不够直观,玩家难以在每一步行动中都找到乐趣(或者说,选择意义的缺失),容易破坏“心流”。所以它们的普遍受众比较小,因此现在市面上的例子还是行动主导的为主。
要平衡一个行动主导的回合制游戏中先手优势的影响,可以从数值、机制等等各个角度出发来寻找可行的方案。下面分析一些值得参考的方向和思路,结合实际情况来服用。
=== 思路一:“让数字说话” ===
减少初始资源与选择空间:
基于卡牌的回合制游戏,许多时候手牌的数量意味着选择的空间和握有的潜在战斗力总和,本身也是一种资源。因此诸如三国杀,炉石传说在内的卡牌游戏会让后手在游戏前期的手牌上占有优势,以此来对冲先手的优势。
同样地,你可以通过调整初始血量,初始金币,初始移动点数等等资源配比来避免先手有着显著的游戏,甚至还可以在先手的计分方式和获胜方式上做出惩罚。
计分惩罚:
这种方法与减少初始资源有着异曲同工的地方,对应的多数也是量化得分的游戏类型。传承千年的经典游戏——围棋,在现代就是使用“贴目”制度(具体数量各地区略有出入),让执黑先行的选手必须比对手多占一部分地盘才能获得本局胜利,来保证先后手的胜率在总体上保持平衡。(如果围棋不贴目,那么黑棋可以通过第一手下天元然后下模仿棋,这样白棋必须制造征子否则无法破解。)
但这种做法有个最显然的问题:你怎么知道具体该惩罚多少分?拍脑门吗?
除此之外还要注意的是,纯粹的量化惩罚与隐式设计(Implicit Game Design)理念有一定冲突,刻意制造了设计师的存在感,让玩家感觉把游戏天平完全建立在了设计师拿捏的一个数值上。这样的规则也会让玩家带着压力开始对局并创造不对称性,破坏整体美感。更好的做法是让两边玩家都清楚自己的初始优势在哪,是多了先行的机会,还是多了选择的空间?
===思路二: “行动不是全部” ===
让先手需要外部资源投入:
带有大量养成玩法的回合制对战游戏中(如 Pokemon),许多时候会引入一个“速度”概念,来决定谁会获得先手。这个速度属性是一个特殊的,winner-takes-all 的属性,大多数情况下同时也会占用养成的资源,这意味着玩家必须自己做出策略上的选择,是先手给我带来的优势重要,还是让其他硬属性高一些来得重要?这是一种极具趣味,且经过验证可行的玩法,同时也会根据资源比重不同引出一条互相克制的反制链来,与博弈论中“上校赛局”(Blotto Game)相当接近。
(Pokemon 中追求速度与否的争辩从未停止)
但是它也有着局限性。“速度”概念是需要外部资源投入的,也就是说必须和外部的养成之类的玩法结合,很难有办法在单局中实现平衡,同时也无法在对称性游戏中实现。毕竟游戏设计上没有完美的事不是么?
增加反制玩法:
上面提到的反制主导的游戏中,有许多是后手具有显著优势的。其原因就是这类游戏中存在策略的相互克制,使得后手方可以学习先手方的策略,并做出针对性的调整来取得优势。那如果把行动主导和反制主导的思想结合起来,让两边都没法占到便宜呢?
在 Dota 2 职业比赛的英雄选择环节,就使用了类似的做法。双方按 2-2-1 的次序轮流禁用(ban)特定英雄和选择(pick)特定英雄,如下图:
(从左往右,绿色表示绿方行动回合,红色表示红方行动回合,Ban 表示禁用英雄,Pick 表示选择英雄)
当然,假设英雄之间只存在绝对的强度差异,那么 ban-pick 顺序无论怎么调整,先选的一方总是有利的。但 Dota 2 巧妙的英雄设计让玩家在选择英雄时不仅要考虑强度差异,还有英雄之间的专长协作与克制关系,以及双方对英雄的熟悉程度不同,都会影响 ban-pick 时的选择。这样一来,职业比赛英雄选择部分就不再是纯粹的先手或运气成分主导,让比赛的观赏性在赛前英雄选择时就得到了充分的渲染。
=== 思路三:“让游戏变得不确定” ===
随机性:
与信息不透明度的思路一样,在游戏中引入随机性可以增加结果的不可预测性,从而降低其与玩家初始先后手状态的关联。但随机性也是一针毒药,用多了会让游戏单纯变成运气,大幅降低游戏策略带来的乐趣。要记住的是,随机性本身并不一定会改变游戏的对称性,但它可以冲淡因对称性带来的一边倒的最优解选择,给最优解的执行带来一定的障碍。
(一个标准卡坦岛游戏的棋盘)
在风靡世界的桌面殖民地建设游戏《卡坦岛》(Settlers of Catan)中,通过投掷两个骰子的点数之和来决定哪些玩家得以获取资源。同时初始两个基地的放置也是按照 从前到后 再 从后到前 的顺序,避免先行玩家对优秀资源点的垄断控制。
另一个提到随机性便不得不说的例子就是《炉石传说》。在炉石中从抽牌到效果发动无时无刻不充斥着随机结果的影响, n 抽 3 再 3 选 1 的发现机制也是随机性与决策的结合,更有甚者如尤格萨隆,一张牌随机性的表现在极端情况下便可直接左右比赛的胜负。
在这样的游戏中,随机性使游戏充满了变数,使后手玩家相信先手优势并不可怕,也使每局游戏玩家都有期待。但一如之前所言,过分的随机性会让玩家失去自主感,让游戏的成败变为听天由命的焦虑过程,需要好好把握;另外随机性与反制链的结合不当,也会让游戏变成石头剪刀布那样纯粹开局定胜负的游戏。
挖掘游戏深度:
策梅洛定理假设双方都是“完美的玩家”,但在实际游戏中,先手优势的大小不仅取决于其潜在收益,还得考虑玩家具体能做到多少。这里游戏“深度”一词指得便是技能上的深度,尤其是指即使最优解存在,人类因技能限制也无法达成完美的情况。
举个例子,足球篮球等体育比赛有先手优势吗?足球也是确定性的,信息透明的游戏,但没有人能保证自己能完美控制自己的身体(当然经过训练可以得到提升),球权的更迭很频繁。双方很多时候较量的就是这种身体控制能力,而先获得球权的优势虽然存在,但绝大多数时候并不足以扭转比赛的天平 --- 更何况在半场过后会轮换到另一队开球。
同样地,在国际象棋中,先手的白棋也普遍有着 2%-5% 的胜率优势。但由于决策树的深度和复杂度,国际象棋先手必胜与否目前还是处于猜想阶段,更别提让人脑去思考和执行了。所以哪怕对先手优势完全没有实质性的平衡手段,国际象棋的平衡也处于玩家普遍可接受的范围内。
(一个 X 方先行的井字棋游戏的完美平局)
反过来说,深度过浅的游戏先手优势会被放大。比如 Tic-tac-toe(井字棋)游戏,因为深度太浅且无随机性,很容易被大多数玩家找到最优解且容易实现。在这种情况下,先手优势不仅很大,而且很容易找到并实现不败策略,因此现在在成年人之间的娱乐对弈活动几乎完全不会考虑井字棋。
延续游戏长度:
某些时候,你已无法直接对游戏规则进行大刀阔斧的改革了,那你怎么进一步对先手优势进行限制呢?
一个办法就是,让大家轮流坐庄,在一定局数之后再判定总体胜负,如同斯诺克比赛那样要打十几局乃至三十几局来决出胜负。这样既可以降低随机性对结果的影响,又可以让先手优势得到压缩。然而缺点是会严重放慢游戏节奏,同时依旧无法对单局比赛的体验产生影响。
除此之外,还能拉长单局游戏的长度,像文明系列那样一局能打几百个回合,让游戏中后期冲淡前期先手的影响(至少是心理影响)。但同样会严重放慢游戏节奏,对不确定性较低的游戏而言还不一定会起到削弱先手的效果。
信息不透明度:
同样是可以用纸笔进行的回合制游戏,带有信息不透明度的 Battleship 的先手优势就完全不如 Tic-tac-toe 那么夸张(但是依旧存在)。在 Battleship 中,由于双方自身的海域布局对对手不可见,玩家需要轮流猜测敌船的摆放位置来进行炮击的选择。
(一个 10x10 的常见 Battleship 棋盘,用 x 标记炮击位置)
显然,如果把 Battleship 的海域布局改成对双方完全公开的形式,那么这游戏的先手就会变成必胜——先手能先把对方船轰完。但考虑到实际上初始阶段玩家只有大约 1/3 的概率命中有效目标(事实上与引入了随机性等价),先手就并不能保证对先行优势的转化,只有少数极端情况下先手正好比后手快一步击溃对手才会体现出优势。而这个可以通过一个小小的规则修改来避免,并达成完美对称性:
先手击沉敌人所有船只后,还会允许后手再进行一次炮击;如果后手也因此击沉了敌人所有的船只,则该局计为平局。
=== 延伸阅读:海盗分金与用餐者困境 ===
海盗分金讲述的是多人按顺序分配财产的博弈问题:
有五个理性的海盗,A, B, C, D 和 E,找到了 100 个金币,需要想办法分配金币。
海盗们有严格的等级制度:A 比 B 职位高,B 比 C 高,C 比 D 高,D 比 E 高。
海盗世界的分配原则是:
- 等级最高的海盗提出一种分配方案。
- 所有的海盗投票决定是否接受分配,包括提议人。并且在票数相同的情况下,提议人有决定权。
- 如果提议通过,那么海盗们按照提议分配金币。
- 如果没有通过,那么提议人将被扔出船外,然后由下一个最高职位的海盗提出新的分配方案。
海盗们基于三个因素来做决定。
- 首先,要能存活下来。
- 其次,自己得到的利益最大化。
- 最后,在所有其他条件相同的情况下,优先选择把别人扔出船外。
可能很多人都已经见过海盗分金的概念了。最优策略为[98,0,1,0,1]。推理过程可以在百度百科找到:海盗分金_百度百科
这里提出这个概念是为了说明,在足够的空间下,第一个行动的玩家潜在的优势在多人游戏中可以是相当巨大的,尤其是合理利用其他玩家存在的相互竞争关系时。但有的时候,有的游戏规则并不完全等同于海盗分金这样的动态博弈,而是更接近于一个用餐者困境,也就是囚徒困境的多人版:
有若干人出去吃饭,在点菜之前他们达成了一致:
- 所有人平摊买单的钱(AA 制)。
- 现在每个人要么点贵的菜肴,要么点便宜的菜肴。
假设贵的菜肴比便宜的要好(即效用高),但是如果一个人单独进食的话,不能保证为贵的菜肴多付的钱一定值得(即性价比低)。
每个人都这么推想:众人将会点便宜的菜肴,而由于点了更贵的菜肴而额外加的钱将被众人摊分,所以额外加的钱是很少的,而菜肴的味道却会有较大的改善,因而多花这点钱是划算的。每个人都这样推想,最后的结果是他们都花钱点了更贵的菜肴,而原本他们认为点便宜的菜肴要比点贵的对每个人都要好些。
在用餐者困境中,假如没有任何信任和交流的建立,每个人都会选择更贵的菜肴,使团体总体上得到损失。究其原因,其实在于决策制定过程的不透明性,假定的是每个人是同时或私下做出点餐决定的。如果我们把它与与海盗分金结合起来看,便可以制定一个新的规则,来解决用餐者困境。
有若干人出去吃饭,在点菜之前他们达成了一致:
- 所有人平摊买单的钱(AA 制)。
- 现在每个人要么点贵的菜肴,要么点便宜的菜肴。
- 每个人按次序点菜,点完之后公开自己的选择。
- 所有人可以投票决定是否接受这次选择,如果不接受则将该点餐人排除在外。
假设贵的菜肴比便宜的要好(即效用高),但是如果一个人单独进食的话,不能保证为贵的菜肴多付的钱一定值得(即性价比低)。被众人排除在这次用餐外则是最糟糕的体验,而少一个人一起吃饭也会给团体每个人带来些许的不快。
上述规则事实上并没有做出太大的变化,只是把静态博弈变成了动态博弈,鼓励了信息交流,每个人需要大家的同意才能做出选择。从决策上看,每个人选择便宜菜肴对别人都没有损失,而选择贵的菜肴就要冒潜在的被踢出的风险,单纯地踢出选择便宜菜肴的人对自己也没有收益,因此可以达成的纳什均衡则是唯一的——大家都会选择便宜的菜肴。
同样地,规则设计可以极大程度上左右决策。在多人游戏中,把游戏从海盗分金那样的纯竞争关系的零和博弈改为用餐者困境那样带有合作关系的非零和博弈,并合理掌握信息透明度,可以很大程度上通过合作规则来平衡局面。在 War3、帝国时代那样的 RTS 游戏中进行过多人混战模式的玩家可能还会记得,当一家独大的时候,其他玩家便会考虑群起而攻之。在《卡坦岛》这样的回合制策略游戏中也是一样的道理,在充分自由的交易规则下,玩家可以通过合作和对抗来尝试抵消任何已在游戏中存在的优势。
=== 结语 ===
回合制游戏的先后手平衡有着许多种不同的思路来帮助解决,最重要的还是知道我们的目的是什么:我是要让游戏展现出完美的对称性,还是仅仅需要保证玩家不会因先后手优势问题损伤游戏体验?
其实包括大富翁、飞行棋在内的绝大多数回合制游戏都或多或少具有先手优势,但并没有带来破坏性的影响。上面这些思路许多时候并不一定能完全抹平先手优势影响,也有的在过度使用时会破坏游戏体验,但最重要的是能够合理结合运用,来达成你的目的。