GTO的原则

on

Principles of GTO

剥削框架和 GTO 框架
博弈论,或称 GTO(Game Theoretically Optimal,博弈论最优),最好不要理解为一套可接受或可拒绝的僵化规则,而是一种思考扑克、预测对手行动和改进自己决策的框架。它的目标是避免对对手的错误做出强烈的假设,而是建立无论对手如何打牌都能保持稳健的策略。这使得它在与强敌对战和与不熟悉的对手对战时特别有用,因为对手的失误是你无法预测的。

博弈论,或称 GTO(Game Theoretically Optimal),最好不要理解为一套可接受或可拒绝的僵化规则,而应理解为一种扑克思维框架。

利用型思维是解决相同问题的另一种方法。利用型方法试图预测对手会犯的特定错误,并制定策略最大限度地利用这些错误。这种方法最适合对付那些你已知其倾向的较弱棋手。
在 “石头、剪子、布 “游戏中,每个玩家都要用手投掷这三个标志中的一个。石头赢剪刀,剪刀赢纸,纸赢石头。利用的方法是猜测对手会扔什么,然后据此选择自己的标志。博弈论的方法是随机选择投掷,每种投掷的概率为 33%。这样对手就不可能预测到你的行动,如果你无法预测对手的行动,这就是你所能期望的最好结果。

在扑克中,这些框架并不相互排斥。事实上,博弈论可以帮助您设计出更多有利可图的策略。例如,您可能知道对手在翻牌前跟注了太多弱牌,但却不清楚他们在翻牌后会如何玩这些弱牌。博弈论可以帮助您从发现的错误中获利,而无论对手在翻牌后如何玩他们的弱手牌,您都不会让自己有可乘之机。

博弈论为何有用?
博弈论是在不确定条件下做出决策的工具。在缺乏关于对手意图的可操作信息的情况下,博弈论假定对手会尽可能地发挥其最大能力,理性地追求利润。虽然没有人的对手会玩得尽善尽美,但这正是大多数人所追求的,所以在没有其他信息指导时,这是一个有用的假设。
理解博弈论的第一步是学会跳出剥削框架进行思考。这对资深玩家来说可能很有挑战性,因为你可能没有意识到你长期以来学习或发展的策略中包含了多少假设。
在很多情况下,这些假设都是有道理的,而且根据这些假设行事会比单靠博弈论取得更好的结果。然而,重要的是要认识到它们假设,这样你就不会在不适用的情况下依赖它们。

行动中的博弈论
假设在一个有效筹码为 100BB 的游戏中,您在 BTN 上开牌 J♥ 9♦,BB跟注。您在翻牌 Q♦ 6♥ 5♠ 继续下注,并在转牌 K♠ 跟注。您的对手再次跟注,河牌是 2♣。

您应该诈唬还是放弃?🤔💭

如果 BB 是您的常规对手,您可能很容易回答这个问题。张三从不付大注,所以对他来说很容易诈唬。李四讨厌被诈唬,喜欢看您的牌,所以您不会试图诈唬她。
如果您不了解对手,您可能会依靠简单的启发式,例如 “如果他们要弃牌,他们会在转牌圈弃牌 “或 “如果他们有足够的实力跟注,他们会在转牌圈加注”。

这些都是钻空子的决策过程。它们依赖于猜测对手的意图,并据此出招。如果你猜对了,你就赢了。但是如果你猜错了–如果张三已经受够了你的诈唬,或者李四准备离开,不想冒着输掉大局的风险–那么你的对手就会利用你,即使他们没有意识到这一点。
无法利用或博弈论的方法是避免给对手轻易利用你的机会。这种方法不是试图预测对手会怎么做,而是专注于让自己的下法变得不可预测,这样对手就不会有单一的最佳下法。
不可预测并不意味着随机。如果您在 Q♦ 6♥ 5♠ K♣ 2♣ 桌面上有 43 最后行动,您应该下注。过牌坚果牌肯定是不可预测的,但不会盈利。

不可预测并不意味着随机。

同样,如果您有 K8,您应该让牌。这手牌太强,不足以诈唬,但也不足以下注求值。这手牌不需要让人捉摸不透;只需让牌,并在摊牌时获得您的权益。

用正确的牌,以正确的频率诈唬,才能让你变得难以捉摸,难以对抗。

你的对手也许能预测到你总是下注你的强牌,总是让牌你的中等牌,有时下注精心选择的诈唬牌,但是这些信息并不能给他们提供明显的最佳下注策略。当你下注时,他们不知道这次你有哪种类型的手牌。因此,当他们拿着能打败你的诈唬牌却输给你的价值下注的牌时,他们就没有办法赢你。你的策略没有为他们提供明显正确的最佳下法。

下面是这种情况下 BTN 的 GTO 扑克解决方案:

你看到有些牌明显喜欢下注或让牌,但有些牌,比如你的 J♥9♦,有时下注有时让牌吗?这就是不对对手做任何假设的结果。与 K8 不同,J9 没有 “正确 “的下法。你所能做的就是以一定的频率诈唬,结合你在这种情况下也会下注的所有其他手牌,让对手没有好的选择,只能用他们平庸的诈唬抓牌。
下面是对手对 84% 彩池下注的回应,就像 GTO Wizard 建议有时用 J9 下注一样。请注意,即使是一些 BB 的顶对,如 K8,在面对这个下注时也没有好的选择。跟注、弃牌和加注都是不可取的。

国际象棋中有一个概念叫 “分叉”。如果你只威胁到对手的一个棋子,这并不会让对手难以抉择,因为他们可以简单地将其移至安全位置。如果您设置了一个叉子,您就可以同时威胁到多个棋子,让对手别无选择。他们可以将一个棋子移到安全位置,但会失去另一个棋子。

这个河牌下注实现了同样的目的。如果对手弃牌 K8,他们就有可能输给你的诈唬。如果他们跟注,他们就有可能赔付你的价值下注。您不能强迫对手采取任何特定行动,但不可剥削扑克的核心目标是通过剥夺对手有吸引力的选择,让他们难以做出决定。

无漏洞扑克的核心目标是通过剥夺对手有吸引力的选择,让他们难以做出决定。

独立性
上面 GTO 向导图表中的混合策略代表着困难的决定。通过正确的策略,您可以拒绝对手使用这些手牌进行特别有利可图的行动。当对手有一手好牌时,无论你做什么,他们都会赚钱。但是通过聪明的下法,您可以限制他们的赢面。

只有当两个或更多选项具有相同的等价物时,不可剥削的下法才会在这两个或更多选项之间进行混合。如果没有哪个选项比另一个选项更好或更差,玩家就会对它们漠不关心。

不可开发策略的目标是最大化 EV。冷漠是实现这一目标的手段。当你不认为对手会犯任何特定错误时,你所能做的就是不让他们有机会下特别好的棋。在本文中了解更多关于独立性的信息。

混合策略与固定策略
你不可能让对手在每个决策点对每一手牌都平衡。有时会好一点,而当好一点时,博弈论认为对手会发现它。这些最佳下法在策略图上显示为固定策略,是玩家每次都应该采取的行动。记住:不可预测并不意味着随机 ☝ ‼
混合策略 “混合 “你的下法,有时用一手牌采取一种行动,有时用另一手牌采取另一种行动。欺骗性地玩这些手牌不会给你带来任何损失,因为你根本就没有偏好。在不了解对手策略的情况下,你会期望两手牌(或三手牌、四手牌或五手牌)都有相同的EV。

频率错误

混合策略并不意味着任意选择。相反,正确的下法在很大程度上取决于对手的策略。

只有当对手下的是完全无法利用的策略时,混合策略中所有选择的EV值才是相同的。如果您能预测到与对手的哪怕是很小的偏差,那么其中一个选项的EV值会更高,您应该始终选择它。
在我们上面的例子中,BB 的不可控策略要求在河牌下注时弃牌 48.9%。如果他们有 49% 的手牌弃牌,那么用 J9 诈唬严格来说要比过牌好。虽然不会好很多,但您每次诈唬都会增加您的EV。
这样做,您将偏离您自己的不可剥削的 GTO 策略。您将在剥削框架内操作,对对手的错误做出假设。如果这些假设是正确的,你就会领先。如果假设是错误的,你就会比坚持使用无法利用的诈唬频率更糟糕。
这是一个频率错误的例子。J9 并不适合诈唬。您的错误在于用它诈唬的频率过高,而这个错误只在对手以可利用的高频率跟注时才会让您损失金钱。如果他们以可利用的高频率弃牌,这个 “错误 “就会让你赚钱。
这个错误的意义在于,如果对手知道或猜到了你的策略,他们即使拿着 K8 这样的边缘牌也不会做出困难的决定。如果知道你经常虚张声势,他们就可以自信地跟注。

这种错误也会让习惯性频繁跟注的玩家输钱。这些玩家从你过度诈唬的错误中获利,甚至不知道你在犯错误。如果你在 “石头、剪子、布 “游戏中总是扔石头,你不仅会输给任何知道你策略的玩家,还会输给任何像你扔石头一样喜欢扔纸的玩家。

纯粹错误
纯粹错误是指下注一手不适合下注的牌(或过牌一手不适合过牌的牌)。在 Q♦ 6♥ 5♠ K♣ 2♣ 的例子中,K8 太强而不能诈唬,但又不足以下注求值。下注它不会让您的对手难以抉择。他们会简单地弃掉大部分较差的牌而跟注所有较好的牌。
过牌 KK 也不会让对手做出困难的决定。它将给对手一个便宜的摊牌,让他们面对许多手牌的艰难选择,是弃牌冒着诈唬的风险,还是跟注冒着输给像KK这样的强牌的风险。
与频率错误不同,纯错误对对手的策略并不特别敏感。即使对手本身没有做任何可利用的事情,这些错误也会让你输钱。当你check KK时,你错过了对手会跟注的下注。当您下注 K8 时,您会不必要地输钱给更好的牌,而您本可以免费摊牌。
即使是纯粹的错误,也只是博弈论框架下的错误。如果对手自己犯了正确的错误,这些 “错误 “理论上可以成为利用策略中有利可图的部分。例如,如果对手是一个大型跟注站,会在河牌中跟注许多坏牌,那么下注 K8 将是有利可图的,即使 GTO 向导将其显示为纯过牌。
博弈论并不要求你在这手牌上盖牌。相反,它告诉您,除非您有很好的利用理由,否则下跳应该是您的默认打法。
混合策略告诉你你可以选择;没有默认下法。在不了解对手策略的情况下,所有的混合选择都是一样好的。即使是你的对手可能会偏离这种或那种策略的预感,也会让你倾向于一种选择而不是另一种选择。偏离纯粹的策略需要对手犯更大的错误才是正确的。

混合策略告诉你,你可以选择;没有默认的下法。在不了解对手策略的情况下,所有的混合选择都是一样好的。

结论

博弈论是一种工具。与任何工具一样,在正确的情况下以正确的方式使用,它就会产生价值。要使用这个工具,你必须了解它是如何工作的。
如果你不了解扑克的博弈论,你就根本不了解扑克。充其量,您只是通过不断尝试和犯错,总结出了对付某些类型对手的策略。在你经常遇到的情况下,你可能会游刃有余,但在不那么熟悉的地方,你就会举步维艰。
运用博弈论并不需要完美地执行你在图表(如本文中的图表)上看到的策略。只要理解 “平衡”(indifference)的概念,并学会从让对手做出艰难决定的角度来思考问题,而不是试图猜测他们会如何决定,就能大大帮助您更好地理解和应对陌生局面。