Phil Galfond vysvětluje GTO: Od bonbonu v ruce až po exploity proti regům

Game Theory Optimal - pojem, který dnes zná každý seriózní hráč. Ale rozumí mu opravdu každý? Phil Galfond se pokusil vysvětlit GTO v pěti úrovních náročnosti – od rozhovoru se šestiletým dítětem až po debatu s profesionálem, který denně pracuje se solverem.

Level 1: Bonbon v ruce a síla randomizace

Základní myšlenka GTO je jednoduchá: hrát tak, aby vás soupeř nemohl exploitovat. Galfond to vysvětluje na dětském příkladu – do jedné ruky schová bonbon a dítě má hádat, ve které je. Kdyby vždy držel bonbon v pravé ruce, soupeř by to rychle zjistil. Kdyby ruce pravidelně střídal, vzorec by se dal odhalit také.

Řešením je randomizace. Házení mincí. Pokud strategie obsahuje náhodnost, soupeř nemá jak získat výhodu. To je jádro GTO – vyvážená strategie, kterou nelze systematicky porazit.

Level 2: Kámen, papír, nůžky

Na úrovni teenagera jde o známý koncept z hry kámen, papír, nůžky. Pokud hráč preferuje určitý vzorec, lze jej přečíst. Jediná neporazitelná strategie je randomizace mezi všemi možnostmi. V pokeru to znamená balancování value betů a bluffů. Nejde o to vyhrát každou ruku. Jde o to, aby soupeř nemohl najít vzorec, který dlouhodobě zneužije proti vám.

Level 3: Ace-King-Queen a balans na riveru

Na vysokoškolské úrovni Galfond používá zjednodušený model – tzv. Ace-King-Queen. Pokud jeden hráč jde all-in s esy, králi a částí queen jako bluff, musí správně nastavit poměr value a bluffů podle pot odds. Jeho soupeř musí bránit (callovat) ve správné frekvenci, aby se nestal exploitovatelným. Klíčový koncept je Minimum Defense Frequency - pokud hráč brání příliš málo, soupeř může profitabilně bluffovat více. Pokud brání příliš často, value handy inkasují maximum.

Level 4: Range construction a board coverage

Na úrovni regulára se věci komplikují. Už nejde jen o river, ale o konstrukci range od flopu až po river. Galfond upozorňuje na častou chybu – hrát jednotlivé streety izolovaně. Pokud je flop range špatně vyvážená, turn a river budou automaticky také nevyvážené.

Důležitý koncept je board coverage. Na flopu musíte mít v betting range kombinace, které vám umožní reprezentovat sílu i na budoucích kartách – flush turnech, straight kartách či párovaných boardech. Proto se na flopu často používají malé sizingy, které umožňují zachovat širší spektrum kombinací. Na turnu a riveru se sizingy rozšiřují. Rozhodnutí jsou více polarizovaná. A opět platí – frekvence musí být vyvážené.

Level 5: Přestaň hrát jako solver, začni myslet jako solver

Nejsilnější část přichází na úrovni experta. Galfond tvrdí, že snaha „hrát jako solver“ je chyba. Memorování výstupů simulací vede k mentálnímu přetížení a paradoxně k exploitu. Je nemožné dokonale reprodukovat solver strategii. A pokud se hráč příliš snaží kopírovat GTO bez pochopení, vznikají díry v jeho range construction, které si pozorný soupeř všimne.

Řešení? Učit se koncepty. Rozumět „proč“ za jednotlivými rozhodnutími. Vytvořit si zjednodušený model, který šetří mentální kapacitu. Tu pak využít na exploitativní hru. Podle Galfonda je právě exploitativní hra místem, kde se vydělávají žetony. Pokud víte, že soupeř bluffuje 60 % tam, kde by měl 30 %, nebo naopak nebluffuje téměř vůbec, právě tam vzniká edge.

GTO jako základ, nikoli cíl

GTO není o dokonalosti - je o neexploitatelnosti. Ale nejlepší hráči nezůstávají jen u teoretické rovnováhy. Používají ji jako základ, ze kterého se odrážejí k exploitům. Galfond tímto pětistupňovým vysvětlením ukazuje, že i nejkomplexnější teorie má jednoduché jádro: balans, frekvence a pochopení logiky za rozhodnutími. A právě schopnost myslet jako solver – ne hrát jako solver – je rozdíl mezi dobrým regulárem a elitním profesionálem.

Zdroje – YouTube, PokerNews, PhilGalfond.com