Równowaga Nasha
Autor: BIGMOUTH

Czym jest równowaga Nasha i jakie znaczenie ma dla pokerzystów? W tym artykule prezentujemy uproszczoną definicję tego pojęcia. Przekazujemy tylko takie informacje, które są istotne dla pokerowego studednta. Liczymy na to, że po lekturze tego tekstu będziesz znał poprawną odpowiedź na to, dlaczego warto uczyć się pokerowej teorii. Zaczynajmy!

ZOBACZ TEŻ: „Psy grające w pokera” – o czym mówią kultowe obrazy?

Równowaga Nasha – uproszczona definicja dla pokerzystów

Nie jesteśmy ekspertami z dziedziny matematyki, a zapożyczone z nauk ścisłych pojęcia, staramy się maksymalnie upraszczać i dostosowywać do naszych potrzeb. Jednym z takich pojęć jest równowaga Nasha, którą zajmiemy się w tym artykule. Purystów i specjalistów od teorii gier prosimy o wyrozumiałość. To Wam zostawiamy dbanie o formalne nazewnictwo i precyzję.

Czym zatem jest równowaga Nasha, tak na chłopski rozum? Zanim podamy bardzo uproszczoną definicję, potrzebujemy nakreślić nieco szerszy kontekst.

Wiemy już, że równowaga Nasha to pojęcie wywodzące się z teorii gier. Poker zalicza się do gier o sumie zerowej, ponieważ wygrana jednego gracza oznacza przegraną drugiego. Konfrontujące się ze sobą strony dążą do realizacji indywidualnych celów, tj. do maksymalizacji wygranej lub do zminimalizowana strat. W tym celu gracze stosują różnorodne strategie, które zmienia się w zależności od odpowiedzi rywala.

Równowaga Nasha określa teoretyczny stan równowagi, w którym żadna ze stron nie może jednostronnie zmienić swojej strategii, żeby w lepszy sposób zrealizować swój cel. Przekładając to na język pokerowy, żadna ze stron nie może jednostronnie zmienić strategii i w ten sposób doprowadzić do zwiększenia EV.

GTO i równowaga Nasha

W ostatnim dziesięcioleciu furorę zrobiło pojęcie GTO, czyli podejście uwzględniające w formułowaniu strategii gry teorię gier. Elementem kluczowym GTO jest istnienie równowagi Nasha. Obie nazwy używane są zamiennie. Mimo iż pod względem formalnym tak do końca nie jest, to na nasz użytek – użytek pokerzystów – możemy stosować takie uproszczenie.

Model GTO jest modelem teoretycznym, który zakłada, że:

  • obie strony grają perfekcyjnie z punktu widzenia teorii gry;
  • obie strony mają pełną wiedzę dotyczącą strategii swojej oraz rywala.

Powyższe przesłanki muszą zaistnieć do tego, żeby można było rozpatrywać grę w ujęciu GTO. Pełna wiedza dotycząca strategii drugiej strony jest niezbędna, żeby określić równowagę Nasha. Będąc w tym punkcie żaden z graczy nie chce modyfikować swojej strategii, gdyż perfekcyjnie grający rywal będzie w stanie wykorzystać każde odejście od optimum.

Tyle teoria, a jak jest z praktyką?

Czy GTO jest w ogóle użyteczne?

Pierwsze, co rzuca się w oczy to to, że w realnym świecie żaden z graczy ani nie gra perfekcyjnie, ani nie zna strategii swojego przeciwnika. Co więcej, większość nawet nie jest w stanie określić własnej strategii. Czy wobec powyższego stosowanie elementów teorii gry do formułowania pokerowej strategii to strata czasu? Niekoniecznie.

GTO winno się używać do wyznaczania punktu odniesienia, benchmarka. Do precyzyjnych wyliczeń służą solvery, a człowiek może jedynie wspomagać się szacunkami oraz heurystyką. Warto się w tym ćwiczyć, ponieważ rozumienie teorii przekłada się na podejmowanie lepszych decyzji w starciu z ludźmi.

John Nash - siedzący przy stole z mikrofonami na jakieś konferencji.
John Nash – on wymyślił koncept równowago, którą nazwano jego nazwiskiem.

Jak odejść od GTO i zyskać EV?

Pokerowa codzienność jest taka, że w rywalizacji z człowiekiem niemal zawsze da się wybrać strategię graną z częstotliwością 100%, która daje większe EV w sytuacji, w której nawet solver wskazuje obojętność między np. sprawdzeniem a foldem. Przed podjęciem ostatecznej decyzji gracze powinni przejść przez poniższą procedurę:

  • próba oszacowania tego, jak może wyglądać strategia GTO dla danego spota.
  • ustalenie tego, w jaki spsób rywal odbiega od równowagi Nasha; czy robi coś zbyt często/zbyt rzadko, z szerszym/węższym zakresem, czy spot jest underblefowany/overblefowany przez populację etc.
  • stworzenie strategii przeciwnej, maksymalnie wykorzystującej odejście od teorii.
  • wdrożenie strategii w życie.

Nikt nie wynagrodzi nas za znajomość teorii w chwili, gdy nasze żetony będzie zgarniał mało doświadczony rywal, który w życiu nie słyszał o GTO i równowadze Nasha. Nie można usprawiedliwiać złego zagrania tym, że według GTO rywal nie powinien był wykonać jakiegoś tam zagrania. Nie powinien, ale właśnie to zrobił i ma nasze żetony. Dobry pokerzysta ciągle musi brać pod uwagę to, że ktoś może stosować strategię znacząco odbiegającą od teorii.

Podsumowanie

Wszyscy jesteśmy tylko ludźmi, a nasze możliwości przetwarzania danych są bardzo ograniczone. Maksymalnie na co nas stać, to szacowanie equity, liczenie outów i oddsów. Nie potrafimy nawet wyliczyć EV – możemy tylko szacować, czy coś wydaje się mieć EV pozytywne, negatywne czy na granicy.

Najlepsi pokerzyści nie są najlepsi dlatego, że grają jak komputery. Najlepsi pokerzyści są najlepsi, gdyż wykorzystują znajomość pokerowej teorii do tego, żeby maksymalnie exploitować leaki swoich rywali. GTO i równowaga Nasha to tylko drogowskaz, a nie przepis na wygrywanie.

Doro
Pasjonat pokera, który chciałby, żeby gra stała się ważniejszą częścią jego życia. Wybrał się w drogę z NL2 do NL100. Czy kiedyś zrealizuje swój cel?