W minionym tygodniu ludzie zdołali odrobić trochę strat w pojedynku z botem, ale program pokerowy Libratus nie dał za wygraną i wczoraj zmiażdżył swoich oponentów dusząc ich mały upswing w zarodku.

W piątek czterej specjaliści gier no-limit przegrywali już bowiem około 460.000 w walce z botem stworzonym przez Uniwersytet Carnegie Mellon. Z planowanych 120.000 rozdań rozegrano już niemal 50.000. Dwudziestodniowa bitwa w kasynie Rivers zakończyć ma się pod koniec stycznia.

Jeszcze parę dni temu wyglądało na to, że pokerzyści zdołają odrobić straty, ale maszyna zrobiła najwyraźniej postęp dzięki dokonywanym na bieżąco analizom rozdań lub ingerencji badaczy, którzy go zaprogramowali.

“Absolutna miazga na korzyść komputera” ocenił Doug Polk, który walczył w roku 2015 z wcześniejszą wersją bota o nazwie Claudico. “Przewaga programu zaczyna być po prostu przytłaczająca.”

bot-match-libratus460.000 żetonów to 4600 big blindów. Każde rozdanie pojedynczy zawodnik rozpoczyna ze stackiem 200 big blindów, czyli 20000 żetonów. W 2015 ludzie pokonali Claudico o 732.700 tychże. Blindy wynosiły wtedy tyle samo – 50-100.

W tamtym czasie naukowcy z Carnegie Mellon nazwali wynik “statystycznym remisem.” Nie wiadomo czy challenge w tym momencie nadal kwalifikuje się na remis, ale jeśli coś się nie zmieni pokerzyści zakończą grę stratni o jakiś milion żetonów, co na pewno uznane będzie za ich porażkę ze sztuczną inteligencją.

Doug Polk poinformował, że bot w tym tygodniu zmienił taktykę i z buttona nie limpuje już ani nie min-raisuje tylko folduje albo przebija 2,5 razy tyle ile wynosi big blind. Polk nie ukrywa, że Libratus radzi sobie preflop lepiej niż Claudico. Naukowcy mają też możliwość wprowadzania zmian w oprogramowaniu w czasie przerw.

“Ogólnie w grach heads-up, min-raisowanie [na pozycji buttona] to kiepski pomysł, bo dużemu blindowi opłaca się to sprawdzić” mówi Polk. “Ciekawe jest to, że bot dopiero po 6 dniach zdecydował się na zmianę strategii. Sam raczej nie wpadł na to w ciągu nocy, więc zakładam, że poprawkę wprowadzili twórcy oprogramowania.”

Kolejna modyfikacja w „zachowaniu” programu to wielkość kwoty zagrywanej na river. Claudico blefował i value betował na riverze, ale Libratus radzi sobie z tym o wiele lepiej.

“Program bardzo ładnie miksuje blefy z value betami” – dodaje Doug. “Robi to często i niekonwencjonalnie. Czasami reprezentuje układ, który musiałby być rozgrywany slowplay’em na wcześniejszych ulicach, co nie zdarza się często w grach między ludźmi. Zdarzają się na przykład olbrzymie bety na riverze, gdy na turnie poczekano, a na flopie złożonym z trzech kart tego samego koloru padł jeden bet.”

Polk stwierdził, że szanse na wygraną ludzi to teraz jakieś 10 procent.

“Jeśli nie poprawią czegoś u siebie, to będzie koniec. Wygląda na to, że dwa ostatnie dni bardzo usprawniły grę bota.”

źródło: cardplayer

Wesker
Nauczyciel, tłumacz, dziennikarz, mąż, świeżo upieczony ojciec i amator pokera. W wolnej chwili lubię powędrować korytarzami tworzonymi w wyobraźni Stephena Kinga. Nie pogardzę także dobrą grą jeśli dać mi jakiegoś pada w ręce. Muzycznie zatrzymany w latach 90-tych.