Naukowcy z Carnegie Melon ujawniają jak Libratus pokonał ludzi

Napisany przez

19/12/2017

Naukowcy odpowiedzialni za stworzenie pierwszego w historii pokerowego bota, który pokonał zawodowych graczy ujawniają nowe informacje na temat swojej pracy i planów na przyszłość.

Tuomas Sandholm z Uniwersytetu Carnegie Mellon i Noam Brown napisali artykuł do magazynu American Association for the Advancement of Science. Twierdzą, że ich bot, Libratus zachowywał się jak “nadczłowiek” w pojedynkach heads-up no-limit hold’em.

Fakt faktem w styczniu Libratus stoczył bój z czwórką specjalistów gier heads-up no-limit hold’em. Było to 120.000 rozdań rozegranych w ramach challengu “Brains vs. AI”, który trwał przez 20 dni w Pittsburghu. Po stronie ludzi stanęli wtedy tacy gracze jak: Jason Les, Dong Kim, Daniel McCauley i Jimmy Chou. Kiedy gra dobiegła końca okazało się, że pokerzyści stracili razem 1.776.250 żetonów (około 14 big blindów na 100 rozdań). Oznaczało to druzgocące dla ludzi zwycięstwo maszyny. Każdy z nich przegrał bowiem ze sztuczną inteligencją. Wcześniejsza wersja Libratusa przegrała z grupą profesjonalistów w 2015.

Pokonanie ludzi nie było łatwym zadaniem, ale Sandholm i Brown nie poddawali się. Największym wyzwaniem okazało się to, jak złożoną grą jest poker w odmianie no-limit.

“Do rozwiązania prostszej wersji gry, heads-up limit Texas hold’em, posłużył nam algorytm. Tam jednak liczba możliwych do podjęcia decyzji to tylko 10 do potęgi 13, podczas gdy w HUNL mamy 10 do 161. Stworzenie odgórnej strategii w tak złożonym drzewie decyzyjnym jest niemożliwe. Trzeba zaprogramować bota, aby sam podejmował decyzje na podstawie uzyskiwanych informacji.”

Sandholm i Brown postanowili wyposażyć swój twór w trzy moduły podejmujące działania na stole, tak aby każde rozdanie traktowane było jako osobny problem do rozwiązania. Ważne było to, aby nie upraszczać zbytnio decyzji podejmowanych przez maszynę. Ludzie szybko zauważyliby leak i zaczęli go wykorzystywać.

“Na pierwszy rzut oka kolor z najwyższą kartą w postaci króla nie różni się od takiego samego układu, z damą. Upraszcza to wyliczenia, których dokonać musi maszyna, ale na wyższych stawkach, z ekspertami gry takie drobne niuanse decydują nierzadko o wygranej lub przegranej.”

Wielu obserwatorów zgadza się, że Libratus odniósł tak spektakularny sukces, bowiem podejmował świetne decyzje na river. Overbety stosowane na tej ulicy były zbalansowane (sporo blefów oraz value betów) i dały potężną przewagę komputerowi (Libratus w łacinie, to własnie potężny).

“Naprawdę dostaliśmy łomot” – powiedzieli pokerzyści po pojedynku.

Libratus bardzo dobrze oceniał bowiem to, co w pokerze nazywamy “blockerami”. Jeśli przykładowo mamy na boardzie , to może i nie mamy najlepszej ręki (wręcz odwrotnie), ale rywal na pewno nie ma nutsów (kolor z ). To dzięki temu bot dobrze rozpoznawał sytuacje, gdy overbet na river był dobrym, trudnym do sprawdzenia, pomysłem.

Kolejną różnicą w stosunku do poprzednich wersji było także to, że Libratus nie zakładał sobie odgórnie scenariuszy na river, tylko obliczał wszystko na bieżąco na podstawie betu przeciwnika.

“Decyzje podejmowane w dwóch ostatnich licytacjach nie wynikają z założenia głównego programu Libratusa. Bot oblicza sobie to, ile wygranych żetonów i z jaką ręką może oczekiwać jego oponent, a potem wynajduje sposób optymalnego kontrataku.”

Co dalej będzie z naszym ulubionym botem? Naukowcy nie ukrywają, że marzy im się wygrana na sześcioosobowych stołach.