Poker er det seneste spil til at folde mod kunstig intelligens

I en skelsættende præstation for kunstig intelligens har en pokerbot udviklet af forskere i Canada og Tjekkiet besejret adskillige professionelle spillere i en-til-en-spil med no-limit Texas hold'em poker.

Måske mest interessant er det, at akademikerne bag værket siger, at deres program overvandt sine menneskelige modstandere ved at bruge en tilnærmelsesmetode, som de sammenligner med mavefornemmelse.

Hvis det er korrekt, er dette faktisk et betydeligt fremskridt inden for game-playing AI, siger Michael Wellman , en professor ved University of Michigan, der har specialiseret sig i spilteori og kunstig intelligens. For det første opnår det en stor milepæl (sejr pokerprofessionelle) i et spil af fremtrædende interesse. For det andet samler det flere nye ideer, som tilsammen understøtter en spændende tilgang til spil med ufuldkommen information.



Senere på ugen vil en turnering på et Pittsburgh kasino se flere pokerspillere i verdensklasse spille den samme version af poker mod et program udviklet på CMU. Tuomas Sandholm , en professor i datalogi ved CMU, som leder indsatsen, siger, at de involverede menneskelige spillere er betydeligt stærkere end dem, der er testet af Alberta-forskerne, og 120.000 hænder vil blive spillet over 20 dage, hvilket giver større statistisk signifikans til resultaterne. Turneringen kunne bekræfte, at AI faktisk har mestret et spil, der længe har virket alt for komplekst og subtilt til computere.

DeepStack, pokersoftwaren, der allerede har slået nogle professionelle spillere, blev udviklet af et hold ledet af Michael Bowling , professor i datalogi ved University of Alberta, som omfattede forskere fra Charles University og Czech Technical University i Tjekkiet. I en research papir lagt ud på nettet men endnu ikke peer reviewed, siger forskerne, at DeepStack spillede næsten 45.000 pokerhænder mod adskillige spillere, og slog dem nemt.

Poker er mere komplekst end mange andre spil, der har stillet mennesker op imod AI. Og sigende nok indeholder det niveauer af usikkerhed, såsom hvornår en modstander bluffer, som findes i mange virkelige situationer, som AI endnu ikke har mestret. Pokerspillere kan ikke se deres modstanderes hænder, hvilket betyder, at i modsætning til dam, skak eller Go, er ikke al informationen i spillet tilgængelig for dem. Forskere fra DeepMind, et U.K.-baseret datterselskab af Alphabet, skabte overskrifter sidste år efter at have skabt et program, der er i stand til at slå en af ​​verdens bedste Go-spillere (se Googles AI Masters the Game of Go et årti tidligere end forventet).

Heads-up no-limit Texas hold'em er en version af spillet, der spilles mellem to personer, som kan satse lige så mange af jetonerne, som de har. Denne variant viste sig i lang tid at være for svær til, at maskiner kunne spille professionelt. Der er 10160 (10 efterfulgt af 160 nuller) mulige spillebaner for hver hånd i heads-up no-limit Texas hold'em.

DeepStack lærte at spille poker ved at spille hænder mod sig selv. Efter hvert spil genbesøger og forfiner den sin strategi, hvilket resulterer i en mere optimeret tilgang. På grund af kompleksiteten af ​​no-limit poker involverer denne tilgang normalt at øve med en mere begrænset version af spillet. DeepStack-teamet klarede denne kompleksitet ved at anvende en hurtig tilnærmelsesteknik, som de forfinede ved at føre tidligere pokersituationer ind i en deep-learning-algoritme.

Det, der virkelig er nyt for et så komplekst spil, er at være i stand til effektivt at beregne den handling, der skal udføres i hver situation, efterhånden som den stødes på, i stedet for at skulle arbejde gennem en forenklet form af hele træet af spilmuligheder offline, siger Wellman fra University of Michigan.

Forskerne sammenligner DeepStacks tilnærmelsesteknik med en menneskelig spillers instinkt for, når en modstander bluffer eller holder en vindende hånd, selvom maskinen skal basere sin vurdering på modstanderens væddemålsmønstre snarere end hans eller hendes kropssprog. Dette skøn kan opfattes som DeepStacks intuition, skriver de. En mavefornemmelse af værdien af ​​at holde på alle mulige private kort i enhver mulig pokersituation.

Det er muligt at måle en pokerspillers præstation ved at se på det vundne beløb, i forhold til beløbet, der er satset ved hans eller hendes bord, over mange spil. DeepStack havde en sejrsrate omkring ni gange bedre end hvad der ville blive betragtet som godt for en professionel spiller.

I 2015 løste Bowling og kolleger ved University of Alberta den mere begrænsede version af heats up hold'em ved at udvikle en pokerbot i stand til at spille spillet perfekt.

Pokerrobotten involveret i Pittsburgh-turneringen, kaldet Libratus, blev udviklet af Sandholm og en af ​​hans kandidatstuderende, Noam Brown . Parret har endnu ikke afsløret detaljer om, hvordan deres program griber spillet an, men Brown siger, at det i det væsentlige forsøger at 'løse' spillet - eller finde ud af alle mulige scenarier - tidligere i løbet af spillet, end det tidligere var muligt. Libratus kører på ekstremt kraftfuld hardware på Pittsburgh Supercomputing Center , en facilitet, der drives i fællesskab af CMU og University of Pittsburgh.

skjule