Hvorfor poker er en stor ting for kunstig intelligens

Som den store Kenny Rogers engang sagde, skal en god gambler vide, hvornår de skal holde dem og vide, hvornår de skal foldes. På Rivers Casino i Pittsburgh i denne uge kan et computerprogram kaldet Libratus endelig bevise, at computere kan gøre dette bedre end nogen menneskelig kortspiller.

Libratus spiller tusindvis af spil heads-up eller to-spiller, no-limit Texas hold'em mod adskillige professionelle pokerspillere. Nu lidt mere end halvvejs gennem den 20-dages konkurrence, er Libratus oppe med næsten $800.000 over sine menneskelige modstandere. Så sejren, selvom den langt fra er garanteret, kan meget vel ligge i kortene.



En sejr for Libratus ville være en kæmpe præstation inden for kunstig intelligens. Poker kræver ræsonnement og intelligens, som har vist sig at være svært for maskiner at efterligne. Det er fundamentalt forskelligt fra dam, skak eller Go, fordi en modstanders hånd forbliver skjult under spillet. I spil med uperfekt information er det enormt kompliceret at finde ud af den ideelle strategi givet enhver mulig tilgang, som din modstander måtte tage. Og no-limit Texas hold'em er særligt udfordrende, fordi en modstander i det væsentlige kunne satse et hvilket som helst beløb.

Poker har været et af de sværeste spil for AI at knække, siger Andrew Ng , chefforsker ved Baidu. Der er ikke et enkelt optimalt træk, men i stedet skal en AI-spiller randomisere sine handlinger for at gøre modstandere usikker på, hvornår den bluffer.

Libratus blev skabt af Tuomas Sandholm , professor i datalogiafdelingen på CMU, og hans kandidatstuderende Noam Brown . Sandholm, en ekspert i spilteori og kunstig intelligens, som emigrerede fra Finland for sin ph.d., siger, at det er forbløffende, at mennesker har været i stand til at udspille computere så længe. Det blæser mig bare, hvor gode disse topprofessionelle er,' siger han. 'Af alle disse spil, som AI har tacklet, er [poker] det eneste, hvor AI ikke har nået overmenneskelig præstation.

AI-forskere bruger spilteori, eller matematikken i strategisk beslutningstagning, til at finde den bedste strategi givet forskellige usikkerheder, kendt som en ligevægt. Fordi mulighederne er så store, involverer dette normalt en form for tilnærmelse.

Om en flytning er god eller ej, afhænger af ting, du ikke kan observere, siger Vincent Conitzer , en professor ved Duke University, der underviser i kunstig intelligens og spilteori. Dette resulterer også i et behov for at være uforudsigelig. Hvis du aldrig bluffer, er du ikke en god spiller. Hvis du altid bluffer, er du ikke en god spiller. Spilteori fortæller dig, hvordan du kan randomisere dit spil på en måde, der i en vis forstand er optimal.

Sidste år ledede Sandholm udviklingen af ​​et tidligere pokerspilprogram, kaldet Claudico, som blev slået solidt i en kamp mod flere professionelle pokerspillere. Han forklarer, at Libratus bruger flere nye fremskridt for at opnå et så højt spilleniveau. Dette inkluderer en ny ligevægtstilnærmelsesteknik, siger Sandholm, samt flere nye metoder til at analysere mulige udfald, efterhånden som kort afsløres på senere stadier af et spil. Denne slutspilsanalyse er beregningsmæssigt meget udfordrende og udføres under hvert spil på Pittsburgh Supercomputing Center, en facilitet, der drives af CMU og University of Pittsburgh.

Fremskridt inden for maskinlæring og kunstig intelligens har set en række overmenneskelige spilprogrammer dukke op for nylig. Sidste år udviklede forskere hos DeepMind, et datterselskab af Alphabet, et program, der er i stand til at slå en af ​​verdens bedste Go-spillere. Denne præstation var så spektakulær, fordi Go er ekstremt kompleks, og fordi det er svært at måle fremskridt i spillet (se Googles AI Masters Go et årti tidligere end forventet).

Et par forskellige forskningsgrupper er fokuseret på at tackle poker. Et andet akademisk hold fra University of Alberta i Canada og Charles University og Czech Technical University i Tjekkiet har for nylig udviklet et program, kaldet DeepStack , der allerede har slået adskillige professionelle spillere i heads-up no limit Texas hold'em (se Poker Is the Latest Game to Fold Against AI). Sandholm fortæller dog, at de involverede spillere i kampen mod Libratus er langt stærkere, og spiller mange flere hænder mod maskinen, hvilket burde give større statistisk signifikans til resultatet.

De teknikker, der bruges til at bygge en smartere pokerbot, kan have mange applikationer i den virkelige verden. Spilteori er allerede blevet anvendt til forskning i jamming-angreb og cybersikkerhed, automatiseret vejledning til taxiservice og robotplanlægning, siger Sam Ganzfried , der var involveret i udviklingen af ​​Claudico og nu er assisterende professor ved Florida International University i Miami.

Men selvom Libratus sejrer i denne uge, betyder det ikke, at mennesker ikke længere fortjener en plads ved kortbordet. Multiplayer-versionen af ​​no-limit Texas hold'em kan ikke mestres ved at bruge de teknikker, som Libratus anvender.

skjule