Spilletiden er forbi

Tidligt sidste år opnåede en computer ydeevne i verdensklasse i spillet Go - år før de fleste troede, at sådan en bedrift ville være mulig.

Det er imponerende, men vores ambitioner bør sættes højere. Datalogi kunne være med til at give det, verden kritisk har brug for: værktøjer, der gør det muligt for os alle at nå ud over, hvad vi troede, vi var i stand til. Forstærkningslæring – en integreret del af Go-succesen – kan fremskynde den proces (se 10 Gennembrudsteknologier: Forstærkningslæring).

Forstærkende læring er en måde at få en computer til at lære gennem erfaring for at træffe en række beslutninger, der giver positive resultater – selv uden nogen forudgående viden om, hvordan dens handlinger vil påvirke dets umiddelbare miljø. En software-baseret vejleder, for eksempel, ville ændre sine aktiviteter som svar på, hvordan eleverne præsterer på test efter at have brugt det.



Emma Brunskill

Hvis vi håber at skabe kunstige undervisningsagenter ved hjælp af forstærkende læring, har vi brug for algoritmer, der er datasmarte. Vi kan indsamle data fra online uddannelsessystemer og bruge dem til at hjælpe agenten med at vurdere effektiviteten af ​​forskellige undervisningstilgange. Når en elev logger ind, skal systemet så give ham et problem at løse? Eller ville det være bedre at starte med en forklarende video? Dataene kan hjælpe den med at bestemme.

Men i nogle tilfælde er der ikke nok data, eller ikke den rigtige slags data, hvilket gør det udfordrende at udvikle systemer, der træffer gode beslutninger. Det ville være rart, hvis vi kunne skabe et system, der ikke behøvede så meget data i første omgang. Og det er præcis, hvad min gruppe arbejder på – vi udvikler forstærkningsindlæringsalgoritmer og statistiske teknikker, der giver computere mulighed for at udvikle gode forslag, mens de bruger mindre data. Vi har stadig meget arbejde at gøre, men vi skærper kløften mellem teori og praksis.

I sidste ende skal vi ikke overlade det hele til computerne. Såkaldt human-in-the-loop-forstærkningslæring kan accelerere processen, hvilket giver algoritmer mulighed for at ræsonnere om deres egen begrænsede ydeevne og nå ud til mennesker for at få hjælp, når de for eksempel har brug for at udvide sættet af mulige beslutninger. Min gruppe og vores samarbejdspartnere på University of Washington tester nu algoritmer til et vejledningssystem, der kan fortælle, om dets nuværende pensum ikke gør det muligt for alle studerende at lære godt, og beder derefter folk om at tilføje nye hints til systemet. Sådanne menneske-computer-samarbejder kan hjælpe eleverne med at lære ved hjælp af tilgange, vi endnu ikke kan forestille os. Denne vision om forstærkende læring har kunstigt intelligente agenter, der omdefinerer, hvordan enestående menneskelig præstation ser ud - og gør det muligt for os alle at opnå det.

Emma Brunskill er assisterende professor i datalogi ved Stanford University .

skjule