Elon Musks OpenAI afslører en enklere måde for maskiner at lære

I 2013 overraskede en britisk kunstig intelligens-startup ved navn DeepMind computerforskere ved at vise software, der kunne lære at spille klassiske Atari-spil bedre end en ekspert, menneskelig spiller. DeepMind blev snart erhvervet af Google, og teknikken, der slog Atari-spillene, forstærkningslæring, er blevet et varmt emne inden for kunstig intelligens og robotteknologi. Google brugte forstærkningslæring til at skabe software, der slog en mester Go-spiller sidste år.

Nu siger OpenAI, et nonprofit-forskningsinstitut, der er medstiftet og finansieret af Elon Musk, at det har opdaget, at et lettere at bruge alternativ til forstærkende læring kan få konkurrerende resultater, når det spiller spil og udfører andre opgaver. Ved MIT Technology Review's EmTech Digital-konference i San Francisco i mandags sagde OpenAIs forskningsdirektør, Ilya Sutskever, at det kunne gøre det muligt for forskere at gøre fremskridt i maskinlæring hurtigere.

Det er konkurrencedygtigt med nutidens forstærkningsindlæringsalgoritmer på standardbenchmarks, sagde Sutskever. Det er overraskende, at noget så simpelt faktisk virker.



Maskinlæringssoftware fra OpenAI fandt ud af, hvordan man spiller klassiske Atari-spil.

Sutskever hævder, at det er vigtigt at finde nye måder at få software til at lære at gøre ting som at spille computerspil eller styre robotter for at få maskinlæringssoftware til at påtage sig mere komplekse opgaver end blot at genkende billeder eller transskribere vores tale. Hvis vi har computersystemer til at lære at tage komplicerede handlinger i verden, så tror jeg, vi ville være trygge ved at kalde dem intelligente, sagde han.

Sutskever og kolleger testede deres tilgang, kaldet evolutionsstrategier , ved at bygge software, der lærte at spille mere end 50 Atari-spil, inklusive Pong og Centipede. Fordi det er nemmere at opskalere den nye metode på tværs af flere processorer, kunne de på én time træne kunstige spillere, der kan sammenlignes med dem, der tog en dag at producere ved hjælp af et forstærkning-læringssystem udgivet af Google DeepMind sidste år. Det viste den samme evne til at lære ting som behovet for at få luft til overfladen i spillet Seaquest (midterste ramme i animationen).

OpenAIs forskningsdirektør, Ilya Sutskever

Evolutionsstrategier viste en lignende fordel, når de blev brugt til at tage en standardtest fra robotteknologi, hvor software skal finde ud af, hvordan man får en humanoid til at gå i et simuleret miljø. Det tog 10 minutter at opnå resultater, som et state-of-the-art forstærkningslæringssystem ville have brug for omkring 10 timer at opnå, siger forskerne.

Teknikken er en genstart af en årtier gammel idé om, hvordan man får læringssoftware til at prøve forskellige handlinger og identificere de mest effektive. Den er løst inspireret af, hvordan naturlig selektion får biologiske organismer til at tilpasse sig deres miljøer.

En algoritme, som alle har kendt til i lang tid, fungerer bedre, end de fleste troede, sagde Sutskever.

Han afviste at foreslå specifikke anvendelser af kunstig intelligens, der kunne få et løft fra evolutionsstrategiteknikken, og sagde, at der er behov for mere forskning i dens styrker og begrænsninger. Men Sutskever sagde, at sammenligning af metoden med forstærkningslæring antydede, at det ville være bedre til at lære at udføre mere komplekse opgaver, der kræver flere trin for at få et resultat.

Af den grund, sagde Sutskever, mener han, at evolutionsstrategier vil hjælpe OpenAI's mål om at skabe, hvad han kalder kunstig generel intelligens - software, der kan tilpasse sig mange slags komplekse scenarier.

De fleste forskere i maskinlæring taler ikke meget om generel intelligens, i stedet for at forfølge fremskridt på specifikke, ofte snævert fokuserede problemer. OpenAIs mission statement inkluderer en forpligtelse til at skabe kunstig generel intelligens. Sutskever sagde, at fremskridtstempoet inden for maskinlæring betyder, at målet er værd at tænke på nu.

[Det] virker langt væk lige nu, men [var] langt mere væk for fem år siden, sagde han. Antallet af mennesker og mængden af ​​indsats, der går med at udvikle disse algoritmer, er ekstremt høj - tingene går fremad i et meget sundt tempo.

skjule