AI-software jonglerer med sandsynligheder for at lære af færre data

En app udviklet af Gamalon genkender objekter efter at have set et par eksempler. Et læringsprogram genkender enklere begreber som linjer og rektangler.

Maskinlæring er ved at blive ekstremt kraftfuld, men det kræver ekstreme mængder data.

Du kan for eksempel træne en dyb-læringsalgoritme til at genkende en kat med en kat-elskers ekspertiseniveau, men du bliver nødt til at fodre den med titusindvis eller endda hundredtusindvis af billeder af kattedyr, der fanger en enorm mængde variation i størrelse, form, tekstur, belysning og orientering. Det ville være meget mere effektivt, hvis en algoritme, lidt ligesom en person, kunne udvikle en idé om, hvad der gør en kat til en kat ud fra færre eksempler.



En Boston-baseret startup ringede Gamalon har udviklet teknologi, der lader computere gøre dette i nogle situationer, og det udgiver to produkter tirsdag baseret på tilgangen.

Hvis den underliggende teknik kan anvendes til mange andre opgaver, så kan det have en stor indflydelse. Evnen til at lære af færre data kan lade robotter udforske og forstå nye miljøer meget hurtigt, eller give computere mulighed for at lære om dine præferencer uden at dele dine data.

Gamalon bruger en teknik, som den kalder Bayesiansk programsyntese til at bygge algoritmer, der er i stand til at lære af færre eksempler. Bayesiansk sandsynlighed, opkaldt efter 1700-tallets matematiker Thomas Bayes, giver en matematisk ramme til at forfine forudsigelser om verden baseret på erfaring. Gamalons system bruger probabilistisk programmering - eller kode, der beskæftiger sig med sandsynligheder snarere end specifikke variabler - til at bygge en forudsigelig model, der forklarer et bestemt datasæt. Ud fra nogle få eksempler kan et probabilistisk program for eksempel fastslå, at det er højst sandsynligt, at katte har ører, knurhår og haler. Efterhånden som yderligere eksempler gives, bliver koden bag modellen omskrevet, og sandsynligheden justeres. Dette giver en effektiv måde at lære den fremtrædende viden fra dataene.

Probabilistiske programmeringsteknikker har eksisteret i et stykke tid. I 2015 brugte et hold fra MIT og NYU for eksempel probabilistiske metoder til at få computere til at lære at genkende skrevne tegn og objekter efter kun at have set ét eksempel (se Denne AI-algoritme lærer simple opgaver så hurtigt som vi gør). Men tilgangen har mest været en akademisk kuriosum.

Der er svære beregningsmæssige udfordringer at overkomme, fordi programmet skal overveje mange forskellige mulige forklaringer, siger Brenden Sø , en forskningsstipendiat ved NYU, der ledede arbejdet i 2015.

Stadig, i teorien, siger Lake, har tilgangen betydeligt potentiale, fordi den kan automatisere aspekter af udviklingen af ​​en maskinlæringsmodel. Probabilistisk programmering vil gøre maskinlæring meget lettere for forskere og praktikere, siger Lake. Det har potentialet til automatisk at tage sig af de vanskelige [programmerings]dele.

Der er bestemt betydelige incitamenter til at udvikle nemmere at bruge og mindre datakrævende maskinlæringstilgange. Maskinlæring involverer i øjeblikket at anskaffe et stort rådatasæt og ofte derefter mærke det manuelt. Indlæringen foregår derefter inde i store datacentre, ved hjælp af mange computerprocessorer, der kører parallelt i timer eller dage. Der er kun få rigtig store virksomheder, der virkelig har råd til at gøre dette, siger Ben Vigoda, medstifter og administrerende direktør for Gamalon.

I teorien kunne Gamalons tilgang også gøre det meget nemmere for nogen at bygge og forfine en maskinlæringsmodel. At perfektionere en deep-learning-algoritme kræver en stor matematisk og maskinlæringsekspertise. Der er en sort kunst at sætte disse systemer op, siger Vigoda. Med Gamalons tilgang kunne en programmør træne en model ved at indlæse vigtige eksempler.

Vigoda viste MIT Technology Review en demo med en tegne-app, der bruger teknikken. Det ligner den, der blev udgivet sidste år af Google, som bruger dyb læring til at genkende det objekt, en person forsøger at skitsere (se Vil du forstå AI? Prøv at skitsere en and til et neuralt netværk). Men mens Googles app skal se en skitse, der matcher dem, den har set tidligere, bruger Gamalons version et probabilistisk program til at genkende et objekts nøglefunktioner. For eksempel forstår et program, at en trekant, der sidder på toppen af ​​en firkant, højst sandsynligt er et hus. Dette betyder, at selvom din skitse er meget anderledes end hvad den har set før, forudsat at den har disse funktioner, vil den gætte rigtigt.

Teknikken kunne også have betydelige kommercielle anvendelser på kort sigt. Virksomhedens første produkter bruger Bayesiansk programsyntese til at genkende begreber i tekst.

Et produkt, kaldet Gamalon Structure, kan udtrække koncepter fra rå tekst mere effektivt, end det normalt er muligt. For eksempel kan det tage en producents beskrivelse af et fjernsyn og bestemme, hvilket produkt der beskrives, mærket, produktnavnet, opløsningen, størrelsen og andre funktioner. Et andet produkt, Gamalon Match, bruges til at kategorisere produkterne og prisen i en butiks varelager. I hvert tilfælde, selv når der bruges forskellige akronymer eller forkortelser for et produkt eller en funktion, kan systemet hurtigt trænes til at genkende dem.

Vigoda mener, at evnen til at lære vil have andre praktiske fordele. En computer kan lære om en brugers interesser uden at kræve en upraktisk mængde data eller timers træning. Personlige data behøver måske heller ikke deles med store virksomheder, hvis maskinlæring kan udføres effektivt på en brugers smartphone eller bærbare computer. Og en robot eller en selvkørende bil kunne lære om en ny forhindring uden at skulle se hundredtusindvis af eksempler.

skjule