Facebooks AI-chef: Maskiner kunne lære sund fornuft fra video

Yann LeCun siger, at den næste grænse inden for maskinsyn er software, der lærer blot ved at observere verden.9. marts 2017

Illustration af Erik Carter

For fem år siden tog forskere et pludseligt spring i nøjagtigheden af ​​software, der kan fortolke billeder. Teknologien bag, kunstige neurale netværk, understøtter det seneste boom i kunstig intelligens (se 10 Breakthrough Technologies 2013: Deep Learning). Det er grunden til, at Google og Facebook nu lader dig søge i dine billeder, og det har låst op for nye applikationer til ansigtsgenkendelse.

Yann LeCun, direktør for Facebooks AI-forskningsgruppe og professor ved New York University, hjalp med at pionere brugen af ​​neurale netværk til maskinsyn. Han siger, at der stadig er fremskridt at gøre - og at det kan føre til software med sund fornuft.



Hvor godt er maskinsyn nu?

Hvis du har et billede med et dominerende objekt i, og navnet på spillet er at angive kategorien af ​​objektet - det virker bare. Så længe du har nok data, i størrelsesordenen 1.000 objekter pr. kategori, kan vi genkende meget specifikke objekter som biler af et bestemt mærke eller planter af en bestemt art eller hunde af en bestemt race. Vi kan også genkende mere abstrakte kategorier, som om billeder er landskaber, solnedgange, bryllupper eller fødselsdagsfester. For bare fem år siden var det ikke klart, at dette problem var fuldstændigt løseligt. Men det betyder ikke, at visionen er løst.

Hvad er et vigtigt problem, der ikke er løst endnu?

Folk har i en årrække leget med ideen om at generere billedtekster eller beskrivelser til billeder og video. Umiddelbart har der været imponerende demonstrationer, [men] de er ikke så imponerende, som de ser ud. Deres ekspertisedomæne er meget begrænset til det univers, vi træner dem i. De fleste af systemerne, du viser dem billeder med andre typer objekter eller usædvanlige situationer, de aldrig har set, og de vil sige fuldstændig lort om det. De har ikke sund fornuft.

Hvad er sammenhængen mellem vision og sund fornuft?

Yann LeCun, direktør for Facebooks forskningsgruppe for kunstig intelligens.

Det afhænger af, hvem du taler med - selv inden for Facebook er der mennesker med forskellige meninger om dette. Du kunne interagere med et intelligent system udelukkende med sprog. Problemet er, at sprog er en kanal med meget lav båndbredde. Meget information, der går gennem sproget, skyldes, at mennesker har en masse baggrundsviden til at fortolke denne information.

Andre mennesker tror, ​​at den eneste måde at give nok information til et AI-system er at jorde det i visuel perception, [som] er meget, meget højere i informationsindhold end sprog. Hvis du fortæller en maskine Dette er en smartphone, Dette er en damptromle, Der er visse ting du kan flytte ved at skubbe og andre kan du ikke, måske vil maskinen lære grundlæggende viden om hvordan verden fungerer. Lidt ligesom hvordan babyer lærer.

Babyer lærer dog meget om verden uden eksplicit instruktion.

En af de ting, vi virkelig ønsker at gøre, er at få maskiner til at tilegne sig det meget store antal fakta, der repræsenterer den virkelige verdens begrænsninger, blot ved at observere det gennem video eller andre kanaler. Det er det, der i sidste ende ville give dem mulighed for at tilegne sig sund fornuft. Det er ting, som dyr og babyer lærer i de første par måneder af livet – man lærer en latterligt meget om verden bare ved at observere. Der er mange måder, hvorpå maskiner i øjeblikket let narres, fordi de har meget snævert viden om verden.

Hvilke fremskridt gøres der med at få software til at lære ved observation?

Vi er meget interesserede i ideen om, at et læringssystem skal kunne forudsige fremtiden. Du viser det et par billeder af video, og det forsøger at forudsige, hvad der skal ske næste gang. Hvis vi kan træne et system til at gøre dette, tror vi, at vi har udviklet teknikker i roden af ​​et uovervåget læringssystem. Det er der, efter min mening, der sandsynligvis vil ske en masse interessante ting. Ansøgningerne til dette er ikke nødvendigvis i vision – det er en stor del af vores indsats for at gøre fremskridt inden for AI.

(Læs mere om forskningsprojekter, der forsøger at få software til at bruge vision til at forstå verden: ' Facebooks kunstig intelligens-software får en streg mere sund fornuft,' ' Sådan planlægger Google at løse kunstig intelligens ')

skjule