Siri kan blive klogere ved at lære af sine fejl

Apples stemmeassistent, Siri.

Prøv selv at holde en kort samtale med Siri, Cortana eller Alexa, og du kan ende med at banke dit hoved mod den nærmeste væg i frustration.

Stemmeassistenter er ofte gode til at svare på simple forespørgsler, men de kæmper med komplicerede anmodninger eller enhver form for frem og tilbage. Dette kan dog begynde at ændre sig, efterhånden som nye maskinlæringsteknikker anvendes på udfordringen med menneske-maskine-dialog i de næste par år.



Ved en stor kunstig intelligens-konference i sidste uge, Steve Young , en professor ved University of Cambridge, som også arbejder deltid på Apples Siri-team, talte om, hvordan de seneste fremskridt begynder at forbedre dialogsystemer. Young kommenterede ikke sit arbejde hos Apple, men beskrev hans akademiske forskning.

Tidlige stemmeassistenter, inklusive Siri, brugte maskinlæring til stemmegenkendelse, men reagerede på sprog i henhold til hårdkodede regler. Dette ændrer sig i stigende grad, efterhånden som maskinlæringsteknikker anvendes til at analysere sprog (se AI's sprogproblem).

Young sagde især, at forstærkningslæring, teknikken DeepMind brugte til at bygge et program, der er i stand til at slå en af ​​verdens bedste Go-spillere, kunne hjælpe med at fremme det nyeste af det meste. Mens AlphaGo lærte ved at spille tusindvis af spil mod sig selv og modtog positiv forstærkning med hver sejr, kunne samtaleagenter variere deres svar og modtage positiv (eller negativ) feedback i form af brugernes handlinger.

Jeg tror, ​​det skal være en stor ting, sagde Young om forstærkningslæring, da jeg talte med ham efter hans tale. Det mest kraftfulde aktiv, du har, er brugeren.

Young sagde, at stemmeassistenter ikke behøvede at variere deres adfærd dramatisk, for at dette skulle have en effekt. De kan simpelthen prøve at udføre en handling på en lidt anden måde. Man kan gøre det på en meget kontrolleret måde, sagde han. Du behøver ikke gøre dumme ting.

Under sit foredrag forklarede Young, hvorfor parsing af sprog er så svært for maskiner. I modsætning til billedgenkendelse, for eksempel, er sprog kompositorisk, hvilket betyder, at de samme komponenter kan omarrangeres til at producere vidt forskellige betydninger. En anden central udfordring med sprog er, at det kun giver et ufuldstændigt indblik i, hvad en anden person tænker, så det er ofte nødvendigt at gætte på, hvad en sætning eller sætning betyder. På det praktiske plan, efterhånden som en talt forespørgsel bliver længere, kræver fortolkning af den ofte sammenlægning af viden fra forskellige domæner. For eksempel kan en kompleks forespørgsel om en restaurant kræve en forståelse af tid, sted og mad.

Alligevel mener Young, at tiden er inde til, at samtaleassistenter får det en hel del bedre. Den kommercielle efterspørgsel er der, og teknologien er der, siger han. Jeg tror, ​​at du i løbet af de næste fem år vil se virkelig betydelige fremskridt.

Young kom til Apple, efter at virksomheden købte hans startup, VocalIQ, i 2015. Apple er blevet anklaget for at være bagud i forhold til konkurrenterne i kapløbet om at udnytte teknologi baseret på fremskridt inden for machine learning og AI, men Youngs arbejde tyder på, at dette langt fra er sandt. Og virksomheden har også gjort en indsats for at åbne sin AI-forskning for at tiltrække toptalenter. Virksomheden hyrede for nylig Ruslan Salakhutdinov, en professor fra Carnegie Mellon University, til at fungere som dets første direktør for AI, og dets forskere er begyndt at præsentere og udgive artikler for første gang (se Apple får sin første direktør for AI).

Apple er selvfølgelig ikke den eneste virksomhed, der er interesseret i samtaleteknologi. Amazons Alexa - en enhed til hjemmet, der udelukkende er afhængig af stemmestyring - er blevet et hit, og andre virksomheder har skyndt sig at udvikle lignende hjemmehjælpere. Googles tilbud, kaldet Google Home, bruger særligt avancerede sproganalyseteknikker (se Googles assistent er mere ambitiøs end Siri og Alexa).

Forskere ved IBM eksperimenterer i samarbejde med et team fra University of Michigan også med samtalesystemer, der udnytter forstærkende læring. Satinder Baveja , en professor ved University of Michigan, som er involveret i det projekt, siger, at forstærkningslæring tilbyder en stærk ny måde at træne dialogsystemer på, men han tror ikke, at Siri opnår virkelig menneskelignende kommunikationsevner i sin levetid.

Disse systemer vil begynde at bruge rigere kontekst, siger han. Selvom jeg tror, ​​at de vil forblive begrænset i omfang, idet de løser specifikke opgaver som restaurantreservationer, rejser, teknisk support og så videre.

skjule