Forudsigelsesmodeller Gone Wild: Hvorfor valgprognoser og meningsmålinger var så forkerte

Hvis du tunede ind på Vice News tirsdag eftermiddag eller tjekkede valgdækningen på Slate, ville du have troet, at Hillary Clinton var alt undtagen sikre at blive USA's første kvindelige præsident.

I en første omgang medbragte begge forretninger realtidsdata, der strømmede ind fra en startup kaldet VoteCastr, som regner sig selv for at give Amerika et hidtil uset glimt af spillet, som det udfolder sig . VoteCastrs sidste forudsigelser, lavet omkring kl. Tirsdag aften havde Clinton op i Pennsylvania, Ohio, Florida, Wisconsin og Iowa - alt dette endte Donald Trump med at vinde på vej til at blive præsident.

For at være sikker var VoteCastr ikke alene. Mange valgprognoser baseret på meningsmålinger, demografi og historiske data var på samme måde vidt omkring. Det New York Times ' Upshot-model, for eksempel, gav Clinton rundt 85 procents chance for at vinde , mens det roste datadrevne prognosesite FiveThirtyEight gav hende en chance på 72 procent .



Dette forklares i det mindste delvist af, at de meningsmålinger, prognoserne var baseret på, enten var langt væk eller i det mindste var udnytte deres fejlmargin bedst muligt (selvom hvis Clinton ender med at vinde den populære afstemning, som det ser ud til, at hun kunne, kan man argumentere for, at meningsmålingerne fik det rigtige – de valgte bare den forkerte vinder). En undervurdering af, hvor magtfulde hvide arbejderklassevælgere er i dette land, kan også have bidraget, ligesom folk simpelthen kunne ikke give ærlige svar når de blev spurgt, hvem de støttede. Dette er noget, som Clinton-kampagnen, som regnede med, at hendes Midwest-firewall af stater alle var sikre, tog fejl. Datateamet, der arbejder med Trump-kampagnen gav ham en en ud af fem chance for at vinde .

Men VoteCastrs fiasko - for ikke at sige noget om dens vakkelvorne tekniske ydeevne hele valgdagen – er unik på grund af de påstande, den fremsatte. Virksomheden, som har dataguruer om personale, der arbejdede på George W. Bush og Obama-kampagnerne, gav indtryk af, at de ved at være meget opmærksomme på tidlige afstemningsresultater, vælgernes identitet og exit polling på en eller anden måde kunne opnå en reel- tid se på valget, der ikke var tilgængeligt før. Det var meningen, at det skulle være den nye forkant inden for datadrevne valgprodukter.

I stedet viste det sig at være et mangelfuldt, ufuldstændigt middel til valgsporing - meget ligesom de andre produkter derude, som det viser sig.

(Læs mere: Politisk , FiveThirtyEight , Det New York Times , Bloomberg )

skjule