5 grunde til, at CU-valgmodellen er forkert

Byggegrunde kampagne | Køb en byggegrund i Sønderborg-området

To politiske økonomer ved University of Colorado offentliggjorde for nylig en analyse af 2012-præsidentvalget, som forudsagde, at Romney ville vinde. Modellen kiggede på mange økonomiske variabler og hævdede, at denne model ville have "korrekt forudsagt alle valg siden 1980."

Investmentmatome-valgmodellen blev derimod skabt af analytikere, der studerede økonometrisk analyse i Princeton og Stanford og forudsiger, at Obama let vil vinde valget.

Begge modeller hævder at være upartiske præsentationer af statistiske forhold uden personlige meninger, men kommer til modsatte konklusioner. Hvordan kan det være? Simpelthen er University of Coloado's model dybt fejlfri. Her er hvorfor:

5 grunde University of Colorado Valgmodellen er Dead Wrong

1. CU-modellen snyder

Hvis jeg fortalte dig, hvilken tid jeg kom til arbejde hver dag i sidste uge, ville du være i stand til at forudsige, hvilken tid jeg kom til arbejde hver dag i sidste uge? Du ville? Store! Du er så god til statistisk forudsigelsesmodellering som University of Colorado.

At hævde at have oprettet en model, der ville have "korrekt forudsagt alle valg siden 1980" er fuldstændig nonsens, da modellen blev oprettet ved hjælp af data fra alle valg siden 1980, de meget data, som det hævder at forudsige. I statistikken kalder vi denne data mining. Den korrekte procedure ville have været at bruge en delmængde af dataene til at oprette modellen (måske valget i 1980 og 1984) og derefter teste modellen på en "out of sample backtest" af data, der ikke var blevet brugt til oprettelsen af modellen (valget fra 1988 til og med 2008). Først da får du påstå, at din model er god til at lave forudsigelser.

2. CU-modellen afhænger af manglende forudsætninger.

Arbejdsløsheden påvirker sandsynligheden for, at de demokratiske befuldmægtigede bliver genvalgt, men ikke republikanere? Republikanernes resultater er forbundet med indkomst per indbygger, mens demokratier ikke er? Virkelig? I statistikker skal du begynde med antagelser, der giver mening og derefter teste dem, ikke starte med data og derefter tillade så mange vanvittige antagelser, som du har brug for at oprette en model, der "korrekt forudsigede" alle dine data.

3. CU-modellen indeholder variabler, det bør ikke …

Tilbage til mit eksempel på arbejde. Hvis jeg gav dig yderligere oplysninger om, hvilken farve skjorte jeg bar hver dag og hvad jeg spiste til morgenmad, ville du være bedre i stand til at forudsige, hvor lang tid jeg kom til arbejde? Sandsynligvis ikke, men din model ved det ikke. Hvad der sandsynligvis vil ske er, at din model vil begynde at fortælle dig vanvittige ting (jeg opdager fem minutter tidligere på dage, jeg spiser æg til morgenmad, men tyve minutter senere, hvis jeg bærer en blå skjorte) for at passe alle dine ekstra variable til dataene.

University of Colorado model gør dette, men i en endnu mere ekstrem grad. Det bruger mindst SIX forklarende variabler, selvom det kun har otte valgdatapunkter. Dette er alt for mange fra et statistisk perspektiv og vil sandsynligvis føre til "falske korrelationer" (dvs. blå skjorter gør dig forsinket til arbejde eller ledighed kun påvirker demokrater).

4 … og ignorerer vigtige variabler (som kandidaten!)

En model baseret kun på økonomiske indikatorer kan kun være omfattende, hvis økonomiske indikatorer er de eneste faktorer, der driver valgresultater. Det er de ikke. Der er tegn på, at kandidatligheden, kampagnens udgifter og endog vejret alle spiller roller i valgresultater. Tag et ekstremt eksempel: Hvad hvis republikanerne besluttede at køre en hest i stedet for en person som deres kandidat? University of Colorado-modellen ville sige, at hesten ville blive valgt på grund af økonomiske forhold, da deres model ikke overvejer kandidaten overhovedet. Enhver god valgmodel skal tage hensyn til den menneskelige vælgers vilje til faktisk at stemme for en bestemt kandidat.

5. CU-modelresultaterne er næsten umulige

Selv hvis vi ignorerer alle metodologiproblemerne i CU-modellen, er resultaterne vanskelige at acceptere, da de er statistisk næsten umulige. CU-modellen hævder for eksempel, at Romney vil vinde Pennsylvania. Men når sandsynligvis vælgere i Pennsylvania blev pollet, sidede de sammen med Obama 51-42, 49-40, 47-42, 53-42, 49-43 osv. Faktisk forudsagde ikke en enkelt afstemning af sandsynlige vælgere i Pennsylvania hele året en Romney-sejr. Obama leder med næsten 10 point, en næsten umulig føre til at overvinde, idet mere end 95% af de historiske meningsmålinger har været korrekte inden for 7 point. Selv hvis vi giver CU-modellen Pennsylvania, er der stadig Ohio … Virginia … Wisconsin …

Kort sagt er CU-modellen fuldstændig sløret. Dette er virkelig ikke overraskende i betragtning af, hvordan fattige politiske økonomer er ved at lave prognoser, ifølge New York Times. Men tag ikke vores ord for det. Nedenfor er et resumé af, hvad andre modeller og markeder tænker på Romneys chancer:

Modeller og markeder	Baseret på	Romney	Obama	Vinder?
Princeton University	Afstemninger	12%	88%	Obama
Investmentmatome	Afstemninger	20.2%	78.4%	Obama
New York Times	Afstemninger	28.7%	71.3%	Obama
Washington Post	Økonomiske indikatorer	41.6%	58.4%	Obama
American University	Økonomiske indikatorer	Obama stærkt begunstiget	Obama
Betfair	Væddemål marked	37.0%	62.1%	Obama
Intrade	Væddemål marked	44.0%	55.2%	Obama

Estimater pr. 28. august 2012

Joanna Pratt er VP for Financial Markets på Investmentmatome Investing, en finansiel kompetence hjemmeside, der hjælper investorer med at vælge bedre fonde for deres 401 (k) planer, finde et bedre online-mæglervirksomhed tilbyder optioner konti, og træffe smartere investeringsbeslutninger samlet set.