indregard.no
Politikk og samfunn

Å forvirre med tall

Det er snart kommunevalg, og da er det én type sak vi kan være trygge på å høre mye av i tiden fremover: «velferdstjeneste X er bedre i [rødgrønne|høyrestyrte] kommuner». Det som impliseres er at det er en sammenheng mellom hvem som styrer kommunen og nivået på velferden.

Det er bare et lite problem med denne formen for slutninger basert på råstatistikk: det er fullstendig, lallende bullshit.

Årsaken finner vi på side tre i alle innføringsbøker om statistikk, i det obligatoriske, innledende kapittelet om sannsynlighetsteori: korrelasjon – det at den målte variabelen A endrer seg i takt med B  -- betyr ikke i seg selv at B medfører A eller at A medfører B. Når vi observerer en slik korrelasjon, f.eks. mellom A: arbeidsmiljølovbrudd på sykehjem og B: blått styre, er det alltid tre muligheter.1

Enten kan 1) det blå styret ha forårsaket arbeidsmiljølovbrudd på sykehjem, eller så kan 2) arbeidsmiljølov-brytende sykehjem ha forårsaket blått styre, eller 3) noe annet kan ha medført både arbeidsmiljølov-brytende sykehjem og blått styre. Den siste varianten kalles en konfunderende variabel. Når man ser på sammenheng mellom hvem som styrer og resultater, er konfunderende variabler nesten alltid årsaken. I akkurat dette eksemplet, er det vel bedre å peke på variant 1.

Et annet eksempel: hvis vi ser på sammenhengen mellom gjennomsnittlig levealder og hvor mange som stemmer Høyre i kommunen, vil du få en ganske sterk sammenheng. Det skyldes ikke at Høyre er helsefremmende, men at folk som er rike lever lengre og stemmer Høyre. Inntekten er den konfunderende variabelen.

Telemarksavisa drar det ned på det forhåpentligvis lavest mulige nivået allerede før valgkampen begynner. De kan rapportere at sannsynligheten for å droppe ut av skolen er større i rødgrønne fylker. Og Frp kaster seg på, og hevder at dette viser at venstresida bare flotter seg med ord og gjør lite for å begrense dropout.

Hvis det er noe vi vet om dropout i videregående skole, så er det at det er en super-skarp korrelasjon mellom foreldrenes utdanningsbakgrunn og tilbøyeligheten for dropout. Og hvis det er noe vi vet om mønstre i valg, så er det at det er en super-skarp korrelasjon mellom hva folk stemmer på og hvilken utdanningsbakgrunn de har. Følgelig er det nøyaktig som forventet at fylker der folk har lavere utdanningsbakgrunn a) stemmer rødgrønt og b) har høy dropout. Ser vi på hvilke fylker det dreier seg om, er det også akkurat det vi ser: rødgrønne Nordland, Troms, Finnmark og Hedmark trekker ned, og de fire fylkene  har det desidert dårligste utdanningsnivået i befolkningen. Det blå Østfold kommer deretter. Det aller beste fylket på dropout er forøvrig rødgrønne Sogn og Fjordane.

Om metoden er tvilsom for kommuner, er den helt absurd for fylkeskommuner. Det er bare 19 av dem, og de er ekstremt lite homogene når det gjelder befolkningssammensetning. Dersom mediene insisterer på å fortsette å lage slike tøvete saker, er det to endringer som gjøres: For det første må man sammenligne grupper av kommuner som er nokså like over en del variabler: befolkningsmengde, befolkningens alder og inntekt kan være et bra sted å begynne. For det andre bør man gå over til å se på variabler som endrer seg og kommuner som har skiftet styre, i stedet for å sammenligne gjennomsnitt rått.

Takk til Bård Lahn for tipset.

Oppdatert: SSB valgte å publisere grupperingen jeg etterspør i dag. Tankeoverføring, eller har indregard.no makt til å påvirke SSBs publiseringsbeslutning? Tilfeldigheter utelukker vi selvsagt som forklaring, i tråd med gode journalistiske beslutninger.


  1. Altså: forutsatt at korrelasjonen er signifikant, i andre tilfeller antar vi at det skyldes tilfeldigheter.

statistikk skole dropout frafall