onsdag 5 maj 2010

Statistisk modellering

Statistik inom psykologi handlar ofta om att försöka passa en matematisk modell till sina observationer. Joseph Lee Rodgers (2010) skriver om hur fokus successivt flyttats från den klassiska hypotesprövande statistiken till statistisk modellering. Centrum i den hypotesprövande statistiken är nollhypotesen, denna utsaga om verkligheten som vi, likt ett domstolsförfarande, oftast vill bevisa vara »oskyldig bortom allt rimligt tvivel«. Det finns fem stora problem med en traditionella statistiska hypotesprövningen:
  1. Alla nollhypoteser kan avvisas bara stickprovet är tillräckligt stort. Eller för att använda sig av domstolsmetaforen: alla nollhypoteser kan befinnas oskyldiga bara vi har tillräckligt många vittnen – oavsett vad dessa vittnen säger.
  2. Traditionell hypotesprövning bygger på att en alternativhypotes ställs mot nollhypotesen. Att avvisa nollhypotesen betyder inte att vi automatiskt får stöd för alternativhypotesen.
  3. Att behålla nollhypotesen betyder inte att vi har bevisat att den är sann. Eller med andra ord, nollhypotesen kan aldrig befinnas »oskyldig bortom allt rimligt tvivel«.
  4. Hela resonemanget vid statistisk hypotesprövning är bakvänt, eftersom vi undersöker sannolikheten att erhålla givna data förutsatt att nollhypotesen är sann – inte sannolikheten att nollhypotesen är sann förutsatt givna data, vilket vore mera rimligt.
  5. Bara för att något är statistiskt signifikant behöver det inte betyda att det är relevant. Eller som Jacob Cohen uttryckte det: »The earth is round (p<0.05).«
Detta betyder dock inte att traditionell statistisk hypotesprövning är värdelös, men man måste ha det ovanstående i minnet när man tillämpar olika metoder för statistisk hypotesprövning – något som det är värre med bland såväl forskare som studenter. Den traditionella hypotesprövningen inbjuder till ett dikotomt antingen–eller-tänkande (signifikant eller icke-signifikant) som egentligen är främmande för vetenskapen. Dessutom sätts fokus på den i själva verket ointressanta nollhypotesen och det är lätt att glömma bort vad det var man egentligen hade för fråga när man väl sitter där med sitt beräknade p-värde.

Matematiska modeller är, precis som alla modeller, förenklade avbildningar av verkligheten som i vissa viktiga aspekter överensstämmer med denna. Ett modellflygplan, till exempel, kan utseendemässigt stämma in i minsta detalj med det verkliga flygplanet – men det kan inte flyga. Detsamma gäller för matematiska, statistiska modeller. De matematiska relationer som modellen uttrycker motsvarar i någon mening de verkliga fenomen som observerats, men utgör alltid mer eller mindre grova förenklingar av den verklighet som man vill beskriva.

Däremot kan man undersöka hur väl en modell passar jämfört med en annan modell. En mer komplex modell förklarar mer än en enkel modell, men en komplex modell är bara bättre än en enkel modell om den faktiskt passar verkligheten bättre, dvs. om en mer komplex modell bättre passar de observationer man gjort.

Rodgers (2010) argumenterar för att vi i stället för traditionell hypotesprövning bör tänka i termer av modeller och hur väl dessa passar våra observationer. Detta för tillbaka fokus till den fråga som i själva verket är intressant, nämligen hur väl våra hypoteser och teorier beskriver verkligheten – till skillnad från statistisk hypotesprövning där fokus alltså ligger på att behålla eller avvisa nollhypotesen.

Enkla medelvärdesjämförelser med exempelvis t-test kan beskrivas som matematiska modeller. Faktum är att såväl t-test som de olika varianterna av ANOVA kan betraktas som specialfall av linjär regression, eller om man så vill, generella linjära modeller (GLM). Även enkla begrepp såsom medelvärde och standardavvikelse kan betraktas som modeller.

Rodgers sätter ord på det jag själv tänkt en längre tid, nämligen att minska fokus på den traditionella hypotesprövningen och i stället fokusera den beskrivande statistiken, inklusive beskrivning av linjära samband (linjär regression). Att att undervisa statistik som en form av modellering av verkligheten tror jag underlättar såväl pedagogiken som förståelsen av statistiken.

Rodgers, J. L. (2010). The epistemology of mathematical and statistical modeling: A quiet methodological revolution. American Psychologist, 65(1), 1-12. doi: 10.1037/a0018326

Inga kommentarer:

Skicka en kommentar