Læsetid: 3 min.

Center for Vild Analyse: Sandheden er risikabel

I stedet for at producere statistisk signifikans, burde forskningen måske bekymre sig mere om sandheden og dens uberegnelighed
11. maj 2019

I en artikel i Nature for nylig har 800 forskere kaldt til oprør mod anvendelsen af ’statistisk signifikans’ i videnskabelige artikler.

Det lyder måske mærkeligt: Hvorfor skulle det være et problem at angive, om ens undersøgelse har givet et resultat, man kan regne med? Men der er flere grunde til, at seriøse naturvidenskabsfolk ser uheldige tendenser i den måde, statistik bliver anvendt på efterhånden.

Vi kender i første omgang problematikken fra den slags artikler, der fortæller om ny forskning, der har vist, at man lever længere, hvis man drikker fire kopper kaffe om dagen. Det lyder jo fint, men så er det bare, at man ugen efter læser, at en anden undersøgelse har vist, at for megen kaffedrikning øger risikoen for hjertekarsygdomme. Begge undersøgelser kan i princippet være inden for den statistiske sikkerhed, der kræves.

 

Få de bedste historier, indblik i idedebatter og opdag ting,
du ikke vidste, du var interesseret i.
Prøv en måned gratis.

Klik her

Allerede abonnent? Log ind her

Anbefalinger

  • odd bjertnes
  • Kurt Nielsen
  • Troels Ken Pedersen
  • Bjarne Toft Sørensen
  • Eva Schwanenflügel
odd bjertnes, Kurt Nielsen, Troels Ken Pedersen, Bjarne Toft Sørensen og Eva Schwanenflügel anbefalede denne artikel

Kommentarer

Bjarne Toft Sørensen

Ligefrem at skulle "omfavne usikkerheden" som en nødvendighed for at modvirke de uheldige implikationer af den ekstreme fokusering på statistisk signifikans er for mig at se en uheldig formulering, fordi den i sig rummer muligheden for den ofte anvendte "enten eller" diskurs.

Eller den ret anvendte måde at tænke på i bestemte venstrefløjskredse, at når dem på højrefløjen har ret til at svindle, så har vi også. At dyrke usikkerheden kan i hvert fald aldrig i sig selv blive et mål.

Det kan ikke være et mål at åbne op for f.eks. muligheden for holistiske "forvirringer" og "hvad som helst kan lade sig gøre" forestillinger. I givet fald vil det undergrave alle former for institutionel troværdighed, og videnskab er nu engang også et samfundsmæssigt, socialt, institutionelt og internationalt anliggende med juridiske implikationer.

Formuleringen " ---- at videnskaben skal genopfinde sin evne til at eftersøge sandheden – snarere end at eftersøge publikationen og bevillingen" er langt mere præcis i forhold til det, som det drejer sig om.

Såkaldt ufejlbarlig viden på baggrund af statistisk signifikans vil altid være fejlbarlig, for så vidt som de valgte forudsætninger kunne havde været nogle andre. Der går altid valg forud i videnskabelige undersøgelser af kvantitativ karakter (som er forudsætningen for beregninger af statistisk signifikans), også selv om disse valg er velvalgte, der ikke kan sige sig fri for også at have kvalitativ karakter.

Det er også værd at huske på, at sproget er en forudsætning for at bedrive videnskab, som ikke kan bortelimineres.

Kim Ravn-Jensen

Indtil en mere vidende person end jeg fremsætter anden argumentation, tillader jeg mig at tro, at sammenhængen i grunden er ret enkel: Hvis du som forsker udtænker en hypotese og derefter benytter statistiske metoder til at veri- eller falsificere den, er du på videnskabelig sikker (nok) grund.
Men hvis du planløst indsamler data, og derefter benytter kunstig intelligens og/eller andre teknikker (data mining) til at beregne en a posteriori hypotese, som du kan bekræfte med statistisk signifikans og derfor skrive en artikel om, har du snydt på vægten. Det er måden, den videnskabelige verden i dag vil bedrages på - og derfor bliver det.
Ovenstående er på ingen, gentager: ingen, måde et indlæg i klimadebatten. Det absurde er her, at olieindustrien i 70'erne spåede et menneskeskabt forløb, som siden stort set er verificeret. Altså det stik modsatte af data mining for levebrødets skyld.