Læsetid: 8 min.

De nationale test har i årevis ført til politisk strid. Men også forskerne kæmper

Folkeskolens nationale test er centrum for en forskerfejde, hvor parterne beskylder hinanden for fejl og har vidt forskellige budskaber. Den ene side vil stoppe de nationale test, fordi der er store fejl og usikkerheder i resultaterne, mens den anden vil bevare testene, fordi de styrker de svageste elever
Når debatten om nationale test af folkeskoleelever blusser op, skyldes det så, at forskerne har vidt forskellige perspektiver på, hvad de nationale test skal bruges til?

Når debatten om nationale test af folkeskoleelever blusser op, skyldes det så, at forskerne har vidt forskellige perspektiver på, hvad de nationale test skal bruges til?

7. oktober 2019

De nationale test har kørt i snart et årti og har i endnu længere tid ført til heftig debat. I foråret blussede debatten op igen, da to forskere gik ud og anbefalede at stoppe de årlige landsdækkende test, fordi der var fejl og store usikkerheder i målingerne.

I maj gik 31 primært økonomer til modangreb i en kronik i Politiken og kaldte testforskernes konklusioner for forhastede og forkerte.

Sidst i september bragte Berlingske så historien om, at ny forskning viser, at de nationale test har styrket eleverne markant. Men nu skyder de kritiserede testforskere så tilbage: Effekten af de nationale test overdrives og bygger på fejl, lyder det.

Men hvem har ret? Information har spurgt de stridende forskere, hvad der egentlig er op og ned i diskussionen af de nationale test.

I Berlingske-artiklen fra september fortalte professor i økonomi på Aarhus Universitet Helena Skyt Nielsen, at effekten af læsetesten i dansk svarer til »to-tre måneders undervisning i løbet af to år. For matematik er effekten lidt mindre«.

Helena Skyt Nielsen har sammen med professor i statskundskab Simon Calmar Andersen undersøgt de elever, der tog de nationale test i 2010 og sammenlignet med cirka fem procent af eleverne, som ikke kunne tage testen det år på grund af it-nedbrud.

Nedbruddet gjorde, at forskerne har kunnet følge et tilfældig udvalg af elevers udvikling de følgende år. Datamaterialet består af mere end 136.000 elever i dansk og 46.000 i matematik, og efter fire år er konklusionen ifølge forskerne klar: Elever, der tog testen, klarer sig bedre end dem, der ikke tog testen.

Effekten af testene er særligt høj for børn af forældre med lav indkomst samt ikkevestlige indvandrere, forklarede Helena Skyt Nielsen i Berlingske.

Forkert sammenligning

Men Helena Skyt Nielsen og Simon Calmar Andersens beregning af effekterne rummer en klar fejlslutning, mener Svend Kreiner, der er professor emeritus i biostatistik på Københavns Universitet og har stået bag flere forskningsrapporter om de nationale test.

Når de to professorer kan sammenligne effekten af de nationale test med to-tre måneders undervisning, skyldes det ifølge Kreiner, at de bruger et amerikansk forskningsstudie fra 2012, hvor man beregner effekten af undervisning og test på forskellige klassetrin. Men det går ikke, mener Svend Kreiner.

»Der er tale om helt andre elever, et andet skolesystem, helt andre test og en helt anden undervisning end i Danmark. Så her ryger kæden af, når man sammenligner effekten af nationale test med effekten af undervisning i USA. Det ville være rigtig smart, hvis vi havde et benchmark i Danmark for, hvilken effekt et års undervisning har på eleverne, men det har vi ikke.«

Helena Skyt Nielsen mener dog ikke, det er noget problem at sammenligne med amerikanske skoler, fordi effekten af undervisningen er den samme herhjemme som i USA.

»Danske skoleelever forbedrer sig i gennemsnit omtrent lige så meget i de nationale test i læsning på et skoleår, som de amerikanske skoleelever gør i deres læsetest. Så det er irrelevant, om man kan sammenligne skolesystemerne,« siger hun. 

Svend Kreiner er ikke i tvivl om, at de nationale test har en effekt på eleverne. Især fordi elever og lærere kan tage testene frivilligt og på den måde blive bedre, men også fordi der kan forekomme teaching to the test – altså at lærerne kommer til at undervise i det, som eleverne skal testes i.

Svend Kreiner stiller dog spørgsmål ved, hvorvidt effekten er så stor, som de to professorer siger.

»Indicierne tyder på, at effekten af nationale test ikke er særlig stærk, for så ville vi vel se en markant effekt af testene ved folkeskolens afgangsprøver og i PISA-testene. Men fra 2010-2018 kan du ikke se, at de danske elever klarer sig bedre. Så den effekt, som forskerne påstår er så stærk, er nok ikke helt så stærk,« siger Svend Kreiner.

Helena Skyt Nielsen mener ikke, at man ud fra resultaterne ved folkeskolens afgangsprøver kan konkludere, at de nationale test ikke har den store effekt.

»Det er svært at drage generelle konklusioner ud fra, hvordan forskellige årgange klarer sig i folkeskolens afgangsprøve. Skolereform, lærerkonflikt, inklusion og meget andet kan også påvirke den enkelte årgangs afgangsprøver, så det er svært at konkludere noget ud fra variationen fra år til år,« siger økonomiprofessoren.

Forsvar og angreb

Folkeskolens afgangsprøver er netop udgangspunktet for den kronik, der i maj forsvarede de nationale test og angreb de kritiske testforskere. Professor i statskundskab, Simon Calmar Andersen, der har lavet forskningsprojektet om, at de nationale test styrker eleverne, er medinitiativtager til kronikken.

Her står der, at der er en stærk sammenhæng mellem, hvordan folkeskoleelever klarer sig i læsetesten i 8. klasse, og hvordan de klarer sig til eksamen året efter. Det betyder ifølge de 31 forskere bag, at de nationale test er retvisende.

Kronikken peger også på, at det er »fundamentalt forkert«, når Kreiner og forskerkollegaen Jeppe Bundsgaard skriver:

»Når læreren får at vide, at en elev scorer 50 point på en skala fra et til 100, så er usikkerheden så stor, at man med sikkerhed kun kan sige, at resultatet ligger mellem 20 og 80.«

Simon Calmar Andersen forklarer, at eleverne kan ligge lavere end 20 eller højere end 80 – det er bare mindre sandsynligt jo længere væk man kommer fra 50.

»Derfor er det misvisende, for der er størst sandsynlighed for, at eleven ligger på 50.«

– Er det en alvorlig fejl?

»Der er ingen tvivl om, at der er usikkerhed i testresultaterne, men hvis vi snakker om, hvordan man formidler det her til læserne, så synes jeg, det er misvisende,« siger statskundskabsprofessoren.

Forskerne bag den kritiske kronik antyder også, at Kreiner og Bundsgaards konklusion om, at der er fejl i testenes beregning af elevernes niveau kan skyldes, at der er noget galt med de to forskeres beregninger.

– Hvad er der er galt med deres beregninger?

»Der kan være et problem i, at Kreiner og Bundsgaard sammenligner to datasæt, fra 2010 og fra 2017, der er genereret på forskellige måder. Det kan gøre, at det kan se ud, som om der er fejl i beregningerne af opgavernes sværhedsgrad. Vi kan ikke se i deres forskningsrapport, om de har taget højde for den problemstilling,« forklarer Simon Calmar Andersen.

Svend Kreiner bemærker, at data fra de to år er indsamlet på præcist samme måde. Han ser derfor mest økonomernes kritik som retoriske spidsfindigheder, men konsekvensen af deres kronik er alvorlig, mener Svend Kreiner.

»De 31 forsker beskylder os for nogle ting, som nu fører til, at Berlingske i en anden artikel kalder vores forskning tvivlsom. Det egentlige problem er, at vi har gjort opmærksom på, at når der er fejl og usikkerhed i de nationale testresultater, så kan der være god grund til at se på den forskning, der er baseret på nationale test. Det gør vi jo altid i forskningen, for det hører med til den videnskabelig redelighed, og det er ikke udtryk for dårlig forskning, men de her økonomer og statskundskabsfolk er røget helt op i det røde felt over det,« siger Svend Kreiner.

Den centrale del af de 31 forskeres kronik handler også om, at Kreiner og Bundsgaard har opfordret til, »at resultater fra forskning og evaluering, der tager udgangspunkt i nationale test, tages op til fornyet undersøgelse«.

– Hvorfor er det forkert af de to forskere at gøre opmærksom på det?

»Det, vi reagerer på, er, at de siger, at al forskning skal tages op til revision uden i øvrigt at fortælle, hvori problemet skulle bestå. Dermed siger de jo, at folk kan ikke stole på vores forskning, fordi deres rapport har invalideret alting. Men vi bruger normalt ikke de usikkerhedsestimater, der er problemer med. Det er rigtigt, at forskning, som bruger dem, vil skulle tages op til fornyet undersøgelse, men jeg kender bare ikke til nogen studier, der bruger de estimater,« siger Simon Calmar Andersen.

Svend Kreiner nægter dog at have skrevet eller sagt, at al forskning i nationale test skal tages op til fornyet undersøgelse.

– Hvorfor bruger I ikke usikkerhedsestimaterne i nationale test?

»Vi bruger ikke usikkerhedsestimaterne for de enkelte elever, men vi tager højde for usikkerheden ved at se på forskellene mellem eleverne i de grupper, vi sammenligner,« siger Simon Calmar Andersen.

Svend Kreiner mener heller ikke, at det er et problem i Skyt og Calmars forskningsprojekt, at de ikke har indregnet usikkerheden ved de nationale test, fordi datagrundlaget er så stort. Problemet er ifølge Kreiner deres konklusion om, at de nationale test skulle styrke eleverne markant. 

»Med testresultater fra mere end 46.000 elever i matematiktesten, så burde de kunne finde en statistisk signifikans for selv små faglige fremskridt blandt eleverne. Når de ikke kan finde det, må det være, fordi testene har en ekstrem lille effekt,« siger Svend Kreiner.

Kampplads også i forskning

Ligesom de nationale test er en politisk kampplads, så er testene altså også genstand for en forskningsfejde. Når debatten mellem forskerne blusser op, kan det ifølge Christian Christrup Kjeldsen, der er leder af Nationalt Center for Skoleforskning på Aarhus Universitet, skyldes, at forskerne har vidt forskellige perspektiver på, hvad de nationale test skal bruges til.

»Skoleforskerne er optaget af, at testene fungerer korrekt og derved er relevant og valid information til lærere, forældre og elever ude i praksis. Mens økonomerne i det her tilfælde bruger de nationale test til at sige noget om, hvor gode de er, som redskab til at øge skolens og elevernes præstationer i selv samme test. Det er to vidt forskellige ting, så de kan såmænd begge have ret: at testene måler usikkert og forkert, men at der er en effekt af at tage dem uagtet dette,« siger Christian Christrup Kjeldsen.

At forskerne er optaget af helt forskellige ting bliver dog i den politiske samtale ofte tolket, som om testene skal stoppes eller bibeholdes, mener Christian Christrup Kjeldsen.

»Når Kreiner og Bundsgaard går ud i foråret og siger, at testene måler forkert og usikkert, så er det nye, at de måler forkert. Alle vidste, at de målte med stor usikkerhed, og når økonomerne så siger, at de måler sikkert nok, så kommer der en masse politik ind i forståelsen af denne uenighed, men forskere skal med jævne mellemrum være uenige, for det handler jo om, at vi derfor finder ud af, at det vi troede var rigtigt, kan være helt forkert,« siger Christian Kjeldsen, der også selv forsker i test.

Han vil forsøge at reproducere Skyt og Calmars forskning, fordi han finder deres brug af et ellers uheldigt nedbrud i systemet i 2010 interessant:

»De beskriver for eksempel kort i en fodnote i den endelige udgave af artiklen, at variationen mellem skolerne gør, at effekten af at tage testen næsten halveres i forhold til deres overordnede resultat i læsning. Det vil sige, at effekten af testen i realiteten kun er meget lille, og det er da spændende, hvad forskellen mellem skolerne gør.«

Til januar kommer evalueringen af de nationale test, og i følgegruppen sidder flere af de stridende forskere. Undervisningsminister Pernille Rosenkrantz-Theil har dog allerede meldt ud, at hun ønsker at lave et nyt testsystem inden næste sommer.

Den ny kritik af de nationale test i folkeskolen går blandt andet på, at undervisningen ikke bliver bedst mulig, når den målrettes testene.
Læs også
Når Pernille Rosenkrantz-Theil lover, at et nyt testsystem vil stå klar i næste skoleår, kunne man tænke, at skolerne nok klarer den et års tid endnu. Problemet er, at det formentlig er urealistisk.
Læs også
Bliv opdateret med nyt om disse emner på mail

Vores abonnenter kalder os kritisk, seriøs og troværdig.
Få ubegrænset adgang med et digitalt abonnement.
Prøv en måned gratis.

Prøv nu

Er du abonnent? Log ind her

Anbefalinger

  • Eva Schwanenflügel
Eva Schwanenflügel anbefalede denne artikel

Kommentarer

Eva Schwanenflügel

"Skoleforskerne er optaget af, at testene fungerer korrekt og derved er relevant og valid information til lærere, forældre og elever ude i praksis. Mens økonomerne i det her tilfælde bruger de nationale test til at sige noget om, hvor gode de er, som redskab til at øge skolens og elevernes præstationer i selv samme test."

Det økonomerne egentlig konkluderer er, at når man øver sig i test, bliver man bedre til test.
Og det har intet at gøre med, om eleverne virkelig kan bruge undervisningen til noget.
Måske skulle økonomer i det hele taget blande sig udenom.

Anders Reinholdt, Jette Steensen, Hans Houmøller, Anders Lund og Ole Henriksen anbefalede denne kommentar

Jeg har en idé: Hvorfor smider vi ikke alle lærerne ud fra Tovshøjskolen i Brabrand - og sætter de testliderlige økonomer bag katederet. Så får denne gruppe emsige DJØFere ti år til at bevise, at de faktisk ved, hvad de taler om, og at deres ideer har bundtræk.

Det er en vist en win-win-win-situation. Lærerne kan slappe af. Økonomerne kan bevise deres værd. ...Og danskerne slipper for at høre fra dem i ti år.

Viggo Okholm, Jette Steensen, Hans Houmøller, Anina Weber og Eva Schwanenflügel anbefalede denne kommentar

Leo - der er stadigvis skoler, som ikke hænger fast i testvanviddet. (Bl.a. den friskole, mine børn gik i). Sjovt nok klarer ungerne sig allerhelvedes meget bedre til afgangseksamen end langt hovedparten af deres jævnaldrende.

Eva Schwanenflügel og Hans Houmøller anbefalede denne kommentar

Hvis ikke vi fortsætter med de nationale tests vil skolerne lave deres egne. Måske inden for kommunerne. Eller andre former for fællesskaber. Og med det frie skole valg vil de skoler der ikke tester falde bagud.

Karakter-, test- og eksamens-fobien, som har bredt sig de sidste årtier er curling-generationens misforståede værn for børnene mod virkelighedens ubarmhjertige kolde vinde.

Hvorfor fjerne feedback for læring. Hvorfor bilde børnene ind, vi ikke vurderes i vores arbejdsindsats efter skolen slukker ?

En bjørnetjeneste i gammel forstand. The easy way out. At springe over, hvor gærdet er væk.

"Sikkert, men så er den tæt på borgerne, som ved, hvor de kan klage - og byrådspolitikerne er på valg "

Men det vil ikke lave om på testen. Hvis man vil klage over resultatet af testen skal man klage over indhold, performance og struktur i undervisning. Ikke testen.

Hvorfor har vi en skole? for samfundets vækst at gøre eller for at skatteyderne skal have gevinst?
I min optik er læring en livslang proces mod at blive et ordentligt menneske med de forskellige evner og intelligens man har. Alle sociale lag og statusser bør respekteres og anerkendes ud fra mennesket og ikke dette menneskes status og magt! NB: Jeg anerkender at ideen om det gode menneske er subjektiv.

"for samfundets vækst at gøre eller for at skatteyderne skal have gevinst?"

Begge dele. Skatteyderne skal være pensionister eller på sygehud på et eller andet tidspunkt. Der skal være nogen til at betale for det.