Læsetid: 7 min.

Kan en computer læse Shakespeare?

Advarselslamperne blinker hos mange humanistiske forskere, når store datamængder og digitale værktøjer bliver nævnt. Metoderne er dog kommet for at blive, mener tre forskere. Den ene bruger selv computere til at ’fjernlæse’ Shakespeare, men han er klar over, at det hverken kan eller skal erstatte humanioras klassiske dyder
Jakob Ladegaard er humanist, men bruger tunge statistiske metoder i sin forskning. Det har medført ophedede diskussioner blandt ham og hans fagfæller.

Jakob Ladegaard er humanist, men bruger tunge statistiske metoder i sin forskning. Det har medført ophedede diskussioner blandt ham og hans fagfæller.

Tor Birk Trads

19. januar 2019

Jakob Ladegaard peger på et netværksdiagram med et væld af røde linjer, der alle udgår fra små prikker. Han forklarer, at han egentlig ikke ved, hvorfor de litterære karakterer, som hver prik repræsenterer, er havnet der, hvor de er. Det er noget, en computer har regnet ud.

»Den her principal component-analyse prøver at se sammenhængene mellem de forskellige vektorer …,« begynder han og fører fingeren fra prik til prik i diagrammet. Senere siger han også noget om log likelihood score og centralitet.

Det er ikke ord, man er vant til at høre i humaniora, i hvert fald ikke blandt litteraturhistorikere. Men Jakob Ladegaard er litteraturhistoriker, og de digitale metoder, han bruger, er en del af hans litteraturhistoriske forskning.

Hans projekt, der er støttet af Det Frie Forskningsråd, undersøger – med afsæt i stjerneøkonomen Thomas Pikettys teorier om ulighed – hvordan begrebet om arv har udviklet sig i løbet af litteraturhistorien. Sammen med sin forskningsgruppe er Ladegaard startet i 1600-tallet, hvor han blandt andet belyser fremstillingen af bastardfiguren i engelske dramaer; en karakter, der for eksempel kan have en adelig far og en ludfattig mor. Det er de karakterer, som prikkerne i netværksdiagrammet dækker over.

Men ambitionerne rækker langt videre end det: Ladegaards forskningsgruppe ønsker i sidste ende at lave et litteraturhistorisk argument, der strækker sig hele vejen fra Shakespeares dramaer til det 21. århundredes romaner.

Og det er svært at gøre uden at bruge en computer, der kan analysere langt flere værker end Jakob Ladegaard og hans kolleger har tid til at læse. 

Skepsis og tøven

Ladegaards projekt er et eksempel på, at store datastrømme og digitale metoder langsomt er ved at snige sig ind i den humanistiske forskning og ikke bare i lingvistikken, der har en lang tradition for programmering. I litteraturvidenskaben er forskere eksempelvis begyndt at bruge metoder som fjernlæsning, hvor en computer dissekerer en tekst ud fra nogle kriterier.

Det står i kontrast til fagets grundpiller: Nærlæsningen. Fortolkningen. Og derfor er det også med en vis tøven, at den humanistiske forskning kaster sig over de nye metodiske muligheder.

Ladegaard er selv stødt på den skepsis flere gange, blandt andet fordi de første forskningsprojekter, der brugte metoder som fjernlæsning, ikke altid var gode nok til at tage højde for faldgruberne.

»Jeg har flere gange hørt og læst folk, der mener, at de her metoder ikke har leveret resultater, der står mål med alle de penge, der er blevet smidt efter dem. At det er en dille, som suger en masse forskningsmidler til sig – og dermed væk fra den mere klassiske forskning,« siger han.

»Grunden til, at folk reagerer sådan er ikke kun af faglige årsager, for det er mit indtryk, at en del af dem, der er kritiske over for de her metoder, ikke kender ret meget til dem. Deres modvilje handler også om fordelingen af prestige og penge på universiteterne, tror jeg.«

Fra fysiker til pseudohumanist

Det kan ikke udelukkes, at nogle af skeptikerne rynkede på brynene, da Birte Christensen-Dalsgaard for tre år siden blev sat i spidsen af DigHumLab, en slags infrastruktur for forskere, der ønsker at finde og bruge digitale værktøjer, med alt hvad der følger af teknisk og videnskabeligt bøvl. Fra copyright og persondatalov til metodefælder.

Christensen-Dalsgaard er ikke ligefrem udklækket på et humanistisk fakultet. Hun har en ph.d. i fysik og har tidligere arbejdet med supercomputere. I dag betragter hun sig som »pseudohumanist«. 

»Når man kommer fra en tradition, hvor man er vant til at læse og forstå og tænke, filosofere og perspektivere, og man så pludselig bruger computere til at kvantificere nogle ting, er det en radikalt anderledes måde at håndtere materialet på. Der er stor forskel på at læse samtlige Dickens’ værker og lave en analyse på tværs, fordi du har forstået dem, og så bruge nogle af de her programmer, som f.eks. tæller ord,« siger Birte Christensen-Dalsgaard.

Hun beskriver de digitale metoders indtog som et pendul, der først svingede for langt mod den overivrige databegejstring, så fortabte sig i overdreven skepsis, men nu er ved at finde et passende mellemleje. Ifølge hende kan de digitale metoder ikke stå alene. Men modsætningen mellem nærlæsning og fjernlæsning er falsk, for metoderne skal ikke konkurrere, men supplere hinanden, mener hun.

»Sagen er selvfølgelig, at den gode forskning opstår imellem metoderne. Jeg tror ikke på, at man udelukkende kan arbejde med statistiske metoder, man er også nødt til at forstå, hvorfor noget forholder sig, som det gør. Det kræver, at man selv graver sig ned i teksterne.«

Det er Jakob Ladegaard bevidst om.

Når computeren fortæller ham, at der er et stilistisk slægtskab mellem to bastardkarakterer, skriver han det ikke bare ukritisk ind i artiklens konklusion. Computerens tal er blot et udgangspunkt. Et ’hvordan’. Næste skridt er at formulere et ’hvorfor’: Hvorfor viser tallene sammenhængen?

Fordi en computer trods alt ikke kan læse Shakespeare som et menneske, kan det spørgsmål udelukkende besvares ved at støve teksterne af og nærlæse linjerne.

Jakob Ladegaards forskningsprojekt om arv er altså en konstant vekselvirkning mellem fjern- og nærlæsning, digitale og klassiske metoder. 

»Det ville nok aldrig være interessant for en litteraturhistoriker at se de her tal i sig selv. Kun så vidt at de bliver en del af et litteraturhistorisk argument,« siger han, mens han peger på en af sine tabeller.

»Der, hvor det giver mening for mig, er der, hvor man kan vende tilbage til sit fagfelt og sige, at her er nogle resultater, som jeg tror vil interessere jer. Ikke på grund af de metoder, jeg har brugt, men på grund af den sag, vi er fælles om at interessere os for. Hvis du kan overbevise dine fagfæller om, at der sker noget i de her tekster, som vi ikke vidste i forvejen, så har de nye metoder vist deres værd. Det har jeg heldigvis også oplevet, og jeg tror, det vil ske oftere og oftere.«

Overlad ikke debatten til teknologer

Lektor i Kunst- og Kulturvidenskab på Københavns Universitet, Kristin Veel, har i en længere periode forsket i den bevægelse, Ladegaard beskriver. Nærmere bestemt de usikkerheder og blinde vinkler, som store dataanalyser kan skabe. For eksempel når det handler om mere abstrakte forhold som køn og race. 

Den største faldgrube, siger hun, er at antage, at dataanalyserne præsenterer en mere objektiv sandhed end de sædvanlige næranalyser og fortolkninger. For der ligger også forforståelser og antagelser bag de tal, man programmerer sig frem til.

Men Kristin Veel mener, at humanistiske forskere er gode til at behandle computernes tal med sund videnskabelig skepsis.

»Faktisk vil jeg mene, at humanister er nogle af dem, der er bedst klædt på til at bruge den form for digitale metoder på en kritisk og reflekteret facon. Vi er uddannet til ikke at acceptere, at data kan tale for sig selv, som meget af markedsføringsretorikken omkring store dataanalyser ellers har fremført. Vi er vant til at læse kritisk og kigge efter f.eks. de blinde vinkler,« skriver hun i et mailsvar.

I år har hun selv undervist i et fag om sociale medier på Kunst- og Kulturvidenskab, og generelt oplever hun, at humanistiske forskere i stigende grad beskæftiger sig med datingplatforme og datatracking på internettet og sociale medier – genstandsfelter, som er svære at belyse uden digitale værktøjer og behandling af store mængder data. 

Ifølge Birte Christensen-Dalsgaard er udviklingen en absolut nødvendighed. I takt med at den digitale udvikling stiller mere komplekse etiske spørgsmål, skal humaniora bidrage med svar. Eller i hvert fald nuanceringer.

»Enten er det teknologerne, der overtager diskussionen omkring teknologien i vores samfund, eller også får vi uddannet nogle humanister, der har tilstrækkelig viden til at indgå i den diskussion og måske være med til at kvalificere de nye tiltag på området.«

Må leve med ophedede diskussioner

Mellem de overfyldte bogreoler på sit kontor peger Jakob Ladegaard på et par prikker nederst i netværksdiagrammet. Den ene repræsenterer bastardfiguren i Shakespeare-dramaet King Lear. Den anden bastardfiguren i Richard Bromes komedie A Jovial Crew.

Shakespeare-dramaet er skrevet i starten af 1600-tallet. Brome-komedien godt 40 år senere. Førstnævnte er en tragedie, sidstnævnte en komedie. Alligevel har computeren placeret dem sammen.

Hvorfor vidste Jakob Ladegaard ikke, men computeren fortalte ham, at det var værd at undersøge. Derfor begyndte han at nærlæse teksterne. 

»Netop fordi vi ikke havde forventet det, så var det dét, vi valgte at næranalysere. Så vidt jeg ved, er der ingen, der har sammenlignet de to tekster før, og jeg ville ikke være kommet på det, hvis vi ikke havde lavet det her analyseforarbejde,« siger han.

Han træder ud af sit kontor og videre ud i støvregnen, der pibler ned fra vinterhimlen. Inden han siger farvel, parkerer han de tunge teoretiske overvejelser og blotter et smil:

»Jeg er nysgerrig på at finde ud af, hvad det her kan. Det er dét, der driver det for mig. Og så kan det da godt være, at vi havner i nogle ophedede faglige diskussioner undervejs. Det er slet ikke umuligt. Men det tager vi med.«

Videnskapløb 2019

Information sætter fokus på ny forskning, og hvordan man bedst formidler videnskabshistorier til en bred offentlighed, når vi hvert år udgiver magasinet Videnskapløb.

I denne udgave sætter vi fokus på videnskabens databegejstring, og undersøger mulighederne ved de store informationsstrømme, men også hvilke etiske dilemmaer og udfordringer for alt fra personsikkerhed til den videnskabelige metode, det medfører at basere så meget forskning på massive mængder information. Og så kan du også læse om, at retten til videnskab er en menneskeret, der konstant krænkes.

Videnskapløb er støttet af Lundbeckfonden.

Andre artikler i dette tillæg

  • Hvor mange menneskeliv skal reddes for at kunne forsvare, at raske bliver fejldiagnosticeret, overbehandlet og sygeliggjort?

    19. januar 2019
    I Danmark screenes befolkningen for tre kræfttyper. Men eksperter er uenige i, om screeningsprogrammerne gør mest gavn eller skade. Det handler ikke kun om videnskab. Det er også et spørgsmål om, at man risikerer at fejldiagnosticere raske mennesker, og om det er en pris, vi er villige til at betale i forsøget på at opdage og behandle syge? Det er dyrt i kroner og ører – og i angst og overbehandling
  • Klimavidenskaben vokser forskerne over hovedet

    19. januar 2019
    Mængden af publiceret klimavidenskab vokser eksponentielt og er nu så omfattende, at det knapt kan overskues af forskerne. Men det er der råd for: Nye computerprogrammer, der kan håndtere den massive mængde forskningslitteratur, er under udvikling
  • Adgang til videnskab er en menneskeret – men den krænkes igen og igen

    19. januar 2019
    Retten til videnskab blev defineret som en menneskeret med FN’s menneskerettighedserklæring. Men i dag, 70 år senere, er denne rettighed ifølge en række topforskere under pres med forskningsartikler i ly bag abonnementsmure og politikere, der ignorerer videnskabelige fakta
Bliv opdateret med nyt om disse emner på mail

Vores abonnenter kalder os kritisk, seriøs og troværdig.
Få ubegrænset adgang med et digitalt abonnement.
Prøv en måned gratis.

Prøv nu

Er du abonnent? Log ind her

Anbefalinger

anbefalede denne artikel

Kommentarer

Daniel Rasmussen

Man kan vel nærmest betegne den data tilgangen som et form for stillads han kan arbejde ud fra, og om det kan man jo så mene hvad man vil