Læsetid: 8 min.

En revolution i sandheder

Vi sætter digitale spor overalt. Digitale spor, der kan give os ny viden og udfordre gamle autoriteter. En klog udnyttelse af de store og rodede datamængder giver mulighed for at bryde med tidligere tiders videnskabelige traditioner og komme frem til resultater hurtigere end nogensinde før
Det registrerbare dataspor, et mennesker sætter sig, bidrager til enorme datamængder, som vil vende op og ned på vores opfattelse af viden. Bæredygtige byer, effektiv sundhed, sundere forretninger. Forventningerne er enorme. Illustration: Jesse Jacob/iBureauet

Det registrerbare dataspor, et mennesker sætter sig, bidrager til enorme datamængder, som vil vende op og ned på vores opfattelse af viden. Bæredygtige byer, effektiv sundhed, sundere forretninger. Forventningerne er enorme. Illustration: Jesse Jacob/iBureauet

1. juni 2013

Stort set alt, hvad vi foretager os, efterlader elektroniske spor. Når vi er i kontakt med det offentlige, skriver noget på internettet, er indlagt på hospitalet, bruger computere og smartphones i vores hverdag, er på sociale medier, kører med en GPS i en bil eller betaler med et dankort. Alt omkring os er i stigende grad computeriseret, og de data, som opsamles om alt, hvad vi foretager os, øges så eksplosivt, at verdens samlede digitale datamængde fordobles i omfang hvert tredje år.

Big Data – som det kaldes – har de sidste par år udviklet sig til et af de største hypes først inden for markedsføring og it og nu også bredere i erhvervslivet og det offentlige.

»Det værdifulde ved de her data er, at de kan genbruges på utallige måder,« siger Viktor Mayer-Schönberger, professor i Internet Governance and Regulation på Oxford University og forfatter til bogen Big Data – A Revolution That Will Transform How We Live, Work and Think.

Et eksempel er Googles projekt ’Flu Trends’, der har vist sig bedre og hurtigere at kunne forudsige og registrere udbrud af influenza end data indsamlet af sundhedssektoren.

Google får mere end tre milliarder søgninger dagligt og gemmer samtlige søgeord. Så ved at gå tilbage historisk og koble alle søgninger på sundhedsdata om udbrud og spredning af influenza fandt Google ved hjælp af en matematisk model frem til en stærk sammenhæng mellem 45 søgetermer og den faktiske spredning af influenza igennem tiden. På den måde kan de nu hurtigere end myndighederne følge og forudsige spredningen af influenza.

Denne idé om, at der rundtomkring ligger ufattelige datalagre, som kan tappes for viden og bruges til at tjene penge på eller skabe mere effektive samfund, er noget, der længe er blevet talt begejstret om i særligt it- og marketingkredse.

Ifølge Big Data-konsulenterne er der stort set ikke det, som ikke kan blive mere effektivt, rationelt og smartere, hvis man udnytter de opsamlede datamængder bedre. En McKinsey-rapport fra 2011 regner sig frem til, at brugen af Big Data i den offentlige sektor i Europa kan føre til ikke mindre end 15-20 procents besparelser i de administrative omkostninger, svarende til 150-300 milliarder euro. Det kan skabe bæredygtige og sikre byer og effektivisere sundhedssektoren, og hvis man som virksomhed formår at udnytte Big Data, kan man for alvor lægge afstand til sine konkurrenter. Skal man tro konsulenthusene er der stort set ikke det problem, som Big Data ikke kan løse både billigere og mere effektivt. Et løfte, som gør, at man nærmest pr. instinkt bliver skeptisk.

Selv om drømmene om Big Data måske er urealistiske, er der ikke tvivl om, at de milliarder af opsamlede data åbner mulighed for helt nye indsigter både videnskabeligt, for den offentlige styring og for virksomheder.

Tre store ændringer

»Vi havde mange samtaler med ledende folk i industrien, der sagde til os, at data var ved at blive det helt store. Til at starte med sagde vi til os selv: Selvfølgelig – vi er i en digital tidsalder, og udveksler mere og mere data,« forklarer Viktor Mayer-Schönberger.

»Men data får en helt ny kvalitet, hvis du har nok af det, og ser på det på en særlig måde, så derfor besluttede vi os for at skrive en bog, der ikke bare beskrev fænomenet, men fokuserede på de ideer, der ligger til grund for skiftet,« siger han om grunden ti,l at han sammen med Kenneth Cukier, der er data-redaktør på The Economist, besluttede at skrive bogen.

For det er ikke bare mængden i sig selv, der er revolutionerende, men den måde, man bruger og udnytter den viden, der er gemt i dataen. Nye tilgange til de store datamængder kan føre til brud med gamle videnskabelige traditioner og autoriteter. Ud over de mange mulige gevinster handler det også om de markante kvalitative forandringer, som Big Data-bølgen betyder for vores måde at tilegne os viden om verden på.

Forfatterne argumenterer for, at Big Data handler om tre store ændringer, der er tæt forbundne. For det første vores øgede muligheder for at analysere store datamængder om et emne ud fra det, der allerede er opsamlet, i stedet for at lade os nøje med mindre udtræk eller undersøgelser ud fra en given hypotese. For det andet at acceptere, at dataet er rodet og ustruktureret, i stedet for at være besatte af præcision, og for det tredje en øget mulighed for at søge efter rene korrelationer i stedet for at være fikserede på at skulle lede efter kausale forklaringer. Det er ifølge forfatterne en god ting, at vi med Big Data bevæger os væk fra en tilgang, hvor man eftersøger årsager til at gå henimod bare at lede efter korrelationer. Fra et fokus på ’hvorfor’ til et fokus på ’hvad’:

»Mennesket har altid set verden som en serie af årsager og effekter. Det er den måde vores hjerne fungerer på. Men problemet er, at det er i virkeligheden ufatteligt svært at finde og forstå kausalitet, og derfor er de fleste af vores menneskelige fornemmelser også forkerte,« siger Viktor Mayer-Schönberger.

I videnskabeligt regi er man traditionelt gået til undersøgelser ud fra en hypotese om, at noget er årsag til et givent problem, og så undersøgt data for at se, om det passede. Men det er ofte ikke længere nødvendigt. Et eksempel er i tilgangen til infektioner hos for tidligt fødte babyer, hvor ny forskning viser, at man kan se tegn på infektioner timer, inden at det menneskelige øje på nogen måde kan registrere det. Ved at måle 12 faktorer som blodtryk, iltniveau og hjerterytme i alt mere end 1.260 datapunkter i sekundet, har man gjort det muligt for lægerne at forudse, at en infektion vil udvikle sig hos en baby, 24 timer inden den rent faktisk indtræffer. Man ved måske stadig ikke, hvorfor babyen får infektionen, men kan alligevel målrette eller forberede behandlingen, fordi de tusinder af data viser tegnene på, at det vil ske:

»For mange mennesker er det svært at forstå, men i Big Data-tidsalderen, er det smukke, at du kan få en masse indsigt ved at se på verden gennem korrelationer. I Small Data-tidsalderen blev vi nødt til at formulere et spørgsmål, derefter indsamle data og så se på mulige sammenhænge,« siger Viktor Mayer Schönberger.

»Men fordi meget mere data er tilgængeligt nu, så kan vi stille talrige spørgsmål til dataet, vi kan ændre vores hypotese og stadig er det muligt at besvare det igennem den samme analyse. Analyserne efter korrelationer er meget mere kraftfulde nu end tidligere,« siger han.

Det er ikke fordi vi skal ophøre med at søge årsager og kausale forklaringer, men de mange tilgængelige datasæt giver mulighed for at lade korrelationerne fungere som en indgang til at lede efter forklaringer og at foretage handlinger på baggrund af informationerne uden nødvendigvis at forstå hvorfor: »Ved at forstå, at korrelationer kun fortæller os, hvad og ikke hvorfor, kan vi fortsætte med at være åbne over for mulige forklaringer. Bekymringen ved at tro på kausaliteter er, at vi så snart, vi har etableret en kausalitet ikke længere stiller spørgsmål til den. Det smukke ved korrelation er, at vi også forstår dets begrænsninger«.

Gamle autoriteter bliver sat af

Spredningen af de mange data til alle mulige forskellige både offentlige og private aktører er allerede i gang med at føre til autoritetstab hos gamle institutioner som universiteter og staten. Forskere skal forholde sig til, at lige siden de sociale videnskaber kom frem, har det været dem selv eller andre eksperter, der stod for indsamlingen og indtastningen, mens det nu i stigende grad er noget, der kommer ind ustrukturet via folks helt almindelige brug af teknologi og sociale medier. Den manglende struktur og præcision kræver både helt nye programmer og måder at arbejde med data på, men også at man er villig til at acceptere, at det kan være tegn på tendenser eller spor i stedet for beviser eller noget mere præcist.

Det er et vist autoritetstab, at omhyggeligt opbyggede officielle statistikker bliver slået af data, der bare er biprodukter fra brug af teknologi, alene fordi det er mere omfattende og kan behandles hurtigere. Et andet område, hvor magtforholdene ændrer sig, er i adgangen til dataet. Den danske stat har en helt unik adgang til viden om befolkningen igennem først folketællinger og siden CPR-registeret, som den kunne stille til rådighed for forskere på universiteterne.

»I gamle dage var dataflowet, og hvem der har adgang til det, meget mere klart defineret og afgrænset. Det har ændret sig betydeligt nu, fordi der er så mange datapunkter, som nu er tilgængelige eller kan udledes fra andre datapunkter,« siger Viktor Mayer-Schönberger.

Fem store firmaer

I dag har de fem giganter Google, Facebook, Amazon, Apple og Microsoft, men også andre private aktører, adgang til ufattelige mængder viden om, hvordan mennesker agerer, når de taler med hinanden, og hvordan de eftersøger information og produkter, når de søger på internettet. I et nyligt studie har Microsoft sammen med Google og Stanford fundet hidtil ukendte bivirkninger ved et medicinsk middel alene ved at kigge på resultater i, hvad folk søger på på internettet:

»Folk forsøgte at finde ud af, om der var en bivirkning, fordi de følte, at de havde feber efter at have taget medicinen. Hvis man kigger på de signaler, og signalerne er stærke nok, så peger det i retningen af en potentiel korrelation. Og da de kiggede nærmere på det, var der to hidtil ukendte bivirkninger ved medicinen,« siger han.

Selv om de fleste kommuner, universiteter og stater har fået øjnene op for potentialerne i en øget udnyttelse af datamængderne med byer som New York og Baltimore i front, så halter det offentlige stadig langt bagefter, mener Viktor Mayer-Schönberger. Universiteterne fordi de ikke har dataen, og staten fordi de ikke har kompetencerne:

»Staten har ganske vist en masse information, men det er en meget stor organisation med forskellige enheder, der som oftest ikke taler særligt godt sammen. It i det offentlige er for det meste en trist historie om inkompetence og mangel på ressourcer, fordi de ikke har de bedste talenter, og deres projekter sædvanligvis er for store med omkostninger, der løber løbsk,« siger Viktor Mayer-Schönberger.

»Det betyder, at den magt, som var iboende i dataen, da den blev indsamlet, aldrig er blevet realiseret. Men i den private sektor har virksomhederne et kæmpe profit-incitament til at høste og afdække den værdi, der er gemt i dataen, så de er mindre ignorante i forhold til det,« siger han.

Serie

Big Data

Stort set alt, hvad vi gør, resulterer i et dataspor. Vores bevægelser, kommunikation, forbrug og mange andre handlinger kan derfor nu analyseres og reguleres på helt nye måder.

I denne serie undersøger Information nogle af de forskellige aspekter og problematikker ved big data-fænomenet.

Seneste artikler

  • Storstilet overvågning, styring og bullshit

    29. juni 2013
    Big data handler ikke kun om overvågning. Den enorme indsamling af information om borgerne kan grundlæggende forskyde magten i samfundet og udfordre demokratiet. Vi er først nu ved at finde ud af hvordan
  • Den store revolution er stadig foran os

    22. juni 2013
    Vi har historisk enestående mængder af data, men der er stadig enorme forhindringer for, at vi kan udnytte mulighederne i big data
  • Et overblik over livet i et helt uset omfang

    8. juni 2013
    Sensorer i vores mobiltelefoner og GPS’er i biler betyder, at vores bevægelsesmønstre kan kortlægges som aldrig før. Byplanlægning og trafikregulering kan blive mere intelligent og forskningsmæssige landvindinger kan opnås ud fra dataen. Men dataen er fortsat kontrolleret af store aktører, der ikke nødvendigvis vil dele
Bliv opdateret med nyt om disse emner på mail

Vores abonnenter kalder os kritisk, seriøs og troværdig.
Få ubegrænset adgang med et digitalt abonnement.
Prøv en måned gratis.

Prøv nu

Er du abonnent? Log ind her

Anbefalinger

  • Anders Green
Anders Green anbefalede denne artikel

Kommentarer

Der er ingen kommentarer endnu