COVID-19 forvirring på grund af Excel

22 oktober 2020
De manglende testresultater

I begyndelsen af oktober bragte mange medier nyheden om tusindvise af bortkomne corona test resultater i Storbritannien. Angiveligt gik tæt på 16 000 test resultater tabt under håndteringen af testdata. Om årsagen var meldingerne lidt forskellige, men fællesnævneren var Excel, som blev brugt til databehandlingen. 

Ifølge The Guardian opstod fejlen, da sundhedsmyndighederne (PHE = Public Health England) opsamlede resultaterne fra de individuelle test steder for at publicere det samlede resultat.

Test laboratorierne har hver især indsendt deres resultater i form af en csv fil - den simpleste liste format, hvor tallene er opdelt i kolonner. Disse filer blev uploadet i Excel, hvor de nye resultater blev tilføjet i bunden. Problemet var bare, at mens en csv fil kan håndtere en meget stor antal rækker, har Excel en begrænsning på omkring 1 million rækker, afhængig af software versionen. 

Når man håndterer så store mængder af data, er det nemt at overse, hvis en mindre del af de uploadede data ikke kommer med.

Forældet software
Ifølge The Independent var fejlen endnu større, da det viste sig, at den brugte version af Excel var 13 år gammel, som kun var i stand til at håndtere 65 000 rækker.

Eksemplet viser, at selv det mest kendte og brugte værktøj til datahåndtering kan gemme overraskelser, hvis man ikke er 100% klar over dets begrænsninger. Det kan koste mange penge, men når det drejer sig om helbredsdata, kan det i værste fald koste liv. 

I dette tilfælde mistede man muligheden for smitteopsporing for over 5000 positive tests, som manglede kontaktinformationer fra Excel arken.

Automatisering med omtanke

Excel er ellers forholdsvis nemt at bruge, og det kan spare tid ved lange, komplicerede beregninger. De seneste versioner af Excel er også blevet mere og mere intelligent, og er i stand til automatisk at genkende mønstre, og udfylde de valgte celler på baggrund af de mønstre. Man skal dog være varsom med disse automatiseringer, det er ikke altid, at det er disse mønstre der skal følges. Er man ikke opmærksom, eller ikke kan overskue hvad Excel prøver på at lave, får man måske noget andet, end man troede man var i gang med.