Papierloos 2.0 helpt misschien ook tegen fraude
Bastienne Wentzel

18 februari 2013, C2W

Besparen van kosten en ruimte is de belangrijkste drijfveer om over te gaan op een papierloos lab. Maar data, vastgelegd met een goed digitaal systeem is ook veel minder gevoelig voor knoeien met de resultaten.

De weg naar een papierloos lab wordt al lang bewandeld. Laboratorium-informatiesystemen (LIMS), simpele centrale computers voor het opslaan van gegevens, bestaan al sinds de jaren tachtig. Tegenwoordig zijn al deze systemen netwerk-gebaseerd en kan iedereen overal bij alle data. Dat scheelt tijd, papier en fouten.
En misschien is er nog een voordeel te bespeuren voor het digitale, papierloze lab. Met een beetje geluk vermindert het de mogelijkheden voor wetenschappelijke fraudeurs. Meer of minder ernstige vormen van wetenschappelijke oplichting komen vaak voor en niet alleen bij de sociale wetenschappen, zo lieten experts niet na te melden in de nasleep van de Stapel-affaire. Zou het met de komst van een papierloos lab niet veel moeilijker zijn om data naar je hand te zetten?
 
Betere controle
Veel labs gebruiken een LIMS-systeem, vaak uitgebreid met allerlei andere functies om de hoeveelheid papieren data tot een minimum te beperken. Een voorbeeld is OpenLAB van Agilent. Dit softwarepakket bevat een component die data verzamelt, een die data opslaat en een elektronisch labjournaal. Niet alleen Agilent apparatuur kan met de software werken, maar data kan ook verzameld en opgeslagen worden van andere machines. Arthur Munday van Agilent vertelt: 'Een van de belangrijkste redenen van onze klanten om voor een papierloos lab te kiezen is efficientie en kostenbesparing. Het printen en archiveren van data kost veel geld, tijd en ruimte.'
Maar er is nog een belangrijke reden om over te schakelen naar papierloos, zegt informatiespecialist Munday. 'In grote labs is het gebruikelijk dat metingen van een laborant door een ander worden gecontroleerd. Deze zogeheten audits zijn natuurlijk veel makkelijker uit te voeren met elektronische data. Je haalt veel makkelijker de juiste data boven water.'
Daarmee is de controle op foute metingen ook beter geworden, zegt Munday. En er is nog een belangrijk aspect. In de chromatografie, waar Agilent een grote speler is, is er altijd het probleem van ruis in de meting, het vaststellen van de basislijn en het identificeren van onzuiverheden. 'Als je maar lang genoeg bewerkingen uitvoert kun je makkelijk een onzuiverheid uit de data wegfilteren. Dit gebeurt lang niet altijd met valse bedoelingen. Wanneer je tien onderzoekers dezelfde data laat bewerken hebben ze ieder hun eigen mening over wat de juiste manier is. In OpenLAB wordt de hele analysegeschiedenis van een meting vastgelegd, de originele data en alle bewerkingen die de laborant erop heeft uitgevoerd. Zo kun je altijd de originele data terughalen.'
 
Standardisatie
Het nieuwe papierloze lab is meer dan een verzameling papieren die ingescand zijn en in pdfjes terecht komen, zegt Burkhard Schäfer van het Duitse softwarebedrijf BSSN. 'Een pdf is slechts een plaatje van de informatie. Je kunt er niets mee, je kunt de data niet bewerken. Met de nieuwe manier van digitaal data opslaan kan dat wel.'
Natuurlijk levert de meeste analyseapparatuur allang digitale data. Maar, zegt Schäfer, iedere fabrikant heeft zijn eigen software en dataformaat. 'Het is heel lastig om data te vergelijken of uitwisselen met je collega, je klant of in een consortium. Bovendien heeft software van fabrikanten maar een beperkte houdbaarheidsdatum. Wanneer de software niet meer geüpdate wordt kun je na verloop van tijd je data niet meer lezen.'
Schäfer ontwikkelde samen met bedrijven en instellingen een datastandaard voor het uitwisselen van alle mogelijke analytische informatie. Deze standaard heet AnIML (spreek uit animal) en staat voor Analytical Information Markup Language. Het is niets meer dan een afspraak over het formaat waarin data in een bestand wordt opgeslagen en weergegeven, net zoals HTML de standaard is voor internetpagina's. Software van onder anderen BSSN zet de data die uit de analyseapparatuur rolt om in het standaardformaat. Wanneer iedereen dat doet met al zijn data, kun je dus heel makkelijk je resultaten met elkaar vergelijken.
 
Elektronische handtekening
Betere uitwisseling is niet het enige argument om een datastandaard in te willen voeren, meent Schäfer. 'Wanneer mensen data gaan interpreteren kunnen er makkelijk fouten optreden. Traceerbaarheid van data naar de originele meting is daarom heel belangrijk. Je kunt dan later nagaan of er geen fouten zijn gemaakt en je stelt anderen in staat om jouw analyse van de data te beoordelen en eventueel te herhalen.' Daarmee verklein je de kans op fouten of moedwillige massage van de data, zegt Schäfer.
Deze traceerbaarheid is ingebouwd in de AnIML standaard. De data krijgt altijd een elektronische handtekening mee. Elke keer dat een analist de data bewerkt wordt er een nieuwe handtekening geplaatst. Zelfs als iemand data zou wegpoetsen is dat altijd te achterhalen. 'Het is als een paspoort,' zegt Schäfer. 'Als je daar dingen in wijzigt of uitwist kun je ze niet altijd meer terughalen, maar het is altijd duidelijk dat ermee geknoeid is. Dat is reden voor achterdocht.'
De softwarespecialisten zijn zelfs in onderhandeling met de uitgevers van wetenschappelijke tijdschriften zoals Springer. De bedoeling is om auteurs bij elke publicatie de gelegenheid te geven om data in de AnIML standaard als supplement aan te bieden. Iedereen kan die data vervolgens controleren. 'De uitgever wil ten allen tijde voorkomen dat een frauduleuze publicatie in een van zijn tijdschriften terecht is gekomen. Voor de onderzoeker vergroot het zijn geloofwaardigheid. Je laat immers precies zien hoe je resultaten tot stand zijn gekomen,' verklaart Schäfer.
 
Dit artikel is gepubliceerd in C2W, 2013.