[Onderstaand artikel komt uit Surf Magazine. Hier kunt u een gratis abonnement op nemen. Foto: Diederik van der Laan]
Het is bijna niet voor te stellen: anno 2012 zijn er jonge wetenschappers die hun onderzoeksgegevens alleen op hun laptop bewaren. Eén inbraak, en jaren werk zijn verloren.
Dit lijkt een extreem voorbeeld van slecht databeheer. Maar kijken we naar de wetenschap als geheel, dan blijkt verlies van data geen uitzondering maar regel. Want zodra een publicatie gedrukt is, gaan de gegevens doorgaans een la in, om er niet meer uit te komen. ‘Dat is natuurlijk niet efficiënt’, zegt Ana van Meegen, voorzitter van de special interest group Research Data
. ‘Andere onderzoekers zouden die data goed kunnen gebruiken, bijvoorbeeld voor een nieuwe vraagstelling, of voor vergelijkingen door de tijd heen. Daarom zouden onderzoeksgegevens toegankelijk moeten zijn, op zo'n manier dat anderen er ook mee aan de slag kunnen.’
Hierdoor zou het rendement van de wetenschap sterk kunnen groeien. Volgens Eurocommissaris Neelie Kroes zijn onderzoeksdata zelfs de nieuwe olie.
Er zijn nog meer argumenten. Van Meegen: ‘Ook voor de wetenschappelijke integriteit is het belangrijk. Denk maar aan de berichten over onderzoeksfraude. En steeds meer overheden benadrukken dat onderzoek wordt betaald met publiek geld: dan moeten die data ook publiek toegankelijk worden.’
Tien grote instellingen
Geen wonder dus dat er steeds meer initiatieven komen die moeten leiden tot een openbare infrastructuur voor onderzoeksdata. Op sommige gebieden, zoals genomics, is dit ideaal vrijwel bereikt, maar voor de rest moet nog heel veel werk worden verzet.
Nederland is er vroeg bij, getuige onder meer het CARDS-project, dat door Van Meegen geleid werd als informatiemanager bij de Vrije Universiteit. ‘Vijf betrokken instellingen, waaronder SURF en het nationaal data-archief DANS, vormden samen al een Onderzoeksdata Forum.
Maar de special interest group (SIG) Research Data, die deze zomer werd opgericht als voortzetting van het Forum, gaat veel verder. We hebben nu een kerngroep, waarin tien grote instellingen zitten die werken aan onderzoeksdata.
Daarbuiten is er een heel grote groep van geïnteresseerden die twee keer per jaar bijeenkomt, naast de diverse themabijeenkomsten. Ook via SURFspace verspreiden we kennis en ervaringen.’ Geïnteresseerden in onderzoeksdata kunnen de SIG Research Data volgen op Surfspace.nl.
Dropbox
Drie werkgroepen van de SIG gaan aan de slag met respectievelijk infrastructuur, juridische aspecten en dataprofessionals. Van Meegen: ‘Dataprofessionals zijn de mensen die binnen de instellingen moeten bijdragen aan goed databeheer. Die taak wordt nu heel verschillend ingevuld: het veld is echt sterk in ontwikkeling. Daarom willen we dat onderwerp volgend jaar veel aandacht geven, onder meer met een bijeenkomst in april.’
Dataprofessionals zijn essentieel om onderzoekers over de streep te trekken. Die zijn immers niet zo geneigd om hun data te delen. Goede afspraken over openbaringstermijnen helpen, maar het is ook gewoon lastig om de data helder te ordenen. Van Meegen: ‘Als er eenmaal een goede infrastructuur is wordt dat allemaal automatisch gedaan. Maar ook nu is een goed begin het halve werk. Dataprofessionals helpen onderzoekers daarbij.’
Dat die hulp geen overbodige luxe is, blijkt bijvoorbeeld uit de groeiende populariteit van Dropbox voor het opslaan van onderzoeksdata. Van Meegen: ‘Volgens de juridische bepalingen bewaart Dropbox een kopie van alles wat je opslaat, ook al heb je het zelf al verwijderd. Deze data kunnen ze in de toekomst voor andere doeleinden gebruiken. Ik denk niet dat we dat echt willen.’