Niet alleen publicaties moeten voor iedereen toegankelijk zijn, ook de onderliggende data. Dat vindt de Nederlandse Organisatie voor Wetenschappelijk Onderzoek. Een goed idee? Delta vroeg het aan drie Delftse wetenschappers.
Waar ga je onderzoeksdata opslaan, hoe maak je ze vindbaar en geschikt voor hergebruik? Op die drie vragen moeten wetenschappers antwoord geven als ze in aanmerking willen komen voor een subsidie van anderhalf miljoen euro van NWO, de zogenaamde Vici subsidie.
Deze nieuwe regel is onderdeel van de pilot datamanagement waar de onderzoeksfinancier op 1 januari mee is begonnen. Omdat het onderzoek met publieke middelen wordt betaald, eiste NWO eerder al dat de resultaten die eruit voorkomen openbaar worden gemaakt door publicatie in zogenaamde open access tijdschriften.
Atmosfeeronderzoeker Prof.dr.ir. Herman Russchenberg (CiTG) vind de filosofie van NWO goed. “Maar we moeten niet onderschatten hoeveel tijd het kost om data toegankelijk te maken. Data zijn alleen bruikbaar voor anderen als ze voorzien zijn van goede metadata. Bij klimatologisch onderzoekscentrum Cabauw in Lopik doen wij onderzoek naar de atmosfeer. De context waarin we metingen verrichten, zoals de windrichting en de instelling van de instrumenten, moeten we goed noteren. Dat is best ingewikkeld.”
“Als je een meetcampagne hebt van twintig jaar, dan kun je heel goede afspraken met elkaar maken”, vervolgt Russchenberg. “Maar als je als individuele onderzoeker een nieuwe meettechniek ontwikkelt, dan wordt het allemaal al snel wat meer houtje touwtje. Je moet dan zelf bedenken hoe je de data bruikbaar maakt voor anderen. Dat vergt een nieuwe manier van werken. En we zullen ook veel meer moeten gaan nadenken over de bestandstypen. Opslagmethoden veranderen. Zo werkt niemand werkt nu nog met floppy disks.”
Prof.dr. Alan Hanjalic (EWI) voorziet problemen. Hij ontwikkelt algoritmes om videobestanden doorzoekbaar te maken. “Wij hebben enorme bergen aan videobestanden nodig om onze algoritmes op te testen. Daarvoor zijn we afhankelijk van bedrijven als Google en Yahoo; zij stellen data aan ons beschikbaar als ze zelf met een bepaald probleem worstelen waarmee wij ze kunnen helpen. De algoritmes die wij vervolgens ontwikkelen, kunnen we openbaar maken, maar niet de onderliggende data, want die zijn eigendom van de bedrijven.”
Dr.ir. Johan Molenbroek, ergonoom bij Industrieel Ontwerpen, won vorig jaar de dataprijs van stichting Research Data Netherlands. “Ik ben helemaal voor open data”, zegt hij.
Molenbroek meet al sinds de jaren tachtig lichaamsdelen van mensen. Hij kreeg de prijs voor het oprichten van DINED, een database voor ontwerpers over de variatie van menselijke maten van Nederlanders.
Een heikel punt bij open data is volgens de IO-er privacy. “Hoe voorkom je dat de mensen die in beeld zijn gebracht herkenbaar zijn? Het zijn driedimensionale foto’s, die kun je niet zomaar op internet zetten. Ik heb de mensen onherkenbaar gemaakt door met Photoshop bepaalde laagjes uit de foto’s te verwijderen zonder dat daardoor de bruikbaarheid van de foto’s werd aangetast.”
Comments are closed.