Vroeger telde je de blaadjes, bloeitijd en zaadproductie van je kas vol zandraketten en dan was je weken zoet. Tegenwoordig sequensen we elk plantje en gooien er een RNA-chip plus MS/MS-analyse overheen, à 10.000 meetpunten. Overzichtelijke opslag van al die data wordt dan een serieus probleem.

“Iedere postdoc bewaart zijn data op een andere manier”, legt de Groningse Morris Swertz uit. Hij is een van de ontwikkelaars van de software XGAP, de afkorting van het Xtensible Genotype and Phenotype dataplatform, opgestart tijdens verscheidene zandraketprojecten. “Zodra de postdoc in kwestie de groep verlaat, gaat er een groot deel van de kennis over zijn ruwe data verloren.” Wie weleens aan een Excelsheet van een ander heeft gewerkt, kent het probleem.

Bij XGAP gaat data-invoer altijd via hetzelfde formulier. Het maakt niet uit of het om GC-MS-data gaat, of om gen sequenties of fenotypes. Een paar muisklikken passen het formulier per datasoort aan en laden de metingen in de database. Dan ziet elk experiment er ruwweg hetzelfde uit: per meting een matrix met horizontaal de onderzochte groepen – bijvoorbeeld mutanten, patiënten of cellijnen – en verticaal de kenmerken. Met het labprotocol er netjes aan gehangen.

OP AFSTAND

“Het werd hoog tijd om data-uitwisseling te professionaliseren”, meent Ritsert Jansen, hoogleraar bioinformatica aan de Rijksuniversiteit Groningen. “Dat gedoe met mailtjes heen en weer kon gewoon niet meer.”

In XGAP wordt ook op afstand ‘samen’ aan data gewerkt. “Dat is vooral handig voor grote consortia, zoals het Casimir-consortium van de EU dat aan muismodellen voor menselijke ziektes werkt”, vertelt Swertz. “Het scheelt een hoop dubbel werk. Ook statistiekprogramma’s voor ruisreductie of normalisatie, zijn door het uniforme dataformaat eindeloos uit te wisselen.” Het Nederlands Bioinformatica Centrum (NBIC) gebruikt de software voor proteomics en metabolomics. Het centrum past de sofware momenteel aan, zodat ook klinische databanken kunnen worden toegevoegd.

En hoe zit het met de beveiliging van de vaak vertrouwelijke data? “Elk consortium heeft nu nog zijn ‘eigen’ versie van de XGAP-software die nog niet met die van anderen is verbonden”, stelt Swertz gerust. “Maar volgend jaar willen we naar een openbare database waarin iedereen zijn eigen, waterdicht beveiligde stukje kan hebben.”

De database van de toekomst? “Ik vind het een prachtig initiatief”, zegt Jansen, die zijdelings bij het project is betrokken. “Maar Philips had ook een prachtig videobandensysteem dat niemand kocht. XGAP wordt nu op een handvol plaatsen gebruikt, zoals Wageningen Universiteit en het Helmholtz Institut in Duitsland. Het is afwachten of de rest van de wereld XGAP ook oppakt.”

www.xgap.org

KADERTEKST

WIKIPATHWAYS

“Levende wezens bestaan uit enorm ingewikkelde netwerken van genexpressie, eiwitinteracties en metabolietfluxen. Dat wordt steeds duidelijker”, stelt Martijn van Iersel, promovendus aan de Universiteit Maastricht. Samen met Amerikaanse onderzoekers werkt hij aan de oprichting van WikiPathways. Dit programma moet overzicht leveren op een hoger niveau dan het op deze pagina beschreven XGAP.

WikiPathways is een encyclopedie voor interacties in levende wezens die vooral via plaatjes alle verbanden wil verhelderen. Voor ruwe data wordt de lezer naar publicaties en andere databases verwezen. “Alle nieuwe ontwikkelingen van deze interacties bijhouden is gewoonweg te veel werk voor één onderzoeksgroep. Via een wiki wordt dit werk verdeeld”, legt van Iersel uit. “Doordat we hetzelfde uiterlijk gebruiken als Wikipedia, hopen we dat wetenschappers zich sneller uitgenodigd voelen aan WikiPathways bij te dragen. Het is echter nog afwachten of deze kennis niet te specifiek is om via een wiki te werken.”

Bron: C2W Life Sciences 7, 4 april 2009

Onderwerpen