Eigengenoom sorteert metagenoom

Arjen Dijkgraaf2015-09-15T00:00:00+01:00

Geen opmerkingen

Als je een beetje handig voorsorteert kun je bacteriële metagenomen analyseren met slechts enkele tientallen gigabytes RAM-geheugen in je pc. Darbij kun je zelfs onderscheid maken tussen verschillende stammen van dezelfde soort, beloven MIT-onderzoekers in Nature Biotechnology.

Zo’n metagenoom bestaat uit álle DNA in bijvoorbeeld een watermonster. Daar kan genetisch materiaal van duizenden soorten tussen zitten, dat ook nog eens de sequencer uit komt in korte stukjes waarvan niet direct duidelijk is wat bij wat hoort.

In principe kun je dat laatste wel achterhalen. Van de meeste soorten zal het monster immers een groot aantal exemplaren bevatten, waarvan het DNA niet telkens op dezelfde plekken is doorgeknipt. Uit fragmenten die elkaar overlappen kun je zo afleiden wat de basenvolgorde van het complete DNA moet zijn geweest.

Maar bij zo’n metagenoom heb je het al snel over datasets van een paar terabytes. Met een gewone pc kun je daar dus niets mee, simpelweg omdat het RAM-werkgeheugen veel te klein is om de hele dataset te laden. En telkens de harde schijf moeten doorzoeken naar passende fragmenten gaat veel en veel te langzaam.

Brian Cleary, Eric Palm en collega’s komen nu met een methode die ze ‘latent strain analysis’ (LSA) noemen, en die het probleem zou moeten oplossen. LSA is gebaseerd op covariantie en werkt met ‘eigengenomen’, eveneens een zelfbedachte term naar analogie met eigenvectoren. Zo’n eigengenoom is geen echt genoom maar een variabele die in feite aangeeft hoe vaak een tamelijk korte basensequentie (een zogeheten ‘k-meer’) terugkomt in de dataset.

Het idee is dat je nu de hele dataset vanaf de harde schijf door het werkgeheugen laat ‘streamen’. Je gebruikt eenvijfde van de gegevens om een set k-meren en eigengenomen op te bouwen. Op basis daarvan sorteer je de resterende fragmenten, zodat de grote dataset wordt opgedeeld in duizenden kleintjes.

Pas daarna ga je proberen de fragmenten in elk klein datasetje aan elkaar te breien, in de hoop dat die gemeenschappelijke stukjes sequentie inderdaad inhouden dat ze allemaal van dezelfde soort afkomstig zijn. Waarbij, als het goed is, elk afzonderlijk setje wél in je werkgeheugen past. De pc zal wel een poosje bezig zijn, maar hij kan het tenminste aan.

De onderzoekers hebben het uitgeprobeerd met datasets die ze zelf hadden samengesteld door een aantal genomen van bekende soorten in verschillende verhoudingen door elkaar te gooien. Ze stellen dat je er genomen mee kunt terugvinden van acteriën die slechts 0,00001% van de totale populatie uitmaken. En een mix van acht stammen van Salmonella enterica leverde vijf datasetjes op waarin telkens een andere variant overheerste.

Voor wie het ook wil proberen: de software is gratis beschikbaar met garantie tot de USB-poort.

bron: Nature Biotechnology

Onderwerpen

Geen opmerkingen

Nog geen opmerkingen

Je bent niet ingelogd.

Alleen geregistreerde gebruikers kunnen opmerkingen bij dit artikel plaatsen.

Registreer

Gerelateerde artikelen

Nieuws
MOF-synthese altijd perfect met MPIF

2026-03-12T13:59:00Z Daniël Linzel

Met een nieuwe tool kunnen onderzoekers eenvoudig documenteren hoe ze metal-organic frameworks hebben geprepareerd en gesynthetiseerd, zodat collega’s de resultaten consistenter kunnen repliceren. Het EU4MOFs-consortium heeft de open access-tool gepubliceerd in Advanced Materials.
Nieuws
Koper(I)transport met klein molecuul effectief tegen kanker

2026-03-02T08:30:00Z Daniël Linzel

Met een klein biomimetisch molecuul is het voor het eerst gelukt om Cu⁺ door celmembranen te transporteren zonder hulp van eiwitten. Geheel onverwacht lijkt het uit te kunnen groeien tot een potente antikankerstrategie, aldus een internationaal team in JACS.
Nieuws
Nobelprijswinnaar Susumu Kitagawa spreker op ECC10

2026-02-25T10:32:00Z Daniël Linzel

Hij was de eerste die de porositeit van metaalcomplexen ontdekte in wat later Metal Organic Frameworks (MOF’s) werden genoemd: Susumu Kitagawa, een van de drie Nobelprijswinnaars van 2025. Dit jaar treedt hij op als plenaire spreker op het tiende EuChemS Chemistry Congress in Antwerpen.

Meer Verdieping

Verdieping
Stof uit slijtende banden gaat mogelijk in de ban

2026-03-17T10:54:00Z Marga van Zundert

In de VS loopt nu een rechtszaak waarbij vissers en milieuorganisaties tegenover bandenfabrikanten staan om een verbod af te dwingen op 6PPD, een veelgebruikt additief. De uitspraak wordt in mei verwacht. In de EU werken ondertussen het Nederlandse RIVM en het Oostenrijkse milieu-instituut UBA aan een ban.
Verdieping
Voorbij de lens

2026-03-10T13:59:00Z Ruben Boot

Superresolutie-microscopie technieken gaan voorbij aan de fundamentele grenzen van de lens. Carlas Smith onderzoekt aan de TU Delft waar de daadwerkelijke ondergrens ligt – om deze vervolgens te verleggen.
Verdieping
Gapend laboratoriumgat opgevuld met nieuw graduaat

2026-03-09T11:03:00Z Daniël Linzel

Drie hogescholen in Vlaanderen combineerden hun krachten en zetten een nieuwe graduaatopleiding op voor laboratoriumassistenten. De opleiding laboratoriumassistentie bouwt verder op de vroegere graduaatsopleidingen biotechnologie en chemie.

Site mogelijk gemaakt door Webvision Cloud

Wil je niks meer missen?

Eigengenoom sorteert metagenoom

Onderwerpen

Nog geen opmerkingen

Alleen geregistreerde gebruikers kunnen opmerkingen bij dit artikel plaatsen.

Gerelateerde artikelen

MOF-synthese altijd perfect met MPIF

Koper(I)transport met klein molecuul effectief tegen kanker

Nobelprijswinnaar Susumu Kitagawa spreker op ECC10

Meer Verdieping

Stof uit slijtende banden gaat mogelijk in de ban

Voorbij de lens

Gapend laboratoriumgat opgevuld met nieuw graduaat

EEN UITGAVE VAN DE KNCV VOOR