Wie methoden voor chromatografische scheidingen ontwikkelt, weet er alles van: het scheiden van (complexe) mengsels vergt veel werk. Maar met de komst van machine learning weet een groep aan de KU Leuven het proces op efficiënte wijze te versnellen. ‘Mensen lopen vaak vast in hun eigen methoden.’ 

Chromatografie is een essentiële techniek die je in het laboratorium gebruikt om mengsels te scheiden. Het optimaliseren van een scheiding gaat echter vaak gepaard met veel trial and error, wat veel tijd en middelen kost. ‘Iedereen die betrokken is bij chromatografie kijkt op zijn eigen manier naar methodeontwikkeling, meestal op basis van ervaring’, zegt Deirdre Cabooter, hoogleraar farmaceutische analyse aan de KU Leuven. ‘Wij willen de methodeontwikkeling efficiënter aanpakken door machine learning te gebruiken.’ 

Daarom kwam Alexander Kensert als geroepen: hij promoveerde op dit project als machine learning expert en is momenteel postdoc in de groep van Cabooter. ‘Toen ik in het lab van Deirdre begon, was ik letterlijk op zoek naar problemen’, zegt Kensert. ‘Meestal is het andersom; er is een probleem dat opgelost moet worden waar je dan een oplossing voor probeert te vinden. Maar ik had de oplossing al en had een probleem nodig om op te lossen.’

Hij werkt voornamelijk aan drie machine learning-projecten: signaalverwerking (met behulp van convolutionele neurale netwerken), modellering van retentietijden (met behulp van grafische neurale netwerken), en methodeoptimalisatie (met behulp van deep reinforcement learning). ‘We willen ruis kunnen verwijderen uit complexe chromatogrammen om de pieken beter te kunnen lokaliseren. Het is ook nuttig om correlaties te vinden tussen de structuur van een molecule en zijn retentietijd. Ten slotte willen we op een intelligente en automatische manier de juiste chromatografische parameters selecteren voor een optimale scheiding.’ 

Kunstmatig 

Dat is echter niet zo eenvoudig als het lijkt. ‘Momenteel heb je veel gegevens nodig om de machine learning-algoritmes efficiënt te laten leren’, legt Cabooter uit. ‘Maar het is erg duur en tijdrovend om veel gegevens op basis van echte monsters en metingen te genereren.’ In plaats daarvan genereren de onderzoekers kunstmatige chromatogrammen die de werkelijkheid weerspiegelen om de algoritmen te trainen. Kensert: ‘Je kunt niet leren zonder goede voorbeelden, dus moesten we simulators maken die deze chromatogrammen genereren om op te trainen.’

Maar Cabooter benadrukt dat er ook echte voorbeelden worden gebruikt. ‘Iedereen in onze groep doet aan chromatografie, dus we kunnen die gegevens gebruiken en tegelijkertijd het algoritme testen’, zegt ze. ‘Dit is een snelle manier om het te verbeteren.’ Volgens Kensert zit de grootste uitdaging in het verkrijgen van gegevens of voorbeelden van goede kwaliteit. ‘Die zijn nodig om het machine learning-model te trainen om bruikbare voorspellingen te doen. We zijn al een heel eind gekomen met retentiemodellering, met bewijs van zowel goede prestaties als interpreteerbaarheid.’ Hij heeft ook stappen gezet in de signaalverwerkingsalgoritmen. ‘We moeten nog verder valideren en testen’, geeft Kensert toe, ‘maar we hebben met succes modellen ontwikkeld en de resultaten gepubliceerd in het Journal of Chromatography A.’

‘We willen ruis kunnen verwijderen uit complexe chromatogrammen’   

Seconden 

Momenteel zijn de machine learning-algoritmen vooral gericht op kleine moleculen die relevant zijn voor de farmaceutische sector. ‘Maar het doel is om verder te kijken’, zegt Cabooter. ‘We werken sinds kort ook met grotere biomoleculen, dus daar proberen we de algoritmes ook voor te implementeren.’ Uiteindelijk zullen deze algoritmen van nut zijn voor iedereen die zich bezighoudt met vloeistofchromatografie, aldus Cabooter. ‘Op elk analysegebied, of het nu gaat om voedsel- of milieuonderzoek, worden chromatografiemethoden ontwikkeld. Er gaat veel tijd verloren met het handmatig uitvoeren van deze analyses, dus machinaal leren kan veel mensen helpen.’

Een van Cabooters studenten heeft de voordelen van Kenserts algoritmen al ervaren. In plaats van wekenlang zelf gegevens te analyseren, klaarde de computer de klus binnen enkele seconden. Enerzijds moet de computer dus leren van alle gegevens die je hem geeft. Anderzijds kun je zelf ook leren van de machine. ‘Het verbeteren van de interpreteerbaarheid van modellen voor machinaal leren is momenteel een hot topic’, zegt Kensert. ‘In een van onze projecten proberen we te begrijpen naar welk deel van de molecule het machine learning-model kijkt als het voorspellingen doet over de retentietijd. Dit zou ons meer inzicht kunnen geven in welke substructuren van belang kunnen zijn voor de retentie om chromatografische processen beter te begrijpen.’  

De onderzoekers hopen een belangrijke bijdrage te leveren aan de chromatografie, niet alleen qua methodologie, maar ook qua inzicht. Cabooter: ‘Mensen lopen vaak vast in hun eigen methoden en denken dat de manier waarop ze altijd aan methodeontwikkeling hebben gedaan, de beste manier is. Maar chromatografie kost nog steeds veel tijd, inclusief handmatig tweaken, parameters opnieuw controleren enzovoort. Het is gewoon niet optimaal. Hopelijk kunnen we van de computer leren wat wel de optimale manier is.’