Uit de grote hoeveelheid watermonitoringdata kun je clusters van stoffen halen en patronen herkennen die iets kunnen zeggen over de bron van micropolluenten, staat in Environments.

Bij waterkwaliteitsmonitoring verzamel je bergen aan data om te checken of de concentratie van bepaalde micropolluenten niet te hoog oploopt. Maar verder worden die data meestal niet uitgeplozen. Om daar meer uit te halen, keken onderzoekers van wateronderzoeksinstituut KWR niet naar de individuele stoffen, maar naar stofclusters in datasets om uit te zoeken of je zo patronen kunt vinden en op die manier iets kunt zeggen over de oorsprong van de polluenten.

Drinkwater

Maar het gaat niet slechts om het laten liggen van interessante data. ‘Drinkwaterbronnen – en daarmee drinkwaterbedrijven – staan steeds meer onder druk’, zegt Tessa Pronk, datawetenschapper bij KWR. ‘Dat heeft te maken met droge zomers, maar ook met het groeiend gebruik van chemische stoffen die niet thuishoren in het water.’ Met collega’s Elvio Amato, Stefan Kools en Thomas ter Laak richtte ze binnen het bedrijfstakonderzoek van de drinkwaterbedrijven een project op om te zien of je patronen kunt ontdekken en uiteindelijk ook de dynamische concentraties van de micropolluenten kunt verklaren.

Het team bekeek in totaal 196 clusters van stoffen op negentien meetplekken langs de Rijn en de Maas en vergeleken die met data van referentielijsten. ‘Het gaat dan bijvoorbeeld om referentielijsten van stoffen met gelijke toepassing’, zegt Thomas ter Laak, milieuchemicus bij KWR. ‘Uit de samenstelling van de stoffen binnen deze referentielijsten kun je informatie over de bron of emissieroute afleiden. Dicht bij de bron verwacht je dat de stoffen van de referentielijsten samen in relatief hoge concentratie voorkomen. Ga je verder van de bron vandaan, dan wordt zo’n groep stoffen door bijvoorbeeld sorptieprocessen chromatografisch uit elkaar getrokken of door biologische activiteit gedeeltelijk afgebroken.’

Genomics

Van die clusters waren er negen die op meerdere plekken een vergelijkbare samenstelling vertoonden. Zo is er een cluster met metalen waarbij je soms ook PAK’s ziet; een cluster met zouten en reactieve (alkali)metalen; herbiciden; meervoudig gechloreerde bifenylen (PCB’s), en meer. Pronk: ‘Je ziet dan stoffen met dezelfde eigenschappen – zoals allerlei varianten van hexa- en pentachlorobifenyl – die onder bepaalde omstandigheden zoals een grote regenbui in hogere concentraties in het water voorkomen.’

Ter Laak vult aan: ‘Soms wijkt een bepaalde dataset af van het normale patroon, dus dan moet er iets gebeurd zijn. Het is een soort reverse engineering, waarin je eerst een afwijking ziet en je je afvraagt wat er is gebeurd. Vervolgens maak je een hypothese en snap je wat er is gebeurd in plaats van andersom.’ Volgens Pronk zie je iets vergelijkbaars in genomicsonderzoek: ‘Eerst cluster je genen en kijk je welke informatie gemeenschappelijk is voor de genen in het cluster, vervolgens leid je daaruit af wat ze precies doen, inclusief onbekende genen.’

‘Er zitten een boel bekende stoffen in de beschikbare datasets, maar er zijn er natuurlijk nog veel meer in het water die je niet meet en dus niet ziet’, vertelt Ter Laak. ‘We meten eigenlijk maar een klein deel van alle door de mens gemaakte stoffen in het water.’

Voorspellen

Een belangrijke boodschap die Pronk en Ter Laak met hun onderzoek willen brengen is dat er ernstige vervuilingsproblemen zijn met het water. ‘Dat kun je misschien niet meteen oplossen, maar je kunt wel uitvinden waar en hoe dat gebeurt’, aldus Ter Laak. ‘Je ziet bijvoorbeeld een heel palet aan stoffen die we als maatschappij in een bijna continue flow het milieu in pompen. Daarnaast zie je stoffen die zich veel onregelmatiger in de tijd of ruimte gedragen: het loskomen van middelen uit opgewerveld sediment, afspoeling door regenval of je ziet een bepaald bestrijdingsmiddel in een specifiek seizoen.’

Het uiteindelijke doel is om met al deze data modellen te maken waarmee je zo’n influx van micropolluenten kunt voorspellen. ‘We werken bijvoorbeeld aan regressiemodellen, waarbij je meerdere factoren op elkaar stapelt om te zien of je de gedetecteerde stoffen kunt verklaren met bepaalde omstandigheden of eigenschappen van stoffen’, zegt Pronk.

‘Een voordeel van de hier toegepaste “hiërarchische” clustering is dat het onbevooroordeeld is’, legt Ter Laak uit. ‘Als milieuchemicus zoek ik automatisch naar dingen die ik ken en zo werk je niet helemaal neutraal. Zo’n clustering moet je eerst bekijken en pas daarna kun je ontdekken wat er zich allemaal afspeelt.’ Al met al zou je met deze onderzoeksmethode beter kunnen verklaren waarom je een variatie in stoffenconcentraties ziet. De onderzoekers hopen met hun werk te kunnen bijdragen aan het verbeteren van de waterkwaliteit.

Pronk, T.E. et al. (2024) Environments 11(46), DOI: 10.3390/environments11030046