BTO rapport - BTO 2022.044

Text-mining voor vroege detectie van relevante waterverontreinigingen

Rapporten

Aanwijzingen voor (toekomstige) waterverontreiniging kunnen flink verstopt zijn in diverse bronnen met digitaal beschikbare tekst, van rapporten tot social media. Het lezen en verwerken van tekst in dit soort bronnen om te zoeken naar aanwijzingen voor toekomstige waterverontreiniging is tijdrovend. De techniek text-mining wordt gebruikt voor het automatisch doorzoeken en verwerken van teksten. In potentie kan deze techniek gewenste informatie uit teksten halen en netjes op een rij zetten, zonder dat de (gehele) tekst door een persoon gelezen hoeft te worden. Dit kan veel tijdwinst opleveren. Er zijn vele technieken en toepassingen denkbaar. Dit rapport laat zien dat verschillende technieken kunnen worden ingezet om tekstbronnen te toetsen op het bevatten van informatie rond chemische waterverontreinigingen. Het is vervolgens aan een expert om de informatie te interpreteren en vervolgacties te nemen. Met behulp van het geleverde overzicht van technieken en bronnen, met voorbeelden van de opbrengsten en de opgeleverde R-scripts met code kunnen de technieken in de toekomst verder worden uitgewerkt.

Download pdf
Heeft u een vraag over deze publicatie?