Deep Explorations: an exporative study for machine learning an deep learning applications in the water sector
Details
Hydroinformatics
Rapporten
Deep learning (DL) is a class of techniques that turns out to be highly effective in applications like image and speech processing. In these applications, DL techniques beat more traditional artificial neural networks (ANN) relying on a limited number of hidden layers or other algorithms such as Random Forest or Support Vector Machine (SVM). DL is a family of machine learning (ML) algorithms based on (deep) artificial neural networks (i.e., multi-layer neural networks). DL is able to derive more complex relations between input and output than other ML techniques. To do this, DL requires more data, which can be a drawback. Because of its successful applications in image and speech processing (e.g., face recognition, auto-translating), DL has been widely applied to many other fields as well.
This study aims to conduct an explorative study to assess the value of deep learning (DL) for KWR and the water sector in general, by investigating different types of deep learning and their strengths and weaknesses for water- related applications. This fits very well within the trend at KWR and the water sector as a whole, where more and more often ML approaches show their potentials to be used to answer (research) questions. To do so, we illustrate the value of DL via two main case studies: (1) datamining in customer complaints received by drinking water utilities about pipe failure data and water quality measurements, and (2) datamining in infrared spectroscopy for microplastics analysis and polymer classification, which can later be extended to other areas, such as chromatography, UV adsorption and pattern recognition in data sets.
With the experience gained with these use cases, DL will become an essential tool in the researcher’s toolbox, for solving practical problems of water utilities. As such, it will be recognized when it is a proper tool to address different problems across the water sector. As is also reflected by the two selected case studies.
Voor de watersector kan machine learning (ML) en deep learning (DL) van grote waarde zijn om problemen op het gebied van classificatie, regressie of besluitvorming aan te pakken. Dit blijkt uit verkennende studie naar de mogelijkheid om ML/DL toe te voegen als instrument in de gereedschapskist voor onze onderzoekers. Cases zijn bestudeerd met het oog op de geautomatiseerde verwerking van klantmeldingen van drinkwaterbedrijven en de identificatie van microplastics in het milieu. Sinds 2016 is DL uitgegroeid tot een van de meest populaire onderwerpen in verschillende wetenschappen. DL, of breder, ML, is een krachtige methode voor het omgaan met grote reeksen gegevens en is dus in potentie ook interessant voor de watersector. Zo kan DL bijvoorbeeld worden toegepast om visuele data te analyseren voor identificatie van landgebruik en waterlekken, de beoordeling van de toestand van leidingen of de detectie van flocculatie bij waterbehandeling. Wat tekstanalyse betreft, kan DL worden gebruikt voor literatuurstudies, waarbij onderzoekers worden geholpen om wetenschappelijke publicaties efficiënter te doorzoeken. Een beperkende factor in het gebruik van ML en DL voor de watersector is een gebrek aan hoogwaardige gegevens. Daarom moet bij ontwikkelaars en gebruikers van de modellen hier prioriteit aan worden gegeven.