De tegenhanger van supervised learning is unsupervised learning. Dit is een type machine learning waarbij modellen worden getraind op gegevens die niet gelabeld zijn. Dit betekent dat de uitkomsten of categorieën van de gegevens niet vooraf zijn gedefinieerd, waardoor het model zelf patronen, structuren of relaties in de data moet ontdekken. Het verschil met supervised learning ligt in het feit dat unsupervised learning niet gericht is op het voorspellen van een specifieke uitkomst, maar eerder op het verkennen van de data zelf.
Werking van unsupervised learning
In unsupervised learning wordt de dataset aangeboden zonder enige begeleiding of labels die aangeven wat correct of incorrect is. Het algoritme probeert zelfstandig structuur in de data te vinden door de gegevens te analyseren en te groeperen op basis van overeenkomsten, verschillen, en patronen. Deze aanpak is bijzonder nuttig voor het verkennen van complexe datasets en het onthullen van verborgen inzichten die niet direct zichtbaar zijn.
Toepassingen van unsupervised learning
Unsupervised learning wordt gebruikt in een verscheidenheid aan domeinen, waaronder:
- Clusteranalyse: deze techniek groepeert data in subsets (clusters) die significante overeenkomsten hebben. Dit wordt vaak gebruikt in marktsegmentatie, sociale netwerkanalyse, en het organiseren van grote datasets.
- Anomaliedetectie: unsupervised learning kan ongebruikelijke patronen of afwijkingen in datasets identificeren. Dit is nuttig voor fraudepreventie, netwerkbeveiliging, en het opsporen van zeldzame gebeurtenissen in medische data.
- Associatieregels: het algoritme identificeert relaties tussen variabelen in de dataset. Een klassiek voorbeeld is marktmandanalyse, waarbij wordt gezocht naar combinaties van producten die vaak samen worden gekocht.
- Dimensionaliteitsreductie: technieken zoals principal component analysis (PCA) worden gebruikt om de complexiteit van datasets te verminderen door de meest informatieve kenmerken te behouden. Dit maakt het eenvoudiger om gegevens te visualiseren en te analyseren.
Typen unsupervised learning
Er zijn verschillende benaderingen binnen unsupervised learning, waaronder:
- Clustering: het proces van het groeperen van een set objecten zodanig dat objecten in hetzelfde cluster meer op elkaar lijken dan op objecten in andere clusters.
- Associatie: het ontdekken van regels die variabelen in een dataset aan elkaar koppelen, wat vaak gebruikt wordt voor marktbasketanalyse.