Unsupervised Learning
iaDéfinition
Apprentissage machine sans labels : le modèle découvre la structure sous-jacente des données (clusters, dimensions latentes) via des algorithmes comme k-means, PCA ou autoencoders.
Description
L'Unsupervised Learning est l'apprentissage machine sans labels : le modèle découvre automatiquement la structure sous-jacente des données non annotées. Les algorithmes de clustering (k-means, DBSCAN), de réduction de dimensionnalité (PCA, t-SNE, UMAP) et les autoencoders en sont les principales techniques.
Fonctionnement
K-means regroupe les points en K clusters minimisant la distance intra-cluster. PCA projette les données sur des composantes orthogonales de variance maximale. Les autoencoders apprennent une représentation compressée en encodant puis décodant les données pour minimiser l'erreur de reconstruction.
Points clés
- Essentiel pour la détection d'anomalies réseau : les comportements anormaux dévient significativement des clusters appris
- Utilisé pour le clustering de malwares par comportement sans nécessiter d'expertise préalable pour labelliser
- La qualité des résultats dépend fortement du choix de représentation des données et des hyperparamètres
Besoin d'un expert sur ce sujet ?
Audit, pentest, conformité ISO 27001, développement IA sécurisé — demandez un devis gratuit.
Demander un devis