Atelier 1 : Surveillance et Diagnostic Système

Objectif

Maîtriser les outils de surveillance, identifier les problèmes de performance et interpréter les journaux système.

Exercice 1.1 : Analyse de l'Observateur d'Événements

1. Ouvrir l'Observateur d'événements :

Recherchez eventvwr dans le menu Démarrer
Ou : Clic droit sur Démarrer > Observateur d'événements

2. Navigation dans les journaux :

Développez Journaux Windows
Explorez les journaux suivants :
- Système : Événements liés au matériel, pilotes, services système
- Application : Événements des applications installées
- Sécurité : Audits de connexion, modifications de sécurité
- Installation : Événements liés à Windows Update

3. Filtrage et analyse :

Cliquez sur Système
Clic droit > Filtrer le journal actuel...
Configurez :
- Niveaux d'événement : Cochez Critique, Avertissement et Erreur
- Période : Dernières 24 heures
Cliquez sur OK

4. Création d'une vue personnalisée :

Dans le panneau Actions (droite), cliquez sur Créer une vue personnalisée...
Nom : Erreurs Critiques Système
Configurez :
- Niveaux : Critique, Erreur
- Journaux : Système, Application
- Période : Derniers 7 jours
OK puis donnez un nom : Erreurs-Critiques-7j
La vue apparaît dans Vues personnalisées

5. Analyser des événements spécifiques :

Double-clic sur un événement pour voir les détails
Notez l'Event ID, la source, et la description
Cliquez sur le lien Détails pour voir les données XML

Question d'Atelier 8

Dans le journal Système, identifiez les Event ID les plus fréquents depuis l'installation. Recherchez en ligne les Event ID suivants et expliquez leur signification :

Event ID 10016 (DistributedCOM)
Event ID 1014 (DNS Client)
Event ID 7001 (Service Control Manager)

Sont-ils préoccupants sur une installation fraîche de Windows 11 25H2 ?

Informations sur ces Event IDs

Event ID 10016 :

Source : DistributedCOM
Description : Erreur de permission DCOM
Gravité : Avertissement (généralement bénin)
Action : Généralement sans impact, peut être ignoré sur un système fraîchement installé

Event ID 1014 :

Source : DNS Client
Description : Résolution de nom échouée
Gravité : Avertissement
Action : Vérifier la connectivité réseau et les serveurs DNS configurés

Event ID 7001 :

Source : Service Control Manager
Description : Service dépendant d'un autre service qui n'a pas démarré
Gravité : Erreur
Action : Identifier le service problématique et ses dépendances

Ces événements sont relativement courants sur une nouvelle installation et ne sont généralement pas critiques.

Exercice 1.2 : Surveillance des Performances en Temps Réel

1. Ouvrir Resource Monitor :

resmon

2. Analyse des onglets :

Onglet Vue d'ensemble :

Observez les graphiques en temps réel des 4 ressources principales
Notez les processus marqués en rouge (suspendus) ou orange (limités)

Onglet Processeur :

Observez les processus consommant le plus de CPU
Notez les services associés (colonne Services)
Question : Quel processus système est toujours actif ? (Réponse : System, Idle)
Triez par "CPU moyen" pour voir l'usage sur le temps

Onglet Mémoire :

Regardez la répartition :
- En cours d'utilisation : Mémoire active
- Modifié : Mémoire modifiée non encore écrite sur disque
- En attente : Cache pouvant être libéré si nécessaire
- Libre : Mémoire immédiatement disponible

Question : Différence mémoire En attente vs Libre

Réponse sur la gestion mémoire

Mémoire Libre : Totalement vide, immédiatement disponible pour de nouvelles allocations.

Mémoire En attente (Standby) :

Contient des données en cache (ex: fichiers récemment lus)
Peut être réutilisée instantanément si l'application en a besoin
Sera libérée si un processus demande de la mémoire
Améliore les performances (évite de relire le disque)

Analogie : Mémoire libre = espace vide, Mémoire en attente = espace avec des affaires prêtes à être jetées si on a besoin de place.

3. Génération de charge pour observation :

Pour simuler une charge et observer l'impact, ouvrez PowerShell et exécutez :

# Stress test CPU (arrêtez avec Ctrl+C après 30 secondes)
while ($true) { $result = 1..1000000 | ForEach-Object { $_ * $_ } }

Pendant l'exécution, observez Resource Monitor :

Comment le CPU réagit-il ? (Devrait atteindre 100%)
La mémoire augmente-t-elle ? (Oui, légèrement)
Y a-t-il des E/S disque ? (Minimal)
Arrêtez avec Ctrl + C

4. Exporter les données pour documentation :

# Sauvegarder un snapshot des processus actifs
Get-Process | Select-Object Name, CPU, WS, PM | Export-Csv "C:\LabEDST\Logs\Processus-$(Get-Date -Format 'yyyyMMdd-HHmm').csv"

Exercice 1.3 : Performance Monitor et Compteurs

1. Lancer Performance Monitor :

perfmon

2. Créer un ensemble de collecteurs de données :

Développez Ensembles de collecteurs de données > Défini par l'utilisateur
Clic droit > Nouveau > Ensemble de collecteurs de données
Nom : Surveillance-Baseline-Lab
Sélectionnez Créer manuellement (Avancé) > Suivant
Cochez Compteur de performance > Suivant
Intervalle d'échantillonnage : 15 secondes

3. Ajout de compteurs critiques :

Cliquez sur Ajouter et ajoutez les compteurs suivants :

Processeur :

Développez Processeur > Sélectionnez % Processor Time > Instances : _Total > Ajouter
Développez Système > Sélectionnez Processor Queue Length > Ajouter

Mémoire :

Développez Mémoire > Sélectionnez :
- Available MBytes > Ajouter
- Pages/sec > Ajouter
- % Committed Bytes In Use > Ajouter

Disque physique :

Développez Disque physique > Sélectionnez :
- % Disk Time > Instances : _Total > Ajouter
- Avg. Disk Queue Length > Instances : _Total > Ajouter
- Avg. Disk sec/Read > Instances : _Total > Ajouter
- Avg. Disk sec/Write > Instances : _Total > Ajouter

Réseau :

Développez Interface réseau > Sélectionnez :
- Bytes Total/sec > Instances : Votre adaptateur réseau > Ajouter

4. Démarrer la collecte :

Clic droit sur Surveillance-Baseline-Lab > Démarrer
Laissez collecter pendant 5 minutes minimum
Pendant ce temps, utilisez normalement la machine (ouvrez des applications, naviguez)
Clic droit sur l'ensemble > Arrêter

5. Analyser les résultats :

Développez Rapports > Défini par l'utilisateur > Surveillance-Baseline-Lab
Cliquez sur le dernier rapport généré (horodatage)
Analysez les graphiques et statistiques
Notez les valeurs moyennes et maximales

Question d'Atelier 9

Sur la base de votre collecte de données, établissez votre baseline (valeurs de référence normales) pour les métriques suivantes. Ces valeurs vous serviront de référence pour détecter des anomalies futures.

Métrique	Valeur Moyenne	Valeur Max	Notes
% Processor Time	?	?	Normal : <70%
Processor Queue Length	?	?	Normal : <2
Available MBytes	?	?	Normal : >20% RAM totale
Pages/sec	?	?	Normal : <10
% Disk Time	?	?	Normal : <80%
Avg. Disk Queue Length	?	?	Normal : <2

Complétez ce tableau avec vos valeurs.

Exercice 1.4 : Analyse du Moniteur de Fiabilité

1. Ouvrir le Moniteur de fiabilité :

Méthode 1 : Recherchez perfmon /rel dans le menu Démarrer
Méthode 2 : Panneau de configuration > Système et sécurité > Sécurité et maintenance > Maintenance > Afficher l'historique de fiabilité

2. Analyse de l'historique :

Observez l'Index de stabilité (échelle 1-10) sur les derniers jours
L'index devrait être à 10 sur une installation fraîche
Identifiez les événements marquants avec les icônes :
- ⓘ Informations (en bleu)
- ⚠ Avertissements (en jaune)
- ✖ Erreurs critiques (en rouge)

3. Détails des événements :

Cliquez sur une barre de date pour voir les événements du jour
Développez chaque catégorie :
- Défaillances d'application : Crashes d'applications
- Défaillances Windows : Erreurs système, mises à jour échouées
- Défaillances diverses : Arrêts incorrects, échecs matériels
- Avertissements : Problèmes non critiques
- Informations : Installations réussies, mises à jour

4. Analyser l'impact sur l'index :

Cliquez sur "Jours à réviser" si disponible
Notez comment différents événements affectent l'index

5. Génération de rapport :

En bas, cliquez sur Afficher tous les rapports de problèmes
Vous voyez l'historique complet de tous les problèmes signalés
Pour exporter : Cliquez sur un problème > Copier dans le Presse-papiers

Cas pratique pour comprendre : L'index de fiabilité est calculé ainsi :

Départ à 10 (système parfait)
Chaque erreur critique réduit l'index
L'index remonte progressivement si pas de nouveaux problèmes
Index < 7 pendant plusieurs jours = investigation nécessaire