/>

Atelier 1 : Surveillance et Diagnostic Système

Jour 1 - Durée : 2 heures

Objectif

Maîtriser les outils de surveillance, identifier les problèmes de performance et interpréter les journaux système.

Exercice 1.1 : Analyse de l'Observateur d'Événements

1. Ouvrir l'Observateur d'événements :

2. Navigation dans les journaux :

3. Filtrage et analyse :

  1. Cliquez sur Système
  2. Clic droit > Filtrer le journal actuel...
  3. Configurez :
    • Niveaux d'événement : Cochez Critique, Avertissement et Erreur
    • Période : Dernières 24 heures
  4. Cliquez sur OK

4. Création d'une vue personnalisée :

  1. Dans le panneau Actions (droite), cliquez sur Créer une vue personnalisée...
  2. Nom : Erreurs Critiques Système
  3. Configurez :
    • Niveaux : Critique, Erreur
    • Journaux : Système, Application
    • Période : Derniers 7 jours
  4. OK puis donnez un nom : Erreurs-Critiques-7j
  5. La vue apparaît dans Vues personnalisées

5. Analyser des événements spécifiques :

Question d'Atelier 8

Dans le journal Système, identifiez les Event ID les plus fréquents depuis l'installation. Recherchez en ligne les Event ID suivants et expliquez leur signification :

  • Event ID 10016 (DistributedCOM)
  • Event ID 1014 (DNS Client)
  • Event ID 7001 (Service Control Manager)

Sont-ils préoccupants sur une installation fraîche de Windows 11 25H2 ?

Informations sur ces Event IDs

Event ID 10016 :

  • Source : DistributedCOM
  • Description : Erreur de permission DCOM
  • Gravité : Avertissement (généralement bénin)
  • Action : Généralement sans impact, peut être ignoré sur un système fraîchement installé

Event ID 1014 :

  • Source : DNS Client
  • Description : Résolution de nom échouée
  • Gravité : Avertissement
  • Action : Vérifier la connectivité réseau et les serveurs DNS configurés

Event ID 7001 :

  • Source : Service Control Manager
  • Description : Service dépendant d'un autre service qui n'a pas démarré
  • Gravité : Erreur
  • Action : Identifier le service problématique et ses dépendances

Ces événements sont relativement courants sur une nouvelle installation et ne sont généralement pas critiques.

Exercice 1.2 : Surveillance des Performances en Temps Réel

1. Ouvrir Resource Monitor :

resmon

2. Analyse des onglets :

Onglet Vue d'ensemble :

Onglet Processeur :

Onglet Mémoire :

Question : Différence mémoire En attente vs Libre

Réponse sur la gestion mémoire

Mémoire Libre : Totalement vide, immédiatement disponible pour de nouvelles allocations.

Mémoire En attente (Standby) :

  • Contient des données en cache (ex: fichiers récemment lus)
  • Peut être réutilisée instantanément si l'application en a besoin
  • Sera libérée si un processus demande de la mémoire
  • Améliore les performances (évite de relire le disque)

Analogie : Mémoire libre = espace vide, Mémoire en attente = espace avec des affaires prêtes à être jetées si on a besoin de place.

3. Génération de charge pour observation :

Pour simuler une charge et observer l'impact, ouvrez PowerShell et exécutez :

# Stress test CPU (arrêtez avec Ctrl+C après 30 secondes) while ($true) { $result = 1..1000000 | ForEach-Object { $_ * $_ } }

Pendant l'exécution, observez Resource Monitor :

4. Exporter les données pour documentation :

# Sauvegarder un snapshot des processus actifs Get-Process | Select-Object Name, CPU, WS, PM | Export-Csv "C:\LabEDST\Logs\Processus-$(Get-Date -Format 'yyyyMMdd-HHmm').csv"

Exercice 1.3 : Performance Monitor et Compteurs

1. Lancer Performance Monitor :

perfmon

2. Créer un ensemble de collecteurs de données :

  1. Développez Ensembles de collecteurs de données > Défini par l'utilisateur
  2. Clic droit > Nouveau > Ensemble de collecteurs de données
  3. Nom : Surveillance-Baseline-Lab
  4. Sélectionnez Créer manuellement (Avancé) > Suivant
  5. Cochez Compteur de performance > Suivant
  6. Intervalle d'échantillonnage : 15 secondes

3. Ajout de compteurs critiques :

Cliquez sur Ajouter et ajoutez les compteurs suivants :

Processeur :

Mémoire :

Disque physique :

Réseau :

4. Démarrer la collecte :

  1. Clic droit sur Surveillance-Baseline-Lab > Démarrer
  2. Laissez collecter pendant 5 minutes minimum
  3. Pendant ce temps, utilisez normalement la machine (ouvrez des applications, naviguez)
  4. Clic droit sur l'ensemble > Arrêter

5. Analyser les résultats :

  1. Développez Rapports > Défini par l'utilisateur > Surveillance-Baseline-Lab
  2. Cliquez sur le dernier rapport généré (horodatage)
  3. Analysez les graphiques et statistiques
  4. Notez les valeurs moyennes et maximales

Question d'Atelier 9

Sur la base de votre collecte de données, établissez votre baseline (valeurs de référence normales) pour les métriques suivantes. Ces valeurs vous serviront de référence pour détecter des anomalies futures.

Métrique Valeur Moyenne Valeur Max Notes
% Processor Time ? ? Normal : <70%
Processor Queue Length ? ? Normal : <2
Available MBytes ? ? Normal : >20% RAM totale
Pages/sec ? ? Normal : <10
% Disk Time ? ? Normal : <80%
Avg. Disk Queue Length ? ? Normal : <2

Complétez ce tableau avec vos valeurs.

Exercice 1.4 : Analyse du Moniteur de Fiabilité

1. Ouvrir le Moniteur de fiabilité :

2. Analyse de l'historique :

3. Détails des événements :

4. Analyser l'impact sur l'index :

5. Génération de rapport :

Cas pratique pour comprendre : L'index de fiabilité est calculé ainsi :

  • Départ à 10 (système parfait)
  • Chaque erreur critique réduit l'index
  • L'index remonte progressivement si pas de nouveaux problèmes
  • Index < 7 pendant plusieurs jours = investigation nécessaire