Fonctions > Analyse des données > Valeurs extrêmes et NaN > Exemple : Détection des valeurs extrêmes
  
Exemple : Détection des valeurs extrêmes
Utilisez les fonctions Grubbs, GrubbsClassic, ThreeSigma et boxplot pour trouver les valeurs extrêmes en utilisant trois méthodes différentes de détection de ces valeurs.
1. Définissez un vecteur qui décrit le flux thermique.
Cliquez pour copier cette expression
2. Tracez les données et la moyenne des données.
Cliquez pour copier cette expression
Cliquez pour copier cette expression
Cliquez pour copier cette expression
Cliquez pour copier cette expression
Cliquez pour copier cette expression
Les nuages de points permettent de détecter les valeurs extrêmes potentielles. Cependant, si les valeurs extrêmes ne sont pas importantes et peu fréquentes, elles peuvent être difficiles à détecter. Vous pouvez calculer les données quantitatives afin de déterminer les points qui constituent des valeurs extrêmes.
3. Définissez le niveau de signification.
Cliquez pour copier cette expression
4. Appelez la fonction Grubbs afin d'identifier les valeurs extrêmes dans le jeu de données.
Cliquez pour copier cette expression
La première colonne fournit l'indice de chaque point identifié comme une valeur extrême (leur statistique de test dépasse la statistique de test de Grubbs).
Cliquez pour copier cette expression
Cliquez pour copier cette expression
La deuxième colonne indique la statistique de test de chaque valeur extrême (la distance entre la valeur extrême et la moyenne, en termes absolus).
Cliquez pour copier cette expression
La troisième colonne donne la distance entre chaque statistique de test de valeur extrême et la statistique de test de Grubbs.
Cliquez pour copier cette expression
5. Appelez GrubbsClassic afin de trouver le point unique le plus susceptible d'être une valeur extrême.
Cliquez pour copier cette expression
Le point dont la valeur d'indice est 19 est le susceptible d'être une valeur extrême. Les colonnes ont la même signification que celles de la matrice renvoyées par la fonction Grubbs.
6. Appelez la fonction ThreeSigma pour trouver les points de données compris dans une région de 3 sigmas.
Cliquez pour copier cette expression
Tout comme avec la fonction Grubbs, la première colonne fournit les indices et la deuxième indique les statistiques de test des valeurs extrêmes.
La statistique de test de chacun de ces points de données est supérieure à 3.
Lorsque ThreeSigma ne détecte pas de valeur extrême, le point le plus susceptible de constituer une valeur extrême est renvoyé.
7. Appelez la fonction boxplot afin de détecter les valeurs extrêmes selon la méthode d'écart interquartile et de créer une boîte à moustaches permettant de visualiser les valeurs extrêmes.
Cliquez pour copier cette expression
Cliquez pour copier cette expression
Quatre valeurs extrêmes ont été détectées à l'aide de la méthode d'écart interquartile.
Vous pouvez également détecter les valeurs extrêmes après avoir ajusté les données à une fonction en utilisant l'analyse résiduelle.