Fonctions > Analyse des données > Valeurs extrêmes et NaN > Exemple : Méthode de Grubbs pour la détection des valeurs extrêmes
Exemple : Méthode de Grubbs pour la détection des valeurs extrêmes
Statistiques de test de Grubbs
Calculez les statistiques de test de Grubbs, comme dans la fonction Grubbs, pour détecter les valeurs extrêmes. Comparez les statistiques de test de Grubbs avec les statistiques de test des valeurs extrêmes.
1. Définissez un ensemble de données décrivant l'expérience du flux thermique et tracez-le.
Cliquez pour copier cette expression
Cliquez pour copier cette expression
Cliquez pour copier cette expression
Cliquez pour copier cette expression
Cliquez pour copier cette expression
Cliquez pour copier cette expression
2. Définissez la valeur critique de la distribution t de Student avec N - 2 degrés de liberté et un niveau de signification de alpha/(2N).
Cliquez pour copier cette expression
* 
La fonction qt calcule la densité de probabilité cumulée inverse de la distribution t de Student.
3. Définissez les statistiques de test de Grubbs comme fonction d'alpha.
Cliquez pour copier cette expression
4. Définissez le niveau de signification pour un niveau de confiance de 90 %.
Cliquez pour copier cette expression
5. Appelez la fonction Grubbs pour détecter les valeurs extrêmes.
Cliquez pour copier cette expression
La fonction Grubbs peut accepter une matrice comme entrée. Dans ce cas, elle renvoie les paires d'indices imbriquées pour les emplacements de tableau des valeurs extrêmes.
6. Comparez les statistiques de test de Grubbs avec les statistiques de test des valeurs extrêmes.
Cliquez pour copier cette expression
Les deux valeurs extrêmes comportent une statistique de test supérieure à la statistique de test de Grubbs. Même si plusieurs indices sont renvoyés, cela ne signifie pas que tous les candidats doivent être des valeurs extrêmes. C'est parce que la valeur critique et la statistique de test changent si un candidat est supprimé. Toutes deux dépendent de N.
Etant donné que le test de Grubbs suppose que les données sont normales, il convient de vérifier que vos données suivent une distribution normale. Par exemple, vous pouvez utiliser un test visuel tel que le tracé de probabilité normale avant de continuer.
GrubbsClassic
Utilisez la fonction GrubbsClassic pour trouver le point le plus susceptible de constituer une valeur extrême dans un jeu de données.
1. Calculez la statistique de test la plus élevée pour le jeu de données ci-dessus.
Cliquez pour copier cette expression
2. Définissez alpha pour un intervalle de confiance de 98 %.
Cliquez pour copier cette expression
3. Comparez les statistiques de test de Grubbs avec Gmax.
Cliquez pour copier cette expression
Cliquez pour copier cette expression
Aucune valeur extrême n'est détectée à ce niveau de signification.
4. Appelez la fonction GrubbsClassic.
Cliquez pour copier cette expression
Le point renvoyé GrubbsClassic n'est pas une valeur extrême mais correspond au point de données le plus susceptible d'être une valeur extrême.
Probabilité limite de détection des valeurs extrêmes
Utilisez la construction spéciale root pour calculer la probabilité limite à laquelle les valeurs extrêmes sont détectées.
Cliquez pour copier cette expression
Les valeurs extrêmes sont détectées lorsqu'alpha est supérieur à α_limite, autrement dit, lorsque l'intervalle de confiance est inférieur à (1 - α_limite) :
Cliquez pour copier cette expression
Ceci est cohérent avec les résultats ci-dessus. Aucune valeur extrême n'a été détectée pour un intervalle de confiance de 98 %. Cependant, deux valeurs extrêmes ont été détectées pour un intervalle de confiance de 90 %.
Est-ce que cela a été utile ?