Détection et suppression des valeurs extrêmes
Les fonctions Grubbs, GrubbsClassic et ThreeSigma détectent les valeurs extrêmes dans les jeux de données. La fonction trim supprime d'un jeu de données les lignes avec les indices spécifiés.
• Grubbs(v, a) : renvoie l'indice des valeurs susceptibles d'être extrêmes, les statistiques de test correspondantes et l'écart par rapport aux statistiques critiques, pour la probabilité a que les données prennent une valeur donnée de manière aléatoire.
• GrubbsClassic(v, a) : renvoie l'indice du point de données le plus susceptible d'être une valeur extrême, ses statistiques de test et l'écart par rapport aux statistiques critiques, pour la probabilité a que les données prennent une valeur donnée de manière aléatoire.
• ThreeSigma(v) : renvoie les indices des points dans v, dont les statistiques de test sont supérieures à trois, et la valeur de cette quantité pour chaque point.
• trim(v, vindex) : coupe les entrées (lignes) spécifiées par vindex.
Les statistiques de test utilisées pour détecter les valeurs extrêmes correspondent à la distance entre un point et la moyenne du jeu de données, divisée par l'écart-type.
Lorsqu'une matrice réelle est utilisée à la place d'un vecteur, les fonctions qui détectent les valeurs extrêmes renvoient la paire d'indices pour chaque valeur extrême possible sous forme de matrices imbriquées.
Arguments
• v est une matrice ou un vecteur réel représentant les points de données.
• a est une probabilité comprise entre 0 < a < 1.
• vindex est un vecteur à valeurs entières. Les indices spécifiés dans vindex sont relatifs à ORIGIN.