Funciones > Análisis de datos > Valores atípicos y constante NaN > Detección y eliminación de valores atípicos
  
Detección y eliminación de valores atípicos
Las funciones Grubbs, GrubbsClassic y ThreeSigma detectan los avalores atípicos en los conjuntos de datos. La función trim quita las filas con índices especificados de un conjunto de datos.
Grubbs(v, a): permite devolver el índice de posibles valores atípicos, la estadística de prueba para el valor atípico y su distancia respecto a la estadística crítica, en relación con la probabilidad a de que los datos tengan un valor determinado aleatoriamente.
GrubbsClassic(v, a): permite devolver el índice del punto de datos que tenga mayor probabilidad de ser un valor atípico, su estadística de prueba y su distancia respecto a la estadística crítica, en relación con la probabilidad a de que los datos tengan un valor determinado aleatoriamente.
ThreeSigma(v): permite devolver índices de puntos en v con una estadística de prueba mayor que tres y el valor de esta cantidad para cada punto.
trim(v, vindex): recorta las entradas (filas) especificadas por vindex.
La estadística de prueba utilizada para detectar los valores atípicos es la distancia entre un punto y la media del conjunto de datos, dividida entre la desviación estándar.
Si se utiliza una matriz real en lugar de un vector, las funciones que detecten valores atípicos devolverán el par de índices para cada valor atípico candidato como matriz anidada.
Argumentos
v es una matriz o un vector real que representa puntos de datos.
a es una probabilidad comprendida entre 0 < a < 1.
vindex es un vector de valores numéricos enteros. Los índices especificados en vindex son relativos a ORIGIN.