Funciones > Análisis de datos > Valores atípicos y constante NaN > Ejemplo: detección de valores atípicos
  
Ejemplo: detección de valores atípicos
Utilice las funciones Grubbs, GrubbsClassic, ThreeSigma y boxplot para buscar valores atípicos mediante tres métodos diferentes.
1. Defina un vector que describa el flujo de calor.
Pulse aquí para copiar esta expresión
2. Trace los datos y su media.
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
Los gráficos de dispersión son útiles para detectar potenciales valores atípicos. No obstante, los valores atípicos pueden ser difíciles de detectar cuando no son graves e inusuales. Se puede calcular la métrica cuantitativa para determinar qué puntos son valores atípicos.
3. Defina el nivel de relevancia.
Pulse aquí para copiar esta expresión
4. Llame a la función Grubbs para identificar los valores atípicos del conjunto de datos.
Pulse aquí para copiar esta expresión
En la primera columna se indica el índice de cada punto identificado como un valor atípico (su estadística de prueba supera la estadística de prueba de Grubbs).
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
En la segunda columna se indica la estadística de prueba de cada valor atípico (la distancia del valor atípico con respecto a la media, en términos absolutos).
Pulse aquí para copiar esta expresión
En la tercera columna se indica la distancia de la estadística de prueba de cada valor atípico con respecto a la estadística de prueba de Grubbs.
Pulse aquí para copiar esta expresión
5. Llame a GrubbsClassic para buscar el punto único con más probabilidades de ser un valor atípico.
Pulse aquí para copiar esta expresión
El punto que tenga un valor de índice 19 es el valor atípico más probable. Las columnas tienen el mismo significado que las columnas de la matriz que devuelve la función Grubbs.
6. Llame a la función ThreeSigma para buscar los puntos de datos que no se encuentren en la región de 3 sigma.
Pulse aquí para copiar esta expresión
Al igual que en el caso de la función Grubbs, en la primera columna se indican los índices y, en la segunda, las estadísticas de prueba de los valores atípicos.
La estadística de prueba de cada uno de estos puntos de datos es mayor que 3.
Si ThreeSigma no detecta ningún valor atípico, devuelve el punto que más se acerque a un valor atípico.
7. Llame a la función boxplot para detectar valores atípicos según el método de rango intercuartílico y cree un gráfico de caja para ver dichos valores.
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
Se han detectado cuatro valores atípicos con el método de rango intercuartílico.
Los valores atípicos también se pueden detectar tras ajustar datos a una función mediante el análisis residual.