Funciones > Análisis de datos > Valores atípicos y constante NaN > Ejemplo: método de Grubbs para detectar valores atípicos
Ejemplo: método de Grubbs para detectar valores atípicos
Estadística de prueba de Grubbs
Calcule la estadística de prueba de Grubbs, tal como la usa la función Grubbs, para detectar valores atípicos. Compare la estadística de prueba de Grubbs con la estadística de prueba de los valores atípicos.
1. Defina un conjunto de datos que describa el experimento de flujo de calor y trácelo.
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
2. Defina el valor crítico de la distribución t de Student con N - 2 grados de libertad de movimiento y un nivel de significancia de alpha/(2N).
Pulse aquí para copiar esta expresión
* 
La función qt calcula la densidad de probabilidad acumulada inversa de la distribución t de Student.
3. Defina la estadística de prueba de Grubbs como una función alfa.
Pulse aquí para copiar esta expresión
4. Defina el nivel de significancia para un nivel de confianza del 90 %.
Pulse aquí para copiar esta expresión
5. Llame a la función Grubbs para detectar valores atípicos.
Pulse aquí para copiar esta expresión
La función Grubbs acepta matrices como entrada y, en ese caso, devuelve pares de índices anidados para las ubicaciones en el array de los valores atípicos.
6. Compare la estadística de prueba de Grubbs con las estadísticas de prueba de los valores atípicos.
Pulse aquí para copiar esta expresión
Los dos valores atípicos tienen una estadística de prueba mayor que la estadística de prueba de Grubbs. Aunque se devuelvan varios índices, no significa que todos los candidatos tengan que ser valores atípicos. Esto se debe a que el valor crítico y la estadística de prueba cambian cuando se quita un candidato. Ambos dependen de N.
Dado que la prueba de Grubbs supone que los datos son normales, es recomendable comprobar si los datos siguen una distribución normal. Por ejemplo, se puede utilizar una prueba visual, tal como el gráfico de probabilidad normal, antes de continuar.
GrubbsClassic
Utilice la función GrubbsClassic para buscar el punto que tiene más probabilidades de ser un valor atípico en un conjunto de datos.
1. Calcule la estadística de prueba superior del conjunto de datos anterior.
Pulse aquí para copiar esta expresión
2. Defina alfa para un intervalo de confianza del 98 %.
Pulse aquí para copiar esta expresión
3. Compare la estadística de prueba de Grubbs con Gmax.
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
No se ha detectado ningún valor atípico en este nivel de relevancia.
4. Llame a la función GrubbsClassic.
Pulse aquí para copiar esta expresión
El punto devuelto por GrubbsClassic no es un valor atípico, sino el punto de datos con más probabilidades de ser un valor atípico.
Probabilidad límite de detección de valores atípicos
Utilice la creación especial root para calcular la probabilidad límite en la que se detectan valores atípicos.
Pulse aquí para copiar esta expresión
Los valores atípicos se detectan cuando alfa es mayor que α_limit o, en otras palabras, cuando el intervalo de confianza es menor que (1 - α_limit):
Pulse aquí para copiar esta expresión
Esto es coherente con los hallazgos anteriores. No se han detectado valores atípicos para un intervalo de confianza del 98 %, pero sí se han detectado dos valores atípicos para un intervalo de confianza del 90 %.
¿Fue esto útil?