1. Defina un vector que describa el flujo de calor.
2. Trace los datos y su media.
Los gráficos de dispersión son útiles para detectar potenciales valores atípicos. No obstante, los valores atípicos pueden ser difíciles de detectar cuando no son graves e inusuales. Se puede calcular la métrica cuantitativa para determinar qué puntos son valores atípicos.
3. Defina el nivel de relevancia.
4. Llame a la función Grubbs para identificar los valores atípicos del conjunto de datos.
En la primera columna se indica el índice de cada punto identificado como un valor atípico (su estadística de prueba supera la estadística de prueba de Grubbs).
En la segunda columna se indica la estadística de prueba de cada valor atípico (la distancia del valor atípico con respecto a la media, en términos absolutos).
En la tercera columna se indica la distancia de la estadística de prueba de cada valor atípico con respecto a la estadística de prueba de Grubbs.
5. Llame a GrubbsClassic para buscar el punto único con más probabilidades de ser un valor atípico.
El punto que tenga un valor de índice 19 es el valor atípico más probable. Las columnas tienen el mismo significado que las columnas de la matriz que devuelve la función Grubbs.
6. Llame a la función ThreeSigma para buscar los puntos de datos que no se encuentren en la región de 3 sigma.
Al igual que en el caso de la función Grubbs, en la primera columna se indican los índices y, en la segunda, las estadísticas de prueba de los valores atípicos.
La estadística de prueba de cada uno de estos puntos de datos es mayor que 3.
Si ThreeSigma no detecta ningún valor atípico, devuelve el punto que más se acerque a un valor atípico.
7. Llame a la función boxplot para detectar valores atípicos según el método de rango intercuartílico y cree un gráfico de caja para ver dichos valores.
Se han detectado cuatro valores atípicos con el método de rango intercuartílico.
Los valores atípicos también se pueden detectar tras ajustar datos a una función mediante el análisis residual.