1. Definire un vettore che descriva il flusso di calore.
2. Tracciare il grafico dei dati e della media dei dati.
I grafici della dispersione sono utili per individuare outlier potenziali, ma a meno che non si tratti di outlier gravi e infrequenti, questi dati possono essere difficili da individuare. È possibile calcolare criteri di misurazione quantitativi per determinare quali punti rappresentano outlier.
3. Definire il livello di significatività.
4. Chiamare la funzione Grubbs per identificare gli outlier nell'insieme di dati.
La prima colonna indica l'indice di ogni punto identificato come outlier (la relativa statistica di test supera la statistica del test di Grubbs).
La seconda colonna indica la statistica di test per ogni outlier (la distanza dell'outlier dalla media, in termini assoluti).
La terza colonna indica la distanza della statistica di test di ogni outlier dalla statistica del test di Grubbs.
5. Chiamare la funzione GrubbsClassic per trovare il singolo punto che con maggiore probabilità costituisce un outlier.
Il punto con il valore di indice 19 è quello che con maggiore probabilità costituisce un outlier. Le colonne hanno lo stesso significato di quelle della matrice restituita dalla funzione Grubbs.
6. Chiamare la funzione ThreeSigma per trovare i punti dati che non rientrano nella regione 3 sigma.
Come nel caso della funzione Grubbs, la prima colonna indica gli indici e la seconda le statistiche di test degli outlier.
La statistica di test per ognuno di questi punti dati è maggiore di 3.
Quando ThreeSigma non rileva alcun outlier, viene restituito il punto più vicino a essere un outlier.
7. Chiamare la funzione boxplot per rilevare gli outlier in base al metodo dell'intervallo interquartile e creare un box plot per visualizzare gli outlier.
Utilizzando il metodo dell'intervallo interquartile sono stati rilevati quattro outlier.
È possibile rilevare gli outlier anche dopo avere adattato i dati a una funzione utilizzando l'analisi dei residui.