Funzioni > Analisi dati > Outlier e NaN > Esempio: rilevamento di outlier
  
Esempio: rilevamento di outlier
Utilizzare le funzioni Grubbs, GrubbsClassic, ThreeSigma e boxplot per trovare gli outlier utilizzando tre diversi metodi di rilevamento degli outlier.
1. Definire un vettore che descriva il flusso di calore.
Fare clic per copiare questa espressione
2. Tracciare il grafico dei dati e della media dei dati.
Fare clic per copiare questa espressione
Fare clic per copiare questa espressione
Fare clic per copiare questa espressione
Fare clic per copiare questa espressione
Fare clic per copiare questa espressione
I grafici della dispersione sono utili per individuare outlier potenziali, ma a meno che non si tratti di outlier gravi e infrequenti, questi dati possono essere difficili da individuare. È possibile calcolare criteri di misurazione quantitativi per determinare quali punti rappresentano outlier.
3. Definire il livello di significatività.
Fare clic per copiare questa espressione
4. Chiamare la funzione Grubbs per identificare gli outlier nell'insieme di dati.
Fare clic per copiare questa espressione
La prima colonna indica l'indice di ogni punto identificato come outlier (la relativa statistica di test supera la statistica del test di Grubbs).
Fare clic per copiare questa espressione
Fare clic per copiare questa espressione
La seconda colonna indica la statistica di test per ogni outlier (la distanza dell'outlier dalla media, in termini assoluti).
Fare clic per copiare questa espressione
La terza colonna indica la distanza della statistica di test di ogni outlier dalla statistica del test di Grubbs.
Fare clic per copiare questa espressione
5. Chiamare la funzione GrubbsClassic per trovare il singolo punto che con maggiore probabilità costituisce un outlier.
Fare clic per copiare questa espressione
Il punto con il valore di indice 19 è quello che con maggiore probabilità costituisce un outlier. Le colonne hanno lo stesso significato di quelle della matrice restituita dalla funzione Grubbs.
6. Chiamare la funzione ThreeSigma per trovare i punti dati che non rientrano nella regione 3 sigma.
Fare clic per copiare questa espressione
Come nel caso della funzione Grubbs, la prima colonna indica gli indici e la seconda le statistiche di test degli outlier.
La statistica di test per ognuno di questi punti dati è maggiore di 3.
Quando ThreeSigma non rileva alcun outlier, viene restituito il punto più vicino a essere un outlier.
7. Chiamare la funzione boxplot per rilevare gli outlier in base al metodo dell'intervallo interquartile e creare un box plot per visualizzare gli outlier.
Fare clic per copiare questa espressione
Fare clic per copiare questa espressione
Utilizzando il metodo dell'intervallo interquartile sono stati rilevati quattro outlier.
È possibile rilevare gli outlier anche dopo avere adattato i dati a una funzione utilizzando l'analisi dei residui.