Rilevamento e rimozione di outlier
Le funzioni Grubbs, GrubbsClassic e ThreeSigma rilevano gli outlier negli insiemi di dati. La funzione trim rimuove le righe con gli indici specificati da un insieme di dati.
• Grubbs(v, a) - Restituisce l'indice dei potenziali outlier, la statistica del test per tali outlier e la relativa distanza dalla statistica critica, per la probabilità a che i dati assumano in modo casuale un valore dato.
• GrubbsClassic(v, a) - Restituisce l'indice del punto dati che ha maggiori probabiltà di essere un outlier, la statistica del test e la relativa distanza dalla statistica critica, per la probabilità a che i dati assumano in modo casuale un valore dato.
• ThreeSigma(v) - Restituisce gli indici dei punti di v con statistica di test maggiore di 3 e il valore di tale quantità per ogni punto.
• trim(v, vindex) - Esclude le voci (righe) specificate da vindex.
La statistica del test utilizzata per rilevare gli outlier è la distanza di un punto dalla media dell'insieme di dati, divisa per la deviazione standard.
Se al posto di un vettore si utilizza una matrice reale, le funzioni che rilevano gli outlier restituiscono le coppie di indici di ogni potenziale outlier come matrici annidate.
Argomenti
• v è una matrice o un vettore reale che rappresenta i punti dati.
• a è una probabilità tale che 0 < a < 1.
• vindex è un vettore con valori interi. Gli indici specificati in vindex sono relativi a ORIGIN.