Funzioni > Analisi dati > Outlier e NaN > Esempio: rilevamento e rimozione di NaN
  
Esempio: rilevamento e rimozione di NaN
Utilizzare la funzione markNaN per contrassegnare gli outlier come NaN (Not a Number) negli insiemi di dati. Utilizzare le funzioni IsNaN, matchNaN e filterNaN per gestire i valori NaN.
1. Leggere un file contenente il numero di macchie solari registrate nel corso degli ultimi tre secoli e tracciare il grafico dei dati.
Fare clic per copiare questa espressione
Fare clic per copiare questa espressione
2. Utilizzare la funzione ThreeSigma per trovare gli indici degli outlier.
Fare clic per copiare questa espressione
Gli outlier sono il numero di macchie solari registrate durante l'anno successivo:
Fare clic per copiare questa espressione
Fare clic per copiare questa espressione
3. Utilizzare la funzione markNaN per contrassegnare come NaN gli outlier nella colonna 1 dei dati.
Fare clic per copiare questa espressione
Fare clic per copiare questa espressione
La sostituzione dei dati con valori NaN indica che è stata effettuata una misura, ma che le righe contenenti valori NaN possono essere escluse tramite filtro prima dell'elaborazione.
4. Utilizzare la funzione matchNaN per trovare gli indici delle macchie contrassegnate come NaN.
Fare clic per copiare questa espressione
I dati nelle righe 257 e 278 sono stati sostituiti dalla costante incorporata NaN.
5. Utilizzare la funzione IsNaN per controllare se l'anno 1957 è stato contrassegnato come NaN negli insiemi Data e MarkedData.
Fare clic per copiare questa espressione
Fare clic per copiare questa espressione
6. Tracciare il grafico del nuovo insieme di dati e confrontarlo con l'insieme precedente.
Fare clic per copiare questa espressione
Gli outlier dell'insieme di dati originale non sono evidenziati in blu, in quanto il grafico ignora i valori NaN registrati nell'insieme MarkedData.
7. Utilizzare la funzione filterNaN per filtrare l'insieme MarkedData della matrice in modo da rimuovere le righe contenenti valori NaN.
Fare clic per copiare questa espressione
8. Utilizzare la funzione rows per calcolare il numero di righe negli insiemi Data e FilteredData.
Fare clic per copiare questa espressione
Fare clic per copiare questa espressione
Il numero di righe in FilteredData è diminuito di 2.
9. Utilizzare la funzione mean per calcolare la media degli insiemi MarkedData e FilteredData.
Fare clic per copiare questa espressione
Fare clic per copiare questa espressione
È possibile raccogliere statistiche per l'insieme FilteredData, ma non per l'insieme MarkedData.