Utilizzare la funzione markNaN per contrassegnare gli outlier come NaN (Not a Number) negli insiemi di dati. Utilizzare le funzioni IsNaN, matchNaN e filterNaN per gestire i valori NaN.
1. Leggere un file contenente il numero di macchie solari registrate nel corso degli ultimi tre secoli e tracciare il grafico dei dati.
2. Utilizzare la funzione ThreeSigma per trovare gli indici degli outlier.
Gli outlier sono il numero di macchie solari registrate durante l'anno successivo:
3. Utilizzare la funzione markNaN per contrassegnare come NaN gli outlier nella colonna 1 dei dati.
La sostituzione dei dati con valori NaN indica che è stata effettuata una misura, ma che le righe contenenti valori NaN possono essere escluse tramite filtro prima dell'elaborazione.
4. Utilizzare la funzione matchNaN per trovare gli indici delle macchie contrassegnate come NaN.
I dati nelle righe 257 e 278 sono stati sostituiti dalla costante incorporata NaN.
5. Utilizzare la funzione IsNaN per controllare se l'anno 1957 è stato contrassegnato come NaN negli insiemi Data e MarkedData.
6. Tracciare il grafico del nuovo insieme di dati e confrontarlo con l'insieme precedente.
Gli outlier dell'insieme di dati originale non sono evidenziati in blu, in quanto il grafico ignora i valori NaN registrati nell'insieme MarkedData.
7. Utilizzare la funzione filterNaN per filtrare l'insieme MarkedData della matrice in modo da rimuovere le righe contenenti valori NaN.
8. Utilizzare la funzione rows per calcolare il numero di righe negli insiemi Data e FilteredData.
Il numero di righe in FilteredData è diminuito di 2.
9. Utilizzare la funzione mean per calcolare la media degli insiemi MarkedData e FilteredData.
È possibile raccogliere statistiche per l'insieme FilteredData, ma non per l'insieme MarkedData.