Beispiel: Erkennen und Entfernen von Nichtzahlenwerten (NaN)
Verwenden Sie die Funktion markNaN, um Ausreißer in Datensätzen als NaN (Nichtzahlenwert) zu markieren. Die Funktionen IsNaN, matchNaN und filterNaN dienen zum Verwalten von NaN-Werten.
1. Lesen Sie eine Datei ein, welche die Anzahl der Sonnenflecken enthält, die in den letzten drei Jahrhunderten verzeichnet wurden, und plotten Sie die Daten.
2. Verwenden Sie die Funktion ThreeSigma, um die Indizes der Ausreißer zu suchen.
Die Anzahl von Sonnenflecken, die in den folgenden Jahren verzeichnet wurden, bilden die Ausreißer:
3. Verwenden Sie die Funktion markNaN, um die Ausreißer in Spalte 1 der Daten als NaN zu markieren.
Durch das Ersetzen der Daten durch NaN wird angegeben, dass eine Messung vorgenommen wurde, die Zeilen, die NaN enthalten, jedoch vor der Verarbeitung herausgefiltert werden können.
4. Verwenden Sie die Funktion matchNaN, um die Indizes der Punkte zu suchen, die als NaN markiert wurden.
Die Daten in den Zeilen 257 und 278 wurden durch die integrierte Konstante NaN ersetzt:
5. Überprüfen Sie mit der Funktion IsNaN, ob das Jahr 1957 in den Sätzen Data und MarkedDataSätzen als NaN markiert wurde.
6. Stellen Sie den neuen Datensatz grafisch dar und vergleichen Sie ihn mit dem alten Datensatz.
Die Ausreißer aus dem ursprünglichen Datensatz werden nicht blau hervorgehoben, da im Diagramm die im Datensatz MarkedData verzeichneten NaN-Werte übergangen werden.
7. Verwenden Sie die Funktion filterNaN, um den Matrixsatz MarkedData so zu filtern, dass die Zeilen mit NaNs entfernt werden.
8. Verwenden Sie die Funktion rows, um die Anzahl der Zeilen in den Sätzen Data und FilteredData zu berechnen.
Die Anzahl der Zeilen in FilteredData wurde um zwei verringert.
9. Verwenden Sie die Funktion mean, um den Mittelwert der Sätze MarkedData und FilteredData zu berechnen.
Statistiken können für den Satz FilteredData, nicht jedoch für den Satz MarkedData erfasst werden.