Funktionen > Datenanalyse > Ausreißer und Nichtzahlenwerte (NaN) > Erkennen und Entfernen von Ausreißern
Erkennen und Entfernen von Ausreißern
Die Funktionen Grubbs, GrubbsClassic und ThreeSigma erkennen Ausreißer in Datensätzen. Die Funktion trim entfernt Zeilen mit angegebenen Indizes aus einem Datensatz.
Grubbs(v, a) – Übergibt den Index vermuteter Ausreißer, die Prüfgröße für den betreffenden Ausreißer und deren Abstand zur kritischen Größe für die Wahrscheinlichkeit a, dass die Daten zufällig einen bestimmten Wert annehmen.
GrubbsClassic(v, a) – Übergibt den Index des Datenpunkts, bei dem es sich am wahrscheinlichsten um einen Ausreißer handelt, und dessen Prüfgröße sowie deren Abstand zur kritischen Größe für die Wahrscheinlichkeit a, dass die Daten zufällig einen bestimmten Wert annehmen.
ThreeSigma(v) – Übergibt die Indizes von Punkten in v, deren Prüfgröße größer ist als drei, und den Wert dieser Größe für jeden Punkt.
trim(v, vindex) – Schneidet die von der Funktion vindex angegebenen Einträge (Zeilen) aus.
Die zum Erkennen von Ausreißern verwendete Prüfgröße ist der Abstand eines Punkts zum Mittelwert des Datensatzes, geteilt durch die Standardabweichung.
Wenn anstelle eines Vektors eine reelle Matrix verwendet wird, geben die Funktionen, die Ausreißer finden, das Indexpaar für jeden Ausreißerkandidaten als verschachtelte Matrizen zurück.
Argumente
v ist ein reeller Vektor oder eine reelle Matrix, der bzw. die die Datenpunkte darstellt.
a ist eine Wahrscheinlichkeit zwischen 0 < a < 1.
vindex ist ein Vektor mit Ganzzahlwerten. Die in vindex angegebenen Indizes sind auf ORIGIN bezogen.
War dies hilfreich?