Funktionen > Datenanalyse > Ausreißer und Nichtzahlenwerte (NaN) > Beispiel: Ausreißererkennung
  
Beispiel: Ausreißererkennung
Verwenden Sie die Funktionen Grubbs, GrubbsClassic, ThreeSigma und boxplot, um Ausreißer unter Verwendung von drei verschiedenen Methoden zur Erkennung von Ausreißern zu ermitteln.
1. Definieren Sie einen Vektor, der den Wärmefluss beschreibt.
Zum Kopieren dieses Ausdrucks klicken
2. Stellen Sie die Daten und den Mittelwert der Daten grafisch dar.
Zum Kopieren dieses Ausdrucks klicken
Zum Kopieren dieses Ausdrucks klicken
Zum Kopieren dieses Ausdrucks klicken
Zum Kopieren dieses Ausdrucks klicken
Zum Kopieren dieses Ausdrucks klicken
Streuungsdiagramme erleichtern die Erkennung potenzieller Ausreißer. Wenn es viele und keine schweren Ausreißer gibt, sind diese aber möglicherweise schwer zu entdecken. Sie können quantitative Messgrößen berechnen, um zu bestimmen, bei welchen Punkten es sich um Ausreißer handelt.
3. Definieren Sie das Signifikanzniveau.
Zum Kopieren dieses Ausdrucks klicken
4. Rufen Sie die Funktion Grubbs auf , um die Ausreißer im Datensatz zu identifizieren.
Zum Kopieren dieses Ausdrucks klicken
Die erste Spalte enthält die Indizes der einzelnen Punkte, die als Ausreißer identifiziert wurden (ihre Teststatistik überschreitet die Grubbs-Teststatistik).
Zum Kopieren dieses Ausdrucks klicken
Zum Kopieren dieses Ausdrucks klicken
Die zweite Spalte enthält die Teststatistiken der einzelnen Ausreißer (den Abstand des Ausreißers vom Mittelwert als absoluter Betrag).
Zum Kopieren dieses Ausdrucks klicken
Die dritte Spalte enthält den Abstand der Teststatistik eines Ausreißers der Grubbs-Teststatistik.
Zum Kopieren dieses Ausdrucks klicken
5. Rufen Sie GrubbsClassic auf, um den einen Punkt zu finden, der am wahrscheinlichsten ein Ausreißer ist.
Zum Kopieren dieses Ausdrucks klicken
Der Punkt mit dem Indexwert 19 ist am wahrscheinlichsten ein Ausreißer. Die Spalten haben die gleiche Bedeutung wie die Spalten der Matrix, die von der Funktion Grubbs zurückgegeben wird.
6. Rufen Sie die Funktion ThreeSigma auf, um die Datenpunkte zu finden, die außerhalb des 3-Sigma-Bereichs liegen.
Zum Kopieren dieses Ausdrucks klicken
Wie bei der Funktion Grubbs enthält die erste Spalte die Indizes und die zweite Spalte die Teststatistiken der Ausreißer.
Die Teststatistik für jeden dieser Datenpunkte ist größer als 3.
Wenn ThreeSigma keine Ausreißer findet, wird der Punkt zurückgegeben, der am ehesten ein Ausreißer ist.
7. Rufen Sie die Funktion boxplot auf, um Ausreißer nach der Quartilabstandsmethode zu erkennen, und erstellen Sie einen Boxplot, um die Ausreißer anzuzeigen.
Zum Kopieren dieses Ausdrucks klicken
Zum Kopieren dieses Ausdrucks klicken
Mit der Quartilabstandsmethode werden vier Ausreißer erkannt.
Mithilfe der Residualanalyse können Ausreißer auch erkannt werden, nachdem Daten an eine Funktion angepasst wurden.