Funktionen > Datenanalyse > Ausreißer und Nichtzahlenwerte (NaN) > Beispiel: Grubbs-Methode zum Erkennen von Ausreißern
Beispiel: Grubbs-Methode zum Erkennen von Ausreißern
Teststatistik nach Grubbs
Berechnen Sie die Teststatistik nach Grubbs, wie sie von der Funktion Grubbs verwendet wird, um Ausreißer zu erkennen. Vergleichen Sie die Grubbs-Teststatistik mit der Teststatistik der Ausreißer.
1. Definieren Sie einen Datensatz, der ein Wärmeflussexperiment beschreibt, und stellen Sie ihn grafisch dar.
Zum Kopieren dieses Ausdrucks klicken
Zum Kopieren dieses Ausdrucks klicken
Zum Kopieren dieses Ausdrucks klicken
Zum Kopieren dieses Ausdrucks klicken
Zum Kopieren dieses Ausdrucks klicken
Zum Kopieren dieses Ausdrucks klicken
2. Definieren Sie den kritischen Wert der studentschen T-Verteilung mit N - 2 Freiheitsgraden und einem Signifikanzniveau von alpha/(2N).
Zum Kopieren dieses Ausdrucks klicken
* 
Die Funktion qt berechnet die inverse kumulative Wahrscheinlichkeitsverteilung der studentschen T-Verteilung.
3. Definieren Sie die Grubbs-Teststatistik als Funktion von Alpha.
Zum Kopieren dieses Ausdrucks klicken
4. Definieren Sie das Signifikanzniveau für einen Vertrauensbereich von 90 %.
Zum Kopieren dieses Ausdrucks klicken
5. Rufen Sie die Funktion Grubbs auf, um Ausreißer zu ermitteln.
Zum Kopieren dieses Ausdrucks klicken
Die Funktion Grubbs kann eine Matrix als Eingabe akzeptieren. In diesem Fall gibt sie verschachtelte Paare von Indizes für die Array-Positionen der Ausreißer zurück.
6. Vergleichen Sie die Grubbs-Teststatistik mit den Teststatistiken der Ausreißer.
Zum Kopieren dieses Ausdrucks klicken
Die beiden Ausreißer verfügen über eine Teststatistik, die größer als die Grubbs-Teststatistik ist. Auch wenn mehrere Indizes zurückgegeben werden, bedeutet dies nicht, dass alle Kandidaten Ausreißer sein müssen. Dies liegt daran, dass sich der kritische Wert und die Teststatistik ändern, wenn ein Kandidat entfernt wird. Beide sind von N abhängig.
Da beim Grubbs-Test davon ausgegangen wird, dass die Daten normal sind, lohnt es sich zu prüfen, ob ihre Daten einer Normalverteilung folgen. Sie können beispielsweise einen visuellen Test wie den normalen Wahrscheinlichkeitsplot verwenden, bevor Sie fortfahren.
GrubbsClassic
Verwenden Sie die Funktion GrubbsClassic, um den Punkt zu ermitteln, der in einem Datensatz der wahrscheinlichste Ausreißer ist.
1. Berechnen Sie die Teststatistik, die für den Datensatz oben die größte ist.
Zum Kopieren dieses Ausdrucks klicken
2. Definieren Sie Alpha für ein Konfidenzintervall von 98 %.
Zum Kopieren dieses Ausdrucks klicken
3. Vergleichen Sie die Grubbs-Teststatistik mit Gmax.
Zum Kopieren dieses Ausdrucks klicken
Zum Kopieren dieses Ausdrucks klicken
Auf diesem Signifikanzniveau werden keine Ausreißer erkannt.
4. Rufen Sie die Funktion GrubbsClassic auf.
Zum Kopieren dieses Ausdrucks klicken
Der von GrubbsClassic zurückgegebene Punkt ist kein Ausreißer, aber es handelt sich dabei um den Datenpunkt, der der wahrscheinlichste Ausreißer ist.
Begrenzte Wahrscheinlichkeit für das Erkennen von Ausreißern
Verwenden Sie das besondere Konstrukt root, um die begrenzte Wahrscheinlichkeit zu berechnen, mit der Ausreißer erkannt werden.
Zum Kopieren dieses Ausdrucks klicken
Ausreißer werden erkannt, wenn Alpha größer als α_limit oder das Konfidenzintervall mit anderen Worten ausgedrückt kleiner als (1 - α_limit) ist:
Zum Kopieren dieses Ausdrucks klicken
Dies stimmt mit den oben ermittelten Ergebnissen überein. Für ein Konfidenzintervall von 98 % wurden keine Ausreißer erkannt, aber zwei Ausreißer für ein Konfidenzintervall von 90 %.
War dies hilfreich?