Verwenden Sie die Funktionen Grubbs, GrubbsClassic, ThreeSigma und boxplot, um Ausreißer unter Verwendung von drei verschiedenen Methoden zur Erkennung von Ausreißern zu ermitteln.
1. Definieren Sie einen Vektor, der den Wärmefluss beschreibt.
2. Stellen Sie die Daten und den Mittelwert der Daten grafisch dar.
Streuungsdiagramme erleichtern die Erkennung potenzieller Ausreißer. Wenn es viele und keine schweren Ausreißer gibt, sind diese aber möglicherweise schwer zu entdecken. Sie können quantitative Messgrößen berechnen, um zu bestimmen, bei welchen Punkten es sich um Ausreißer handelt.
3. Definieren Sie das Signifikanzniveau.
4. Rufen Sie die Funktion Grubbs auf , um die Ausreißer im Datensatz zu identifizieren.
Die erste Spalte enthält die Indizes der einzelnen Punkte, die als Ausreißer identifiziert wurden (ihre Teststatistik überschreitet die Grubbs-Teststatistik).
Die zweite Spalte enthält die Teststatistiken der einzelnen Ausreißer (den Abstand des Ausreißers vom Mittelwert als absoluter Betrag).
Die dritte Spalte enthält den Abstand der Teststatistik eines Ausreißers der Grubbs-Teststatistik.
5. Rufen Sie GrubbsClassic auf, um den einen Punkt zu finden, der am wahrscheinlichsten ein Ausreißer ist.
Der Punkt mit dem Indexwert 19 ist am wahrscheinlichsten ein Ausreißer. Die Spalten haben die gleiche Bedeutung wie die Spalten der Matrix, die von der Funktion Grubbs zurückgegeben wird.
6. Rufen Sie die Funktion ThreeSigma auf, um die Datenpunkte zu finden, die außerhalb des 3-Sigma-Bereichs liegen.
Wie bei der Funktion Grubbs enthält die erste Spalte die Indizes und die zweite Spalte die Teststatistiken der Ausreißer.
Die Teststatistik für jeden dieser Datenpunkte ist größer als 3.
Wenn ThreeSigma keine Ausreißer findet, wird der Punkt zurückgegeben, der am ehesten ein Ausreißer ist.
7. Rufen Sie die Funktion boxplot auf, um Ausreißer nach der Quartilabstandsmethode zu erkennen, und erstellen Sie einen Boxplot, um die Ausreißer anzuzeigen.
Mit der Quartilabstandsmethode werden vier Ausreißer erkannt.
Mithilfe der Residualanalyse können Ausreißer auch erkannt werden, nachdem Daten an eine Funktion angepasst wurden.