Führen Sie mithilfe der Funktionen polyfit und polyfitstat eine lineare Regression und eine Varianzanalyse durch, um die Anpassungsqualität zu testen.
1. Definieren Sie eine Tabelle mit Versuchsdaten für einen Polymerprozess. Die Anspringtemperatur t und die Geschwindigkeit der Katalysatorzuführung fr beeinflussen die Viskosität vy des Polymers.
2. Rufen Sie die Funktion polyfit auf, um die Daten als lineare Regression zu modellieren.
3. Berechnen Sie die Viskosität für jede Temperatur- und Zuführungsgeschwindigkeitseinstellung.
4. Berechnen Sie die Residuen (Differenz zwischen den berechneten Modellwerten und den gemessenen Werten).
5. Stellen Sie die Residuen bezogen auf die gemessene Viskosität, Temperatur und Zuführungsgeschwindigkeit grafisch dar.
Die Diagramme der Residuen weisen darauf hin, dass die Varianzen der gemessenen Viskosität und Temperatur größer werden, wenn der Betrag von Viskosität bzw. Temperatur größer wird.
6. Rufen Sie polyfitstat auf, um verschiedene Statistiken für das lineare Modell zu berechnen. Zeigen Sie die ANOVA-Matrix an, die von polyfitstat in Zeile 8 zurückgegeben wird.
In der ANOVA-Matrix sind die Ursachen der Varianzen aufgeteilt zwischen der Regressions- und der Residualkomponente. Die Regressionskomponente wird auf die einzelnen Regressionskoeffizienten weiter aufgeteilt. Allerdings kann nicht zwischen der mangelnden Anpassung und dem reinen Fehler für das Residuum unterschieden werden, weil für die Versuchsergebnisse vy keine Replikate verfügbar sind.
ANOVA-Tabelle für die Regression berechnen und verwenden
1. Berechnen Sie die Fehlerquadratsumme (SSE = Sum of Squares due to Error).
SSE ist gleich χ2, eine allgemeine Metrik für die Güte der Anpassung. Dies ist die Menge, die während der Berechnung der Kleinste-Quadrate-Lösung minimiert wurde. Der Fehler ist ein Maß dafür, wie gut das Modell die Daten darstellt. Er zeigt, welcher Anteil der Abweichung nicht durch die Regression erklärt wird.
2. Definieren Sie die Freiheitsgrade für den Fehler df_error in Bezug auf die gesamten Freiheitsgrade df_total und die Freiheitsgrade für die Parameter df_param. Freiheitsgrade sind die Länge der Daten abzüglich der Anzahl der Anpassungsparameter.
3. Definieren Sie die Summe der Regressionsquadrate (SSR) in Bezug auf die Gesamtsumme der Quadrate (SST).
4. Definieren Sie den mittleren quadratischen Fehler (MSE, mean square error) und Mittelwert der Regressionsquadrate (MSR, mean square due to regression). Teilen Sie den Fehler durch die relevanten Freiheitsgrade.
5. Formulieren Sie eine Varianztabelle, um die Passung zu charakterisieren.
Summe der Quadrate
DF
Mittelwert der Quadratsumme
F-Faktor
Regression
Fehler
Gesamt
Sie können die obige Tabelle mit der ANOVA-Matrix polyfitstat vergleichen.
6. Schätzung, wie gut das Modell den Daten entspricht:
Dies weist darauf hin, dass sich 92.7 % der Varianz in der Viskosität durch das lineare Regressionsmodell erklären lassen.
7. Definieren Sie das Signifikanzniveau für einen Hypothesentest, um zu überprüfen, ob das Modell die Daten repräsentiert.
8. Berechnen Sie den kritischen F-Wert.
9. Testen Sie die Hypothese, dass das Modell die Daten darstellt.
Akzeptieren Sie die Hypothese. Die Viskosität des Polymers lässt sich mit einem linearen Regressionsmodell vorhersagen.
Verweis
Montgomery, D.C., Design and Analysis of Experiments, 5. Ausgabe, John Wiley & Sons, New York, 2001, S. 398