Utilizzare le funzioni
polyfit e
polyfitstat per eseguire una regressione lineare e un'analisi della varianza per verificare la qualità del fit.
1. Definire una tabella di dati sperimentali per un processo sui polimeri. La temperatura di reazione t e la velocità di alimentazione del catalizzatore fr influenzano la viscosità vy del polimero.
Qualità del fit
2. Chiamare la funzione polyfit per modellare i dati come regressione lineare.
3. Calcolare la viscosità prevista per ogni impostazione di temperatura e velocità di alimentazione.
4. Calcolare i residui (la differenza tra i valori del modello calcolati e quelli misurati).
5. Tracciare il grafico dei residui rispetto a viscosità, temperatura e velocità di alimentazione osservate.
I grafici dei residui indicano che le varianze della viscosità osservata e della temperatura aumentano con l'aumentare, rispettivamente, della viscosità e della temperatura.
6. Chiamare la funzione polyfitstat per calcolare le diverse statistiche per il modello lineare. Visualizzare la matrice ANOVA restituita dal risultato di polyfitstat alla riga 8.
Nella matrice ANOVA le origini delle varianze vengono divise tra i componenti di regressione e residuo. Il componente di regressione viene ulteriormente suddiviso tra ogni coefficiente di regressione. Non è tuttavia possibile distinguere tra la mancanza di fit e l'errore puro per il residuo in quanto i risultati dell'esperimento vy non hanno repliche.
Calcolo e utilizzo della tabella ANOVA per la regressione
1. Calcolare la somma dei quadrati dovuti a errore (SSE).
SSE equivale a χ2, una metrica generale per la bontà del fit. Si tratta della quantità minimizzata durante il calcolo di una soluzione dei minimi quadrati. L'errore è una misura del livello di fit del modello ai dati. Mostra la quantità di deviazione non spiegata dalla regressione.
2. Definire i gradi di libertà per l'errore df_error rispetto ai gradi totali di libertà df_total e ai gradi di libertà per i parametri df_param. I gradi di libertà sono dati dalla lunghezza dei dati meno il numero di parametri di fit.
3. Definire la somma dei quadrati dovuti alla regressione (SSR) rispetto alla somma totale dei quadrati (SST).
4. Definire l'errore quadratico medio (MSE) e il quadrato medio di regressione (MSR). Dividere l'errore per i gradi di libertà appropriati.
5. Creare una tabella di analisi della varianza per caratterizzare il fit.
Somma dei quadrati
DF
Quadrato medio
Fattore F
Regressione
Errore
Totale
È possibile confrontare la tabella precedente con la matrice ANOVA polyfitstat.
6. Stimare il livello di fit del modello ai dati:
Il risultato indica che il 92,7% della variabile nella viscosità è spiegato dal modello di regressione lineare.
7. Definire il livello di significatività di un test d'ipotesi per verificare se il modello si adatta ai dati.
8. Calcolare il valore F critico.
9. Verificare l'ipotesi che il modello si adatti ai dati.
Accettare l'ipotesi. È possibile predire la viscosità del polimero con questo modello di regressione lineare.
Riferimenti
Montgomery, D.C., Design and Analysis of Experiments, 5th ed., John Wiley & Sons, New York, 2001, pp. 398