Esempio: analisi di conservazione delle regressioni con più variabili predittive
Utilizzare funzioni e programmi DOE per trovare regressioni statisticamente significative. Utilizzare l'approccio di forza bruta, in cui viene testata ogni singola combinazione di fattori. Questo è un task difficile, riservato alle applicazioni statistiche avanzate. In PTC Mathcad è possibile utilizzare funzioni ricorsive per garantire che ogni singola combinazione venga inclusa, mantenendo al minimo la lunghezza dei programmi.
1. Definire un insieme di dati sperimentali.
2. Estrarre il numero di fattori da Data.
Il numero delle potenziali regressioni per questo esperimento è il seguente:
3. Estrarre la riga di intestazione.
4. Estrarre i tassi di errore (Y) e i fattori potenziali (X).
5. Utilizzare le funzioni rows e concat per creare un programma per l'individuazione dei termini da utilizzare per la verifica delle regressioni.
Per i fattori "A", "B" e "C", i termini sono i seguenti:
◦ Il primo argomento di List_Terms è un vettore che inizia con una stringa vuota per tenere conto della costante di regressione seguita dai nomi di tutti i fattori.
◦ Il secondo argomento deve iniziare da 0. Viene utilizzato in modo ricorsivo dai cicli del programma finché non si raggiunge il risultato desiderato.
◦ I termini restituiti sono una selezione di tutte le possibili combinazioni dei fattori. Ad esempio, CBA o ACB vengono omessi, in quanto il loro utilizzo nelle regressioni produrrebbe lo stesso risultato di ABC.
6. Utilizzare le funzioni rows e vec2str per creare un programma per la mappatura dei termini in singoli caratteri. L'elenco restituito viene utilizzato come riferimento per consentire il recupero successivo dei termini.
La prima colonna dell'elenco restituito contiene i caratteri e la seconda colonna contiene i termini corrispondenti.
7. Utilizzare le funzioni rows, strlen, match e substr per creare programmi per la riduzione dei termini e dei dati sperimentali.
8. Creare un programma per determinare se la regressione generata dalla funzione polyfitstat soddisfa i requisiti, sia in termini di significatività (P), sia in termini di correttezza della descrizione dei dati (R2) da parte della regressione.
9. Creare un programma per la formattazione dei risultati della regressione. Il programma restituisce i nomi dei termini originali, nonché R2 e P per l'ulteriore ordinamento dopo l'identificazione di tutte le regressioni.
10. Creare un programma per l'ordinamento dei risultati in base alla significatività della regressione complessiva (P).
11. Utilizzare la funzione polyfitstat per creare un programma per l'elaborazione dell'analisi di regressione. Questo programma, breve ma efficace, esegue i task elencati di seguito.
◦ Individuazione di tutte le combinazioni delle variabili predittive.
◦ Iterazione su tutte le combinazioni delle variabili predittive e creazione di una regressione per ogni combinazione.
◦ Verifica del soddisfacimento o meno dei requisiti specificati da parte delle regressioni.
◦ Formattazione delle regressioni valide.
◦ Ordinamento delle regressioni formattate.
12. Chiamare il programma Reg per l'elaborazione dell'analisi di regressione.
Questo programma può richiedere una quantità di tempo notevole prima di restituire un risultato, in particolare se il numero di regressioni aumenta, ad esempio quando si incrementa il livello di significatività. In questo caso, il programma restituisce due regressioni che soddisfano i requisiti definiti da α e R2.
13. Visualizzare alcuni dei risultati dell'analisi della regressione.
14. Definire f come equazione di regressione standard.
15. Ridefinire f in modo che accetti i coefficienti di regressione restituiti da Reg.
16. Tracciare il grafico dei dati sperimentali e delle regressioni.
Riferimenti
Philip Leitch, BSc (Applied Biology/Environmental Science Hons), MBA (Hons)