Exemple : Analyse de rétention de prédicteur de régression multiple
Utilisez les fonctions et les programmes de plans d'expérience pour trouver les régressions significatives en termes statistiques. Adoptez une approche exhaustive (en force brute) pour tester chaque combinaison de facteurs. C'est une tâche délicate réservée aux applications statistiques sophistiquées. PTC Mathcad vous permet d'utiliser des fonctions récursives pour vérifier que chaque combinaison unique est bien prise en compte tout en réduisant la longueur de vos programmes.
1. Définissez un jeu de données expérimentales.
2. Extrayez le nombre de facteurs de Data.
Le nombre de régressions potentielles pour cette expérience est le suivant :
3. Extrayez la ligne d'en-tête.
4. Extrayez les taux d'échec (Y) et les facteurs potentiels (X).
5. Utilisez les fonctions rows et concat pour créer un programme permettant de rechercher les termes à utiliser pour tester les régressions.
Par exemple, pour les facteurs "A", "B", et "C", les termes sont :
◦ Le premier argument de List_Terms est un vecteur qui commence par une chaîne vide représentant la constante de la régression suivie par tous les noms des facteurs.
◦ Le deuxième argument doit commencer à 0. Il est utilisé de façon récurrente par les boucles du programme jusqu'à ce que le résultat souhaité soit obtenu.
◦ Les termes renvoyés sont une sélection de toutes les combinaisons de facteurs possibles. Par exemple, CBA et ACB sont omis, car leur utilisation dans des régressions entraînerait le même résultat que ABC.
6. Utilisez les fonctions rows et vec2str pour créer un programme permettant de mapper les termes sur des caractères uniques. La liste renvoyée est utilisée comme référence, ce qui permet de récupérer ultérieurement les termes.
La première colonne de la liste renvoyée contient les caractères, la deuxième les termes correspondants.
7. Utilisez les fonctions rows, strlen, match et substr pour créer des programmes permettant de réduire les termes et les données expérimentales.
8. Créez un programme pour déterminer si la régression générée par la fonction polyfitstat répond aux exigences, à la fois sur le plan de la signification (P) et de la pertinence avec laquelle la régression décrit les données (R2).
9. Créez un programme pour mettre en forme les résultats de la régression. Le programme renvoie les noms des termes d'origine ainsi que R2 et P pour pouvoir procéder ultérieurement à des tris quand toutes les régressions seront identifiées.
10. Créez un programme permettant d'ordonner les résultats en fonction de la signification de régression globale (P).
11. Utilisez la fonction polyfitstat pour créer un programme permettant de traiter l'analyse de régression. Bien que court, ce programme est suffisamment puissant pour assurer les tâches suivantes :
◦ Rechercher toutes les combinaisons de prédicteurs
◦ Parcourir toutes les combinaisons de prédicteurs et créer une régression pour chacune
◦ Vérifier si les régressions satisfont les exigences spécifiées
◦ Mettre en forme les régressions valides
◦ Classer les régressions mises en forme
12. Appelez le programme Reg pour traiter l'analyse de régression.
Ce programme peut prendre beaucoup de temps avant de renvoyer un résultat, surtout si le nombre de régressions augmente (par exemple, si vous augmentez le degré de signification). Dans ce cas, le programme renvoie deux régressions qui répondent aux exigences définies par α et R2.
13. Affichez certains résultats de l'analyse de régression.
14. Définissez f de sorte qu'elle soit l'équation de régression standard.
15. Redéfinissez f de sorte qu'elle prenne les coefficients de régression renvoyés par Reg.
16. Tracez les données expérimentales et les régressions.
Référence
Philip Leitch, BSc (Applied Biology/Environmental Science Hons), MBA (Hons)