Пример. Анализ удержания прогнозов множественной регрессии
Для поиска статистически значимых регрессий используются DOE-функции и программы. В случае, когда все комбинации факторов испытаны, используется метод прямого решения. Это трудная задача, которая обычно ставится в приложениях для углубленного статистического анализа. В PTC Mathcad можно использовать рекурсивные функции, чтобы гарантировать проверку всех возможных комбинаций, минимизируя при этом длину программ.
1. Определите набор экспериментальных данных.
2. Извлеките из Data количество факторов.
Число потенциальных регрессий для данного эксперимента определяется как:
3. Извлеките строку заголовка.
4. Извлеките частоты отказов (Y) и возможные факторы (X).
5. Используйте функции rows и concat для создания программы нахождения элементов, которые должны использоваться при тестировании регрессий.
Например, для факторов "A", "B" и "C" условиями являются:
◦ Первый аргумент List_Terms - это вектор, начинающийся с пустой строки (для учета постоянной регрессии), за которой следуют имена всех факторов.
◦ Второй аргумент должен иметь начальное значение 0. Он используется рекурсивно в циклах программы, пока не будет получен требуемый результат.
◦ Возвращаемые условия представляют собой выборку всех возможных комбинаций факторов. Например, CBA или ACB опускаются, поскольку их использование в регрессиях приводит к тому же результату, что и использование ABC.
6. Используйте функции rows и vec2str для создания программы сопоставления элементов отдельным символам. Возвращенный список используется как ссылка для последующего извлечения элементов.
Первый столбец возвращенного списка содержит символы, а второй — соответствующие условия.
7. Используйте функции rows, strlen, match и substr для создания программ, позволяющих сократить элементы и экспериментальные данные.
8. Создайте программу, определяющую, удовлетворяет ли регрессия, полученная с помощью функции polyfitstat, заданным требованиям как в отношении значимости (P), так и в том, насколько хорошо регрессия описывает данные (R2).
9. Введите программу для форматирования результатов регрессии. Программа возвращает имена исходных элементов, а также R2 и P для дальнейшей сортировки, когда все регрессии будут определены.
10. Создайте программу упорядочения результатов по общей значимости регрессии (P).
11. Используйте функцию polyfitstat, чтобы создать программу выполнения регрессионного анализа. Эта короткая, но эффективная программа выполняет следующие задачи:
◦ нахождение всех комбинаций прогнозов;
◦ обработка всех комбинаций прогнозов и создание регрессии для каждой комбинации;
◦ проверка, удовлетворяют ли регрессии заданным требованиям;
◦ форматирование допустимых регрессий;
◦ упорядочение форматированных регрессий.
12. Вызовите программу Reg для выполнения регрессионного анализа.
Выполнение этой программы может занять значительное время до возвращения результатов, особенно при увеличении числа регрессий (например, при повышении уровня значимости). В данном случае программа возвращает две регрессии, удовлетворяющие требованиям, определенным переменными α и R2.
13. Просмотрите некоторые результаты регрессивного анализа.
14. Определите f как стандартное уравнение регрессии.
15. Переопределите f так, чтобы использовались коэффициенты регрессии, полученные с помощью программы Reg.
16. Постройте графики экспериментальных данных и регрессий.
Справочная информация
Philip Leitch, BSc (Applied Biology/Environmental Science Hons), MBA (Hons)