Рассчитайте статистику критерия Граббса, как в функции Grubbs, чтобы обнаружить отклонения. Сравните статистику критерия Граббса со статистикой критериев отклонений.
1. Задайте набор данных, который описывает эксперимент с тепловым потоком, и постройте его график.
2. Определите критическое значение распределения Стьюдента с N - 2 степенями свободы и уровнем значимости, равным alpha/(2N).
Функция qt рассчитывает обратную кумулятивную плотность вероятности распределения Стьюдента.
3. Определите статистику критерия Граббса как функцию с переменной альфа.
4. Определите уровень значимости для доверительной вероятности, равной 90 %.
5. Вызовите функцию Grubbs, чтобы обнаружить отклонения.
Функция Grubbs может принять матрицу в качестве входных данных, в этом случае функция возвращает вложенные пары индексов для расположений массивов отклонений.
6. Сравните статистику критерия Граббса со статистикой критериев отклонений.
Статистика критериев этих двух отклонений больше, чем статистика критерия Граббса. Даже если возвращено более одного индекса, это не означает, что все варианты являются отклонениями. Причина этого в том, что критическое значение и статистика критерия изменяются в случае удаления какого-либо варианта. Оба эти показателя зависят от N.
Поскольку критерий Граббса рассчитан на нормальные данные, стоит проверить, являются ли используемые данные нормальным распределением. Например, можно перед тем, как продолжить работу, прибегнуть к визуальному тестированию, такому как построение графика нормальной вероятности.
GrubbsClassic
Используйте функцию GrubbsClassic для поиска в наборе данных точки, которая с наибольшей вероятностью является отклонением.
1. Рассчитайте наибольшую статистику критерия для приведенного выше набора данных.
2. Определите значение альфа для доверительного интервала, равного 98 %.
3. Сравните статистику критерия Граббса со значением Gmax.
На данном уровне значимости не обнаружено отклонений.
4. Вызовите функцию GrubbsClassic.
Точка, возвращенная функцией GrubbsClassic, не является отклонением, но это точка данных, которая с наибольшей вероятностью может им быть.
Предельная вероятность обнаружения отклонений
Используйте специальное построение root для расчета предельной вероятности, с которой могут быть обнаружены отклонения.
Отклонения могут быть обнаружены, когда значение альфа больше α_limit или, другими словами, когда доверительный интервал составляет меньше, чем (1- α_limit):
Это согласуется с приведенными выше примерами. Для доверительного интервала, составляющего 98 %, не было найдено отклонений, но для доверительного интервала в 90 % было найдено два отклонения.