Функции > Анализ данных > Отклонения и NaN > Пример. Обнаружение отклонения
Пример. Обнаружение отклонения
Используйте функции Grubbs, GrubbsClassic, ThreeSigma и boxplot для обнаружения отклонений с применением трех различных методов.
1. Задайте вектор, описывающий тепловой поток.
Щелкните для копирования этого выражения
2. Постройте график данных и среднее значение данных.
Щелкните для копирования этого выражения
Щелкните для копирования этого выражения
Щелкните для копирования этого выражения
Щелкните для копирования этого выражения
Щелкните для копирования этого выражения
Для поиска возможных отклонений можно использовать графики разброса, однако если отклонения явно не выражены или встречаются редко, их обнаружить трудно. Можно рассчитать количественные параметры для определения точек, которые являются отклонениями.
3. Определите уровень значимости.
Щелкните для копирования этого выражения
4. Вызовите функцию Grubbs для поиска отклонений в наборе данных.
Щелкните для копирования этого выражения
В первом столбце содержатся индексы точек, идентифицированных в качестве отклонений (их значения критерия превышают значения критерия Граббса).
Щелкните для копирования этого выражения
Щелкните для копирования этого выражения
Во втором столбце приведены значения критерия для каждого отклонения (расстояние от отклонения до среднего значения в абсолютном виде).
Щелкните для копирования этого выражения
В третьем столбце приведены расстояния от значения критерия отклонения до значения критерия Граббса.
Щелкните для копирования этого выражения
5. Вызовите функцию GrubbsClassic для поиска одной точки, которая является отклонением с наибольшей вероятностью.
Щелкните для копирования этого выражения
Точка с индексом 19 наиболее вероятно является отклонением. Столбцы содержат такие же данные, что и столбцы матрицы, возвращаемой функцией Grubbs.
6. Вызовите функцию ThreeSigma для поиска точек данных, которые не попадают в диапазон 3 сигма.
Щелкните для копирования этого выражения
Как и в случае с функцией Grubbs, первый столбец содержит индексы, а второй — значения критерия для отклонений.
Значение критерия для всех таких точек данных превышает 3.
Если функция ThreeSigma не находит отклонений, возвращается точка, которая скорее всего может быть отклонением.
7. Вызовите функцию boxplot для обнаружения отклонений с помощью метода интерквартильного диапазона и постройте диаграмму "ящик с усами" для просмотра отклонений.
Щелкните для копирования этого выражения
Щелкните для копирования этого выражения
С помощью метода интерквартильного диапазона обнаружено четыре отклонения.
Можно также обнаруживать отклонения после аппроксимации данных с помощью анализа остатков.
Было ли это полезно?