Функции > Анализ данных > Отклонения и NaN > Обнаружение и удаление отклонений
Обнаружение и удаление отклонений
Функции Grubbs, GrubbsClassic и ThreeSigma обнаруживают отклонения в наборах данных. Функция trim удаляет строки с указанными индексами из набора данных.
Функция Grubbs(v, a) возвращает индексы предполагаемых отклонений, статистику этих отклонений и расстояние от нее до критической статистики для вероятности a того, что данные случайно принимают заданное значение.
Функция GrubbsClassic(v, a) возвращает индекс точки данных, которая является наиболее вероятным отклонением, статистику для этого отклонения и расстояние от нее до критической статистики для вероятности a того, что данные случайно принимают заданное значение.
Функция ThreeSigma(v) возвращает индексы точек в векторе v, которые имеют статистику критерия больше 3 и величину этого значения для каждой точки.
Функция trim(v, vindex) обрезает записи (строки), заданные аргументом vindex.
Статистика, используемая для обнаружения отклонений, определяется как расстояние от точки до среднего по набору данных, деленное на среднеквадратическое отклонение.
Если вместо вектора используется матрица действительных значений, то функции для обнаружения отклонений возвращают пару индексов для каждого предполагаемого отклонения в виде вложенных матриц.
Аргументы
v — действительный вектор или матрица, представляющие точки данных.
a — вероятность в интервале 0 < a < 1.
vindex — вектор из целочисленных значений. Индексы в vindex задаются относительно ORIGIN.
Было ли это полезно?