함수 > 데이터 분석 > 이상치 및 NaN > 이상치 검출 및 제거
이상치 검출 및 제거
Grubbs, GrubbsClassicThreeSigma 함수는 데이터 집합에서 이상치를 검출하고, trim 함수는 지정된 지수의 행을 데이터 집합에서 제거합니다.
Grubbs(v, a) - 데이터가 지정된 값을 무작위로 취할 확률 a에 대해 이상치로 의심되는 데이터 점의 지수, 해당 이상치의 검사 통계값, 임계 통계값을 기준으로 한 거리를 구합니다.
GrubbsClassic(v, a) - 데이터가 지정된 값을 무작위로 취할 확률 a에 대해 이상치일 가능성이 가장 높은 데이터 점의 지수, 해당 검사 통계값, 임계 통계값을 기준으로 한 거리를 구합니다.
ThreeSigma(v) - v에서 검사 통계값이 3보다 큰 점의 지수와 각 점에 대한 이 수량의 값을 구합니다.
trim(v, vindex) - vindex로 지정한 항목(행)을 잘라냅니다.
이상치를 검출하는 데 사용되는 검사 통계값은 데이터 집합의 평균과 데이터 점 사이의 거리를 표준 편차로 나눈 값입니다.
벡터 대신 실수 행렬을 사용하는 경우 이상치 검출 함수는 이상치일 가능성이 있는 각 데이터 점의 지수 쌍을 중첩 행렬로 반환합니다.
인수
v는 데이터 점을 나타내는 실수 벡터 또는 행렬입니다.
a는 확률을 나타내며 0 < a < 1입니다.
vindex는 정수 값 벡터입니다. vindex에서 지정하는 지수는 ORIGIN을 기준으로 합니다.
도움이 되셨나요?