예제: 이상치 제거
데이터 집합을 처리하기 전에
trim 함수를 사용하여 데이터 집합에서 이상치를 제거합니다.
1. 열 흐름을 설명하는 데이터 집합을 정의합니다.
2. Grubbs 함수를 사용하여 이상치를 검출합니다.
3. 이상치의 지수가 포함된 벡터를 만듭니다.
4. y 데이터 집합의 각 행에 번호를 지정합니다.
5. 이상치를 제거합니다.
datanew 배열의 행 수가 원래 데이터 집합보다 더 적습니다.
6. 원래 데이터 집합과 이상치를 제거한 데이터 집합을 도표화합니다.
이상치 때문에 결과가 왜곡될 가능성이 있으면 더 나은 결과를 얻기 위해 이상치를 제거할 수 있습니다. 열 흐름 데이터의 결과는 다음과 같습니다.
평균은 데이터에 이상치가 있는지 여부와 상관없이 거의 비슷하지만 표준 편차는 이상치를 제거한 후 감소하는 것을 알 수 있습니다. 이러한 변화는 데이터의 모델에 큰 영향을 줍니다.