함수 > 데이터 분석 > 이상치 및 NaN > 예제: NaN 검출 및 제거
  
예제: NaN 검출 및 제거
markNaN 함수를 사용하여 데이터 집합에서 이상치를 NaN(숫자가 아님)으로 표시합니다. IsNaN, matchNaNfilterNaN 함수를 사용하여 NaN을 관리합니다.
1. 지난 3세기 동안 기록한 태양 흑점의 수가 들어 있는 파일을 읽어 데이터를 도표화합니다.
이 식을 복사하려면 클릭
이 식을 복사하려면 클릭
2. ThreeSigma 함수를 사용하여 이상치의 지수를 구합니다.
이 식을 복사하려면 클릭
다음 연도에 기록한 태양 흑점의 수가 이상치에 해당합니다.
이 식을 복사하려면 클릭
이 식을 복사하려면 클릭
3. markNaN 함수를 사용하여 데이터의 열 1에 있는 이상치를 NaN으로 표시합니다.
이 식을 복사하려면 클릭
이 식을 복사하려면 클릭
데이터를 NaN으로 대체한다는 것은 측정하기는 했지만 결과를 처리하기에 앞서 NaN이 포함된 행을 필터링하여 제거할 수 있음을 의미합니다.
4. matchNaN 함수를 사용하여 NaN으로 표시된 흑점의 지수를 구합니다.
이 식을 복사하려면 클릭
행 257과 278에 있는 데이터가 기본 제공 상수 NaN으로 대체되었습니다.
5. IsNaN 함수를 사용하여 DataMarkedData 집합에서 1957년이 NaN으로 표시되었는지 확인합니다.
이 식을 복사하려면 클릭
이 식을 복사하려면 클릭
6. 새 데이터 집합을 도표화하고 이전 집합과 비교합니다.
이 식을 복사하려면 클릭
원래 데이터 집합에 있던 이상치는 파란색으로 강조 표시되지 않습니다. MarkedData 집합에 기록된 NaN은 도표를 작성할 때 건너뛰기 때문입니다.
7. filterNaN 함수를 사용하여 행렬 MarkedData 집합을 필터링하여 NaN이 포함된 행을 제거합니다.
이 식을 복사하려면 클릭
8. rows 함수를 사용하여 Data FilteredData 집합의 행 수를 계산합니다.
이 식을 복사하려면 클릭
이 식을 복사하려면 클릭
FilteredData의 행 수가 2만큼 줄어들었습니다.
9. mean 함수를 사용하여 MarkedDataFilteredData 집합의 평균을 계산합니다.
이 식을 복사하려면 클릭
이 식을 복사하려면 클릭
FilteredData 집합에 대해서는 통계값을 수집할 수 있지만 MarkedData 집합에 대해서는 통계값을 수집할 수 없습니다.