예제: NaN 검출 및 제거
markNaN 함수를 사용하여 데이터 집합에서 이상치를
NaN(숫자가 아님)으로 표시합니다.
IsNaN,
matchNaN 및
filterNaN 함수를 사용하여
NaN을 관리합니다.
1. 지난 3세기 동안 기록한 태양 흑점의 수가 들어 있는 파일을 읽어 데이터를 도표화합니다.
다음 연도에 기록한 태양 흑점의 수가 이상치에 해당합니다.
3. markNaN 함수를 사용하여 데이터의 열 1에 있는 이상치를 NaN으로 표시합니다.
데이터를 NaN으로 대체한다는 것은 측정하기는 했지만 결과를 처리하기에 앞서 NaN이 포함된 행을 필터링하여 제거할 수 있음을 의미합니다.
4. matchNaN 함수를 사용하여 NaN으로 표시된 흑점의 지수를 구합니다.
행 257과 278에 있는 데이터가 기본 제공 상수 NaN으로 대체되었습니다.
5. IsNaN 함수를 사용하여 Data 및 MarkedData 집합에서 1957년이 NaN으로 표시되었는지 확인합니다.
6. 새 데이터 집합을 도표화하고 이전 집합과 비교합니다.
원래 데이터 집합에 있던 이상치는 파란색으로 강조 표시되지 않습니다. MarkedData 집합에 기록된 NaN은 도표를 작성할 때 건너뛰기 때문입니다.
7. filterNaN 함수를 사용하여 행렬 MarkedData 집합을 필터링하여 NaN이 포함된 행을 제거합니다.
8. rows 함수를 사용하여
Data 및
FilteredData 집합의 행 수를 계산합니다.
FilteredData의 행 수가 2만큼 줄어들었습니다.
9. mean 함수를 사용하여
MarkedData 및
FilteredData 집합의 평균을 계산합니다.
FilteredData 집합에 대해서는 통계값을 수집할 수 있지만 MarkedData 집합에 대해서는 통계값을 수집할 수 없습니다.