Ejemplo: detección y eliminación de constantes NaN
Utilice la función markNaN para marcar valores atípicos como NaN (no es un número) en conjuntos de datos. Utilice las funciones IsNaN, matchNaN y filterNaN para administrar NaN.
1. Lea un fichero que contenga el número de manchas solares registradas durante los tres últimos siglos y trace los datos.
2. Utilice la función ThreeSigma para buscar los índices de los valores atípicos.
Los valores atípicos son el número de manchas solares registradas durante los siguientes años:
3. Utilice la función markNaN para marcar como NaN los valores atípicos de la columna 1 de los datos.
El reemplazo de los datos por NaN indica que se ha realizado una medida, pero las filas que contienen NaN se pueden filtrar antes del procesamiento.
4. Utilice la función matchNaN para buscar los índices de los puntos que se han marcado como NaN.
Los datos de las filas 257 y 278 se han reemplazado por la constante integrada NaN:
5. Utilice la función IsNaN para comprobar si el año 1957 se ha marcado como NaN en los conjuntos Data y MarkedData.
6. Trace el nuevo conjunto de datos y compárelo con el conjunto anterior.
Los valores atípicos del conjunto de datos original no se realzan en azul, puesto que el gráfico omite las constantes NaN registradas en el conjunto MarkedData.
7. Utilice la función filterNaN para filtrar la matriz MarkedData definida para quitar las filas que contengan constantes NaN.
8. Utilice la función rows para calcular el número de filas de los conjuntos Data y FilteredData.
El número de filas en FilteredData se ha reducido en dos:
9. Utilice la función mean para calcular la media de los conjuntos MarkedData y FilteredData.
La estadística se puede recopilar para el conjunto FilteredData, pero no para el conjunto MarkedData.