Funciones > Análisis de datos > Valores atípicos y constante NaN > Ejemplo: detección y eliminación de constantes NaN
  
Ejemplo: detección y eliminación de constantes NaN
Utilice la función markNaN para marcar valores atípicos como NaN (no es un número) en conjuntos de datos. Utilice las funciones IsNaN, matchNaN y filterNaN para administrar NaN.
1. Lea un fichero que contenga el número de manchas solares registradas durante los tres últimos siglos y trace los datos.
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
2. Utilice la función ThreeSigma para buscar los índices de los valores atípicos.
Pulse aquí para copiar esta expresión
Los valores atípicos son el número de manchas solares registradas durante los siguientes años:
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
3. Utilice la función markNaN para marcar como NaN los valores atípicos de la columna 1 de los datos.
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
El reemplazo de los datos por NaN indica que se ha realizado una medida, pero las filas que contienen NaN se pueden filtrar antes del procesamiento.
4. Utilice la función matchNaN para buscar los índices de los puntos que se han marcado como NaN.
Pulse aquí para copiar esta expresión
Los datos de las filas 257 y 278 se han reemplazado por la constante integrada NaN:
5. Utilice la función IsNaN para comprobar si el año 1957 se ha marcado como NaN en los conjuntos Data y MarkedData.
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
6. Trace el nuevo conjunto de datos y compárelo con el conjunto anterior.
Pulse aquí para copiar esta expresión
Los valores atípicos del conjunto de datos original no se realzan en azul, puesto que el gráfico omite las constantes NaN registradas en el conjunto MarkedData.
7. Utilice la función filterNaN para filtrar la matriz MarkedData definida para quitar las filas que contengan constantes NaN.
Pulse aquí para copiar esta expresión
8. Utilice la función rows para calcular el número de filas de los conjuntos Data y FilteredData.
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
El número de filas en FilteredData se ha reducido en dos:
9. Utilice la función mean para calcular la media de los conjuntos MarkedData y FilteredData.
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
La estadística se puede recopilar para el conjunto FilteredData, pero no para el conjunto MarkedData.