Funciones > Análisis de datos > Ajuste de curvas > Ejemplo: regresión lineal
  
Ejemplo: regresión lineal
Utilice las funciones polyfitc, line, slope y intercept para buscar la línea de mínimos cuadrados de trayectoria de ajuste en un conjunto de datos x-y. Utilice la función stderr para calcular el error de los parámetros ajustados. Calcule los límites de confianza alrededor de la línea de trayectoria de ajuste y cree intervalos de confianza.
Línea de trayectoria de ajuste
Cree una función lineal para realizar un cálculo aproximado del tiempo necesario para recorrer distintas distancias.
1. Defina un conjunto de distancias en millas y el tiempo que se tarda, en minutos, en recorrer dichas distancias.
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
2. Defina una ecuación de regresión lineal univariada.
Pulse aquí para copiar esta expresión
3. Llame a polyfitc para calcular los coeficientes de regresión a y b.
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
Los coeficientes son tales que la diferencia entre los valores de T y los valores calculados por la ecuación de regresión f es mínima para cada valor x. Para verificarlo, utilice un bloque de resolución y la función minimize para minimizar la suma de cuadrados:
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
4. Defina la línea de trayectoria de ajuste que minimiza la suma de los cuadrados de las distancias desde cada punto hasta la línea.
Pulse aquí para copiar esta expresión
Solo debe utilizar la ecuación parametrizada de la regresión lineal o de cualquier otro tipo para los valores que se acerquen a los datos originales observados. La línea de trayectoria de ajuste para los datos anteriores predice que se tarda el tiempo siguiente en recorrer una distancia de 0 millas:
Pulse aquí para copiar esta expresión
Esto no tiene sentido si el tiempo medido es únicamente el tiempo de viaje a una velocidad constante. A veces, este tipo de resultado indica un fenómeno físico determinado. En este caso, el tiempo necesario para recorrer cero millas se puede interpretar como el tiempo de espera medio en semáforos.
5. Trace los puntos de datos y la línea de trayectoria de ajuste.
Pulse aquí para copiar esta expresión
Métodos alternativos para calcular la pendiente y la intercepción
Existen varios métodos para calcular la pendiente y la intercepción para la línea de trayectoria de ajuste. Por ejemplo, la función line combina las funciones slope e intercept. Otros métodos incluyen cálculos de matrices o relaciones estadísticas.
1. Llame a las funciones intercept y slope.
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
2. Llame a la función line.
Pulse aquí para copiar esta expresión
3. Utilice el cálculo de matrices por medio de la función augment.
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
4. Utilice las relaciones estadísticas por medio de las funciones stdev, corr, mean y slope.
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
5. Utilice un gráfico para mostrar que la línea de mínimos cuadrados siempre pasa por el punto (mean(X), mean(T)):
Pulse aquí para copiar esta expresión
Errores estándar
Calcule el error estándar del cálculo aproximado (también conocido como error estándar) para medir la adecuación del ajuste lineal anterior. Calcule también el error de la pendiente y la intercepción.
1. Defina los grados de libertad de movimiento (el número de puntos de datos menos el número de parámetros ajustados).
Pulse aquí para copiar esta expresión
2. Llame a la función stderr para calcular el error estándar del cálculo aproximado para la línea de trayectoria de ajuste definida anteriormente.
Pulse aquí para copiar esta expresión
Esta es la raíz cuadrada del error cuadrático medio (MSE) o σ2:
Pulse aquí para copiar esta expresión
3. Compare el error estándar calculado con el error estándar que ha devuelto la función polyfitstat.
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
4. Calcule los errores estándar de la pendiente y la intercepción.
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
5. Repita el cálculo anterior con el cálculo de matrices.
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
6. Utilice la función augment para mostrar que los errores estándar de cada coeficiente de regresión se graban en la matriz que ha devuelto la función polyfitc.
Pulse aquí para copiar esta expresión
Intervalos de confianza para cada coeficiente
Utilice los cálculos aproximados anteriores, junto con los puntos de percentil de la distribución t de Student, para crear un intervalo de confianza de los cálculos aproximados de la pendiente y la intercepción.
1. Defina el nivel de significancia de un intervalo de confianza del 98% y utilice la función qt para calcular el factor t.
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
2. Calcule los límites de confianza de la pendiente.
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
Hay un 98% de posibilidades de que el valor real de la pendiente se encuentre entre SL y SU.
3. Calcule los límites de confianza de la intercepción.
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
El amplio rango de este valor refleja el elevado nivel de dispersión de los datos.
4. Llame a la función confidence para repetir los pasos del 1 al 3.
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
La función confidence devuelve el ancho de los intervalos de confianza en la primera columna y el factor t en la segunda columna. Al dividir los anchos por el factor t, obtendrá los errores estándar de ambos parámetros:
Pulse aquí para copiar esta expresión
5. Para buscar los límites de confianza, se puede añadir o sustraer el ancho del parámetro pertinente:
Pulse aquí para copiar esta expresión
6. Utilice la función augment para mostrar que los errores estándar de cada coeficiente de regresión se graban en la matriz que ha devuelto la función polyfitc.
Pulse aquí para copiar esta expresión
Intervalos de confianza para la regresión
1. Utilice las funciones length y mean para calcular un intervalo de confianza para la propia regresión.
Pulse aquí para copiar esta expresión
2. Utilice la función anterior para calcular el intervalo de confianza de cualquier valor x previsto:
Pulse aquí para copiar esta expresión
3. Utilice el cálculo de matrices:
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
4. Trace los datos, la línea de trayectoria de ajuste y el intervalo de confianza de toda la región de regresión.
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
La región de confianza para los valores previstos se estrecha cerca del centro de los valores medidos. Esto se debe a que las fórmulas utilizadas para calcular la regresión se basan en la media, por lo que los valores previstos más cercanos a la media de los datos son más precisos.
5. Calcule los límites de confianza de los valores medidos. Estos límites son ligeramente diferentes de los límites para los valores previstos.
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
6. Utilice el cálculo de matrices:
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
7. Trace los límites de confianza como una traza de error.
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
Pulse aquí para copiar esta expresión
* 
Es posible utilizar los gráficos como una forma de detección de valores atípicos, donde los valores medidos que no se encuentran dentro de los intervalos de confianza indican un valor atípico.