polyfitc, line, slope 및 intercept 함수를 사용하여 x-y 데이터 집합을 통과하는 최적합 최소자승 선을 찾습니다. stderr 함수를 사용하여 적합식 매개변수의 오차를 계산합니다. 최적합 선을 중심으로 하는 신뢰 한계를 계산하고 신뢰 구간을 정합니다.
최적합 선
다양한 거리를 운전하는 데 걸리는 시간을 추정하는 선형 함수를 만듭니다.
1. 마일 단위의 거리 집합과 해당 거리를 운전하는 데 걸리는 분 단위의 시간을 정의합니다.
2. 일변수 선형 회귀 방정식을 정의합니다.
3. polyfitc를 호출하여 회귀 계수 a와 b를 구합니다.
x 값 각각에 대해 T의 값과 회귀 방정식 f를 통해 계산한 값 사이의 차이를 최소화하는 방식으로 계수가 구해집니다. 풀이 구간 및 minimize 함수를 사용하여 제곱의 합을 최소화해 보면 이 사실을 확인할 수 있습니다.
4. 선의 각 점을 기준으로 거리를 측정했을 때 그 거리의 제곱에 대한 합을 최소화하는 최적합 선을 정의합니다.
원래 관측한 데이터에 근접한 값에 대해서만 선형 회귀 또는 기타 유형의 회귀를 통해 매개변수화된 방정식을 사용해야 합니다. 위 데이터에 대한 최적합 선을 살펴보면 0마일의 거리를 이동하는 데 다음 시간이 걸린다는 예측이 가능합니다.
그러나 측정 시간이 엄격한 의미에서 일정한 속도로 이동하는 데 걸리는 시간을 말한다면 이와 같은 예측은 이치에 맞지 않습니다. 이러한 유형의 결과는 때로 특정 물리 현상을 나타낼 수 있습니다. 이 경우 0마일을 운전하는 데 필요한 시간을 신호등 앞에서 기다리는 평균 시간으로 해석할 수 있습니다.
5. 데이터 점과 최적합 선을 도표화합니다.
기울기와 절편을 계산하는 다른 방법
최적합 선의 기울기와 절편을 계산하는 데는 여러 가지 방법이 있습니다. 예를 들어 line 함수를 사용하여 slope 함수와 intercept 함수를 결합할 수 있습니다. 또 다른 방법으로는 행렬 계산이나 통계 관계를 사용하는 방법이 있습니다.