함수 > 실험 계획법 > 회귀 분석 > 다변수 다항식 회귀의 통계
다변수 다항식 회귀의 통계
polyfitstat(X, Y, n/"terms"/M, [conf]) - 행렬 Y에 기록된 결과를 행렬 X에 있는 데이터에 맞추는 다항식 회귀 모델에 대한 통계 데이터를 구합니다. 문자열 “terms” 또는 행렬 M에 지정한 것처럼 항이나 다항식 차수 n으로 다항식 회귀 방정식을 정의할 수 있습니다. 다항 적합식에 절편을 포함하지 않으려는 경우에는 행렬 M을 사용합니다. 신뢰 구간을 기본 95%가 아닌 다른 값으로 지정하려면 선택적 인수 conf를 사용합니다.
polyfitstat을 사용하여 구한 행렬의 둘째 열에는 다음 요소가 포함됩니다.
설명
1
Y의 표준 편차
2, 3, 4
R2, 조정된 R2 및 예측된 R2
5
PRESS - 예측 오차 제곱합(잉여값 배율 조정에 사용)
6
자기상관에 대한 더빈-왓슨(Durbin-Watson) 검사 통계값
7
polyfitc로 구한 회귀 계수의 행렬
8
anova로 구한 결과 표와 열이 동일하고 행이 다음과 같은 회귀 모델의 분산분석 행렬
회귀 - 부분합(절편을 제외한 각 항에 대해 추가 분할)
잉여값(오차) - 부분합(낮은 적합도 오차와 순수 실험 오차로 추가 분할)
회귀 모델에 대한 합계
9
열이 다음과 같은 진단 행렬
1. 각 실행(Run) 또는 데이터 점에 대해 매긴 번호
2. 각 실행(Run) 또는 데이터 점에 대해 관측한 결과
3. 조사 대상인 회귀 모델을 통해 예측한 결과
4. 잉여값(Residual) - 관측한 결과와 예측한 결과 사이의 차이
5. 지렛대값(Leverage) - 관측한 결과와 모든 관측 결과 중심에 놓여 있는 점 사이의 간격에 대한 측정치
6. 스튜던트화된 잉여값(Studentized residual) - 관측한 결과에 기반하여 분산으로 나눈 잉여값
7. R 스튜던트(R-student) - 관측 결과가 제외된 데이터 집합에 기반하여 분산으로 나눈 잉여값
8. 쿡의 거리(Cook’s distance) - 관측한 결과가 다른 모든 데이터 점에 미치는 영향에 대한 측정치
9. DFFITS - 관측 결과가 포함된 데이터 집합에 기반하여 회귀 모델을 통해 예측한 결과와 관측 결과가 제외된 다른 모델을 통해 예측한 결과 사이의 차이
인수
X는 각 열이 독립 변수를 나타내는 행렬 또는 설계 행렬입니다. X의 각 열은 단위가 서로 호환되어야 합니다.
Y는 측정되거나 시뮬레이션된 결과로 이루어지는 벡터 또는 행렬이며, 각 행에는 X에 정의된 각 실행 또는 데이터 점에 대한 결과가 포함됩니다. 포함된 반복측정치의 수가 동일하지 않은 행이 있으면 Y의 빈 요소를 NaN으로 채워야 합니다. Y의 요소는 단위가 서로 호환되어야 합니다.
n은 다항식의 차수를 지정하는 정수입니다. 총 데이터 점 수 1 ≤ n ≤ length(Y) − 1보다 작아야 합니다. 그렇지 않으면 문제의 제약 조건이 부족하여 고유한 해를 구할 수 없게 됩니다.
“terms”는 다항식 회귀에 포함할 항을 지정하는 문자열이거나, 인수 및 상호 작용을 지정하는 문자열입니다. "A B AB AA BB"는 다음 항을 포함하는 다항식을 의미합니다.
c0 + c1 ∙ A + c2 ∙ B + c3 ∙ A ∙ B + c4 ∙ A2 + c5 ∙ B2
구분 기호로는 공백, 쉼표, 콜론 또는 세미콜론을 사용할 수 있습니다.
M은 다항식을 지정하는 행렬입니다. 첫째 열에는 계수에 대한 추측값이 포함되고 나머지 열에는 각 항에 대한 독립 변수의 거듭곱이 포함됩니다. 앞서 설명한 다항식의 경우 M을 다음과 같이 정의합니다.
conf는 원하는 신뢰 한계를 나타내는 선택적 인수입니다. 이는 0 이상, 1 이하의 숫자로 표현되는 백분율입니다. 기본값은 95% 신뢰 구간을 나타내는 conf = 0.95입니다.
도움이 되셨나요?