関数 > 実験計画 > 回帰分析 > 例: 適合の質
例: 適合の質
polyfit関数とpolyfitstat関数を使用して線形回帰と分散分析を行って、適合の質を検定します。
1. 重合プロセスの実験データのテーブルを定義します。反応温度 t と触媒供給速度 fr はポリマーの粘性 vy に影響を与えます。
クリックしてこの式をコピー
適合の質
2. polyfit 関数を呼び出して、データを線形回帰としてモデル化します。
クリックしてこの式をコピー
クリックしてこの式をコピー
3. 各温度と供給速度の設定で予測される粘度を計算します。
クリックしてこの式をコピー
クリックしてこの式をコピー
クリックしてこの式をコピー
4. 残差 (モデルから計算された予測値と測定値の差) を計算します。
クリックしてこの式をコピー
5. 残差を粘性の測定値、温度、供給速度に対してプロットします。
クリックしてこの式をコピー
クリックしてこの式をコピー
クリックしてこの式をコピー
残差プロットから、粘性が高くなるにしたがって粘性の測定値の分散が大きくなり、温度が高くなるにしたがって温度の分散が大きくなることがわかります。
6. polyfitstat を呼び出して、この線形モデルの各種統計量を計算します。polyfitstat によって返された行列の行 8 に格納されている ANOVA 行列を表示します。
クリックしてこの式をコピー
クリックしてこの式をコピー
ANOVA 行列では分散のデータ項目に回帰要素と残差要素があります。回帰要素は回帰係数ごとに分かれています。ただし、実験結果 vy にはレプリケートがないので、残差の項目で Lack of Fit 検定による誤差か単なる誤差かを区別することはできません。
回帰での ANOVA テーブルの計算と使用
1. 二乗和誤差 (SSE) を計算します。
クリックしてこの式をコピー
二乗和誤差は、適合が良好であるかどうかを判断するときの一般的な指標である χ2 と等しくなります。これは、最小二乗解を計算するときに最小化される値です。二乗和誤差はモデルがデータにどの程度適合しているかを判断するときの指標となり、回帰によって説明されない偏差の量を示します。
2. 自由度の合計 df_total およびパラメータ df_param の自由度を基に、誤差 df_error の自由度を定義します。自由度はデータの数から適合パラメータの数を引いたものです。
クリックしてこの式をコピー
クリックしてこの式をコピー
クリックしてこの式をコピー
3. 二乗和の合計 (SST) を基にして、回帰による二乗和 (SSR) を定義します。
クリックしてこの式をコピー
クリックしてこの式をコピー
4. 二乗平均誤差 (MSE) と回帰二乗平均 (MSR) を定義します。誤差を適切な自由度によって除算します。
クリックしてこの式をコピー
クリックしてこの式をコピー
5. 適合の性質を明らかにするための分散分析テーブルを作成します。
二乗和
DF
二乗平均
F 係数
回帰
クリックしてこの式をコピー
クリックしてこの式をコピー
クリックしてこの式をコピー
クリックしてこの式をコピー
誤差
クリックしてこの式をコピー
クリックしてこの式をコピー
クリックしてこの式をコピー
合計
クリックしてこの式をコピー
クリックしてこの式をコピー
上記のテーブルを ANOVA 行列 polyfitstat と比較できます。
クリックしてこの式をコピー
6. モデルがデータにどの程度適合しているかを次の式によって推定します。
クリックしてこの式をコピー
クリックしてこの式をコピー
これは、粘性のばらつきの 92.7% が線形回帰モデルによって説明されることを示しています。
7. 仮説検定の有意水準を定義して、モデルがデータに適合しているかどうかを検定します。
クリックしてこの式をコピー
8. F の臨界値を計算します。
クリックしてこの式をコピー
9. モデルがデータに適合しているという仮説を検定します。
クリックしてこの式をコピー
この仮説を採択します。ポリマーの粘性の予測にこの線形回帰モデルを使用できることがわかりました。
参考文献
Montgomery, D.C., Design and Analysis of Experiments, 5th ed., John Wiley & Sons, New York, 2001, pp. 398
これは役に立ちましたか?