関数 > 実験計画 > 回帰分析 > 例: 影響の大きい測定値の特定
  
例: 影響の大きい測定値の特定
関数 polyfitstatを使用して、多変量多項式回帰の作成に使用する測定値を検定します。
1. 25 から 34 才の健康な 20 人の被験者から得られたサンプルを含む行列を定義します。
クリックしてこの式をコピー
行列の列は、20 人の各被験者の上腕三頭筋皮下脂肪厚、大腿囲、および体脂肪率をそれぞれ表します。
クリックしてこの式をコピー
クリックしてこの式をコピー
クリックしてこの式をコピー
2. 関数 rowsおよび colsを使用して、行と列の数を計算します。
クリックしてこの式をコピー
クリックしてこの式をコピー
3. augment関数を使用して、この行列の最初の 2 列として行列 BM を定義します。これらの測定値を使用して被験者の体脂肪量を予測します。
クリックしてこの式をコピー
4. polyfitstat を呼び出して線形回帰式によって被験者をモデル化し、回帰統計量を計算します。
クリックしてこの式をコピー
5. 出力行列 P の行 7 に格納されている回帰係数行列を表示します。
クリックしてこの式をコピー
6. 行列計算を使用して回帰係数を計算します。
クリックしてこの式をコピー
クリックしてこの式をコピー
クリックしてこの式をコピー
クリックしてこの式をコピー
クリックしてこの式をコピー
クリックしてこの式をコピー
これらの回帰係数は次の方程式に対応しています。
クリックしてこの式をコピー
クリックしてこの式をコピー
7. 回帰方程式を使用して、体脂肪量の予測値を計算します。この予測値を、実際に測定した体脂肪量と比較します。
クリックしてこの式をコピー
クリックしてこの式をコピー
8. submatrix 関数を使用して、出力行列 P の 1 行目にあるモデルの統計量を表示します。
クリックしてこの式をコピー
1 つ目の統計量は回帰の標準偏差です。
クリックしてこの式をコピー
9. 出力行列 P の最後の入れ子行列に格納されているモデル診断を表示します。
クリックしてこの式をコピー
測定値と予測値が、手順 7 で表示した値と一致しています。残差は、測定値と予測値の差です。
10. 残差、つまり測定値と予測値の差を計算します。
クリックしてこの式をコピー
11. 関数 diagを使用して、行列 H のてこ比、つまり対角値を計算します。
クリックしてこの式をコピー
12. スチューデント化残差を次のように計算します。
クリックしてこの式をコピー
外的スチューデント化残差 (R-student) は次のように計算されます。定数 p は回帰係数の数、S2 は i 番目の測定値を除去したデータセットに基づく s2 の予測値です。
クリックしてこの式をコピー
クリックしてこの式をコピー
クリックしてこの式をコピー
13. クックの距離を使用して、削除した点が線形回帰に与える全体的な影響を測定します。
クリックしてこの式をコピー
14. すべての測定値を適合関数に含めたときの予測値と、i 番目の測定値を省略したときの予測値の差を計算します。
クリックしてこの式をコピー
15. 関数augmentおよび stackを使用して、上記の統計を収集します。
クリックしてこの式をコピー
クリックしてこの式をコピー
クリックしてこの式をコピー
クリックしてこの式をコピー
クリックしてこの式をコピー
16. 関数 maxおよび qtを使用して、データセット内の最大の R-student 値を決定します。Bonferroni 検定を使用して、対応する測定値が外れ値であるかどうかを判断します。
クリックしてこの式をコピー
クリックしてこの式をコピー
クリックしてこの式をコピー
R-student の最大値が Bonferroni 検定の値より小さいので、それに対応する測定値は外れ値ではありません。
17. DFFITS の最大値を決定します。
クリックしてこの式をコピー
値が 1 をわずかに上回っているだけなので、対応する測定値の影響は必ずしも大きくありません。
18. クック距離をランに対してプロットすることで、影響についてのインデックスグラフを作成します。
クリックしてこの式をコピー
run2 はデータセットの中で最も影響が大きい測定値です。手順 10 で特定した測定値 run12 も影響を及ぼしますが、影響の度合いは run2 よりもはるかに小さいものです。
参考文献
参考文献: Neter, J., Kutner, M.H., Nachtsheim, C.J., Wasserman, W., Applied Linear Statistical Models, 4th ed., McGraw-Hill/Irwin, Boston, 1996, pp.375