函數 > 數據分析 > 離群值與 NaN > 範例:檢測離群值的格拉布斯方法
  
範例:檢測離群值的格拉布斯方法
格拉布斯檢驗統計
Grubbs 函數所使用的方法,計算格拉布斯檢驗統計,以檢測離群值。比較格拉布斯檢驗統計與離群值的檢驗統計。
1. 定義數據集,以描述熱流實驗,並加以繪製。
按一下以複製此運算式
按一下以複製此運算式
按一下以複製此運算式
按一下以複製此運算式
按一下以複製此運算式
按一下以複製此運算式
2. 定義自由度為 N - 2 且顯著程度為 alpha/(2N) 的 T-測試臨界值。
按一下以複製此運算式
* 
函數 qt 計算累積逆 T-測試的機率密度。
3. 將格拉布斯檢驗統計定義為 alpha 函數。
按一下以複製此運算式
4. 定義信心水準為 90% 的顯著程度。
按一下以複製此運算式
5. 呼叫 Grubbs 函數檢測離群值。
按一下以複製此運算式
Grubbs 函數可接受矩陣作為輸入,在此狀況下時,它會傳回離群值陣列位置的索引巢狀配對。
6. 比較格拉布斯檢驗統計與離群值的檢驗統計。
按一下以複製此運算式
這兩個離群值有大於格拉布斯檢驗統計的檢驗統計。即使傳回多個索引,也不表示所有的候備內容都一定是離群值。這是因為若移除候備內容,臨界值及檢驗統計變更之故。兩項都依存於 N
因為格拉布斯檢驗假設使用的是常態數據,所以可以檢查數據是否依循常態分佈。例如,您可在處理前先使用視覺化的檢測,如常態機率圖。
GrubbsClassic
使用 GrubbsClassic 函數求解數據集中最可能成為離群值的點。
1. 計算上述數據集的最大檢驗統計。
按一下以複製此運算式
2. 定義 98% 信心區間的 alpha 值。
按一下以複製此運算式
3. 比較格拉布斯檢驗統計與 Gmax
按一下以複製此運算式
按一下以複製此運算式
此顯著程度未檢測到任何離群值。
4. 呼叫 GrubbsClassic 函數。
按一下以複製此運算式
GrubbsClassic 所傳回的點不是離群值,但卻是最可能成為離群值的數據點。
離群值檢測的極限機率
使用特別建構的 root 計算檢測到離群值的極限機率。
按一下以複製此運算式
當 alpha 大於 α_limit 時,即會檢測到離群值;換言之,當信心區間小於 (1 - α_limit) 時:
按一下以複製此運算式
此與上述結果一致。98% 信心區間未檢測到任何離群值,但 90% 信心區間檢測到兩個離群值。