函數 > 數據分析 > 離群值與 NaN > 範例:離群值檢測
  
範例:離群值檢測
使用三種不同的方法檢測離群值,利用 GrubbsGrubbsClassicThreeSigmaboxplot 函數求解離群值。
1. 定義向量,以描述熱流。
按一下以複製此運算式
2. 繪製數據與數據均數。
按一下以複製此運算式
按一下以複製此運算式
按一下以複製此運算式
按一下以複製此運算式
按一下以複製此運算式
散佈圖對尋找可能的離群值很有幫助,但除非離群值很嚴重又不常見,否則難以檢測。您可計算定量的矩陣,以決定離群值的點。
3. 定義顯著程度。
按一下以複製此運算式
4. 呼叫 Grubbs 函數找出數據集中的離群值。
按一下以複製此運算式
第一欄提供視為離群值之各點的索引 (其檢驗統計超過格拉布斯檢驗統計)。
按一下以複製此運算式
按一下以複製此運算式
第二欄提供每個離群值的檢驗統計 (離群值距離均數的絕對項)。
按一下以複製此運算式
第三欄提供每個離群值檢驗統計到格拉布斯檢驗統計的距離。
按一下以複製此運算式
5. 呼叫 GrubbsClassic 求解最可能成為離群值的單一點。
按一下以複製此運算式
索引值為 19 的點最有可能成為離群值。這些欄的意義與 Grubbs 函數傳回的矩陣欄相同。
6. 呼叫 ThreeSigma 函數求解落在三標準差 (3 sigma) 區域外的數據點。
按一下以複製此運算式
至於使用 Grubbs 函數時,第一欄會提供索引,第二欄則提供離群值的檢驗統計。
這些數據點的每個檢驗統計都大於 3。
ThreeSigma 檢測不到任何離群值時,會傳回最可能成為離群值的點。
7. 呼叫 boxplot 函數根據四分位距法檢測離群值,並建立箱形圖以檢視離群值。
按一下以複製此運算式
按一下以複製此運算式
使用四分位距法檢測到四個離群值。
您也可以在擬合數據與函數之後,使用殘差分析檢測離群值。