範例:離群值檢測
使用三種不同的方法檢測離群值,利用 Grubbs、GrubbsClassic、ThreeSigma 及 boxplot 函數求解離群值。
1. 定義向量,以描述熱流。
2. 繪製數據與數據均數。
散佈圖對尋找可能的離群值很有幫助,但除非離群值很嚴重又不常見,否則難以檢測。您可計算定量的矩陣,以決定離群值的點。
3. 定義顯著程度。
4. 呼叫 Grubbs 函數找出數據集中的離群值。
第一欄提供視為離群值之各點的索引 (其檢驗統計超過格拉布斯檢驗統計)。
第二欄提供每個離群值的檢驗統計 (離群值距離均數的絕對項)。
第三欄提供每個離群值檢驗統計到格拉布斯檢驗統計的距離。
5. 呼叫 GrubbsClassic 求解最可能成為離群值的單一點。
索引值為 19 的點最有可能成為離群值。這些欄的意義與 Grubbs 函數傳回的矩陣欄相同。
6. 呼叫 ThreeSigma 函數求解落在三標準差 (3 sigma) 區域外的數據點。
至於使用 Grubbs 函數時,第一欄會提供索引,第二欄則提供離群值的檢驗統計。
這些數據點的每個檢驗統計都大於 3。
當 ThreeSigma 檢測不到任何離群值時,會傳回最可能成為離群值的點。
7. 呼叫 boxplot 函數根據四分位距法檢測離群值,並建立箱形圖以檢視離群值。
使用四分位距法檢測到四個離群值。
您也可以在擬合數據與函數之後,使用殘差分析檢測離群值。