離群值偵測與移除
Grubbs、GrubbsClassic 與 ThreeSigma 函數會檢測數據集中的離群值。trim 函數會從數據集移除具有指定索引的列。
• Grubbs(v, a) - 針對數據隨機採用特定值的機率 a,傳回疑似離群值的索引、該離群值的檢驗統計,以及其與臨界統計的距離。
• GrubbsClassic(v, a) - 針對數據隨機採用特定值的機率 a,傳回最可能為離群值的數據點索引、其檢驗統計,以及其與臨界統計的距離。
• ThreeSigma(v) - 傳回 v 中檢驗統計大於三的點索引,以及每個點的此數量值。
• trim(v, vindex) - 去除由 vindex 所指定的項目 (列)。
用於檢測離群值的檢驗統計是數據集某點到均數的距離,再除以標準差。
使用實數矩陣取代向量時,檢測離群值的函數會傳回代表巢狀矩陣之每個可能離群值的成對索引。
引數
• v 是表示數據點的實數向量或矩陣。
• a 是 0 < a < 1 的機率。
• vindex 是整數向量。vindex 中指定的索引與 ORIGIN 相關。