函数 > 数据分析 > 离群值和 NaN > 离群值检测和移除
  
离群值检测和移除
GrubbsGrubbsClassicThreeSigma 函数可检测数据集中的离群值。trim 函数可将具有指定索引的行从数据集中移除。
Grubbs(v, a) - 可针对数据随机取一个给定值而得到的概率 a,返回可疑离群值的索引、该离群值的检验统计,以及其距临界统计值的距离。
GrubbsClassic(v, a) - 可针对数据随机取一个给定值而得到的概率 a,返回其中最有可能是离群值的数据点、其检验统计以及其距临界统计值的距离。
ThreeSigma(v) - 返回 v 中的点 (检验统计值大于三) 的索引,以及每个点的索引值。
trim(v, vindex) - 截掉 vindex 所指定的条目 (行)。
用于检测离群值的检验统计值是点到数据集均值的距离除以标准差。
如果使用的是实矩阵而不是矢量,则检测离群值的函数将返回作为嵌套矩阵的每个候选离群值的索引对。
自变量
v 为表示数据点的实矢量或矩阵。
a 为概率 (0 < a < 1)。
vindex 为整数值矢量。vindex 中指定的索引与 ORIGIN 相关。