函数 > 数据分析 > 离群值和 NaN > 示例:用于检测离群值的格鲁布斯法
  
示例:用于检测离群值的格鲁布斯法
格鲁布斯法检验统计
Grubbs 函数可通过计算格鲁布斯法检验统计来检测检群值。比较格鲁布斯法检验统计和离群值检验统计。
1. 定义描述热流实验的数据集并将其绘制出来。
单击复制此表达式
单击复制此表达式
单击复制此表达式
单击复制此表达式
单击复制此表达式
单击复制此表达式
2. 定义具有 N - 2 个自由度及显著性水平 alpha/(2N) 的 t 分布的临界值。
单击复制此表达式
* 
函数 qt 可计算 t 分布的逆累积概率密度。
3. 将格鲁布斯法检验统计定义为 alpha 的函数。
单击复制此表达式
4. 定义置信度为 90% 的显著性水平。
单击复制此表达式
5. 调用 Grubbs 函数以检测离群值。
单击复制此表达式
Grubbs 函数可接受矩阵作为输入,这样便可返回离群值数组位置的嵌套索引对。
6. 比较格鲁布斯法检验统计和离群值检验统计。
单击复制此表达式
这两个离群值的检验统计大于格鲁布斯法检验统计。即使返回多个索引,也并不意味着所有候选项均为离群值。这是因为,如果移除候选项,临界值和检验统计会发生变化。两者均取决于 N
由于格鲁布斯法检验假设数据呈正态分布,因此有必要检查您的数据是否具有正态分布。例如,您可以在处理之前使用可视化检验 (如正态概率图)。
GrubbsClassic
使用 GrubbsClassic 函数求出数据集中最有可能成为离群值的点。
1. 计算上述数据集最大的检验统计。
单击复制此表达式
2. 针对 98% 的置信区间定义 alpha。
单击复制此表达式
3. 比较格鲁布斯法检验统计与 Gmax
单击复制此表达式
单击复制此表达式
未在此显著性水平检测到离群值。
4. 调用 GrubbsClassic 函数。
单击复制此表达式
GrubbsClassic 返回的点不是离群值,但它是最有可能成为离群值的点。
离群值检测的极限概率
使用特殊结构 root 计算检测到离群值的极限概率。
单击复制此表达式
当 alpha 大于 α_limit 或置信区间小于 (1 - α_limit) 时,会检测到离群值。
单击复制此表达式
这与前面的结论相符。未检测到 98% 置信区间的离群值,但检测到两个 90% 置信区间的离群值。