函数 > 数据分析 > 离群值和 NaN > 示例:离群值检测
  
示例:离群值检测
利用 GrubbsGrubbsClassicThreeSigmaboxplot 函数,通过三种不同方法查找离群值,以检测离群值。
1. 定义描述热流的矢量。
单击复制此表达式
2. 绘制数据和数据均值的图像。
单击复制此表达式
单击复制此表达式
单击复制此表达式
单击复制此表达式
单击复制此表达式
散点图对定位潜在离群值很有用,但除非离群值偏离程度严重并且稀少,否则很难检测到。可以通过计算定量度量来确定哪些点为离群值点。
3. 定义显著性水平。
单击复制此表达式
4. 调用 Grubbs 函数标识数据集中的离群值。
单击复制此表达式
第一列给出各个标识为离群值的点的索引 (其检验统计量超出格鲁布斯法检验统计量)。
单击复制此表达式
单击复制此表达式
第二列给出各个离群值的检验统计量 (离群值距均值的距离,绝对值形式)。
单击复制此表达式
第三列给出各个离群值的检验统计量距格鲁布斯法检验统计量的距离。
单击复制此表达式
5. 调用 GrubbsClassic 查找最可能为离群值的单个点。
单击复制此表达式
索引值为 19 的点最可能为离群值点。这些列与 Grubbs 函数返回的矩阵的列具有相同的含义。
6. 调用 ThreeSigma 函数查找落在 3 sigma 区域以外的数据点。
单击复制此表达式
像使用 Grubbs 函数一样,第一列给出索引,而第二列给出离群值的检验统计量。
这些数据点中的每个数据点的检验统计量均大于 3。
ThreeSigma 未检测到任何离群值时,将返回最接近离群值的点。
7. 根据四分位距法调用 boxplot 函数检测离群值,同时创建箱线图以查看这些离群值。
单击复制此表达式
单击复制此表达式
利用四分位距法检测到四个离群值。
也可以在通过利用残差分析将数据拟合到函数之后检测离群值。