函数
>
数据分析
>
离群值和 NaN
> 示例:离群值移除
示例:离群值移除
使用
trim
函数可在处理数据集之前从中移除离群值。
1.
定义描述热流的数据集。
y
9.206
9.3
9.278
9.175
9.275
9.289
9.287
9.261
9.303
9.276
9.273
9.288
9.256
9.252
9.298
9.267
9.257
9.278
9.248
9.35
9.276
9.279
9.267
9.246
9.238
9.269
9.248
9.257
9.268
9.288
9.258
9.286
9.251
9.257
9.268
9.291
9.219
9.27
9.219
9.241
9.27
9.227
9.259
9.286
9.32
9.328
9.263
9.248
9.239
9.225
9.221
9.271
9.252
9.281
9.271
9.295
9.302
9.279
9.237
9.234
9.245
9.222
9.207
9.259
9.276
9.269
9.257
9.265
9.296
9.293
9.264
9.281
9.267
9.301
9.253
9.261
9.238
9.225
9.236
9.24
9.264
9.244
9.278
9.311
9.262
9.26
9.253
9.246
9.284
9.251
9.275
9.255
9.28
9.275
9.262
9.275
9.252
9.23
9.255
9.269
9.29
9.274
9.256
9.262
9.25
9.262
9.264
9.265
9.242
9.24
9.222
9.242
9.215
9.286
9.272
9.266
9.285
9.269
9.268
9.246
9.231
9.241
9.261
9.274
9.292
9.271
9.267
9.309
9.264
9.279
9.255
9.229
9.253
9.256
9.263
9.22
9.258
9.268
9.268
9.249
9.235
9.243
9.253
9.263
9.243
9.261
9.26
9.253
9.241
9.239
9.264
9.243
9.247
9.252
9.262
9.247
9.306
9.238
9.249
9.257
9.266
9.299
9.245
9.287
9.301
9.257
9.271
9.275
9.282
9.253
9.269
9.282
9.278
9.285
9.24
9.268
9.248
9.225
9.231
9.27
9.265
9.284
9.281
9.263
9.292
9.252
9.244
9.283
9.18
9.231
9.233
9.235
9.217
9.274
9.274
2.
使用
Grubbs
函数检验离群值。
G
Grubbs
y
0.85
3.
创建包含离群值索引的矢量。
j
0
rows
G
1
vindex
j
G
j
0
vindex
4.
为
y
数据集的每行分配一个编号。
i
0
length
y
1
x
i
i
data
augment
x
y
5.
移除离群值。
datanew
trim
data
vindex
datanew
数组的行数比原始数据集的行数少:
rows
data
rows
datanew
6.
绘制原始数据集和裁剪后的数据集的图像。
lines
lines
11
x
datanew
0
0
200
12
y
datanew
1
9.17
9.37
预计离群值会偏离结果时,可将它们移除以提高结果精度。对于热流数据:
mean
y
Stdev
y
mean
datanew
1
Stdev
datanew
1
无论数据中是否存在离群值,平均值基本上会保持不变,但标准差会减小。这一变化将显著影响数据模型。
复制表达式
相关主题
离群值检测和移除
这对您有帮助吗?
此站点在 JavaScript 启用时工作最佳