函數
>
數據分析
>
離群值與 NaN
>
範例:離群值移除
範例:離群值移除
使用
trim
函數先移除數據集中的離群值,再處理數據集。
1.
定義數據集,以描述熱流。
y
9.206
9.3
9.278
9.175
9.275
9.289
9.287
9.261
9.303
9.276
9.273
9.288
9.256
9.252
9.298
9.267
9.257
9.278
9.248
9.35
9.276
9.279
9.267
9.246
9.238
9.269
9.248
9.257
9.268
9.288
9.258
9.286
9.251
9.257
9.268
9.291
9.219
9.27
9.219
9.241
9.27
9.227
9.259
9.286
9.32
9.328
9.263
9.248
9.239
9.225
9.221
9.271
9.252
9.281
9.271
9.295
9.302
9.279
9.237
9.234
9.245
9.222
9.207
9.259
9.276
9.269
9.257
9.265
9.296
9.293
9.264
9.281
9.267
9.301
9.253
9.261
9.238
9.225
9.236
9.24
9.264
9.244
9.278
9.311
9.262
9.26
9.253
9.246
9.284
9.251
9.275
9.255
9.28
9.275
9.262
9.275
9.252
9.23
9.255
9.269
9.29
9.274
9.256
9.262
9.25
9.262
9.264
9.265
9.242
9.24
9.222
9.242
9.215
9.286
9.272
9.266
9.285
9.269
9.268
9.246
9.231
9.241
9.261
9.274
9.292
9.271
9.267
9.309
9.264
9.279
9.255
9.229
9.253
9.256
9.263
9.22
9.258
9.268
9.268
9.249
9.235
9.243
9.253
9.263
9.243
9.261
9.26
9.253
9.241
9.239
9.264
9.243
9.247
9.252
9.262
9.247
9.306
9.238
9.249
9.257
9.266
9.299
9.245
9.287
9.301
9.257
9.271
9.275
9.282
9.253
9.269
9.282
9.278
9.285
9.24
9.268
9.248
9.225
9.231
9.27
9.265
9.284
9.281
9.263
9.292
9.252
9.244
9.283
9.18
9.231
9.233
9.235
9.217
9.274
9.274
2.
使用
Grubbs
函數檢測離群值。
G
Grubbs
y
0.85
3.
建立內含離群值索引的向量。
j
0
rows
G
1
vindex
j
G
j
0
vindex
4.
將數字指派給
y
數據集的每一列。
i
0
length
y
1
x
i
i
data
augment
x
y
5.
移除離群值。
datanew
trim
data
vindex
datanew
陣列比原始數據集少數列:
rows
data
rows
datanew
6.
繪製原始與裁剪過的數據集。
線條
線條
11
x
datanew
0
0
200
12
y
datanew
1
9.17
9.37
當您認為離群值會傾斜結果時,可移除離群值以改善結果。針對熱流數據:
mean
y
Stdev
y
mean
datanew
1
Stdev
datanew
1
無論數據中有無離群值,均數幾乎都保持相同,但標準差會下降。此變更嚴重影響數據模型。
複製運算式