関数
>
データ解析
>
外れ値と NaN
>
例: 四分位範囲法による外れ値の検出
例: 四分位範囲法による外れ値の検出
四分位範囲法によって外れ値を検出します。
1.
熱流を表すデータセットを定義します。
y
9.206
9.3
9.278
9.175
9.275
9.289
9.287
9.261
9.303
9.276
9.273
9.288
9.256
9.252
9.298
9.267
9.257
9.278
9.248
9.35
9.276
9.279
9.267
9.246
9.238
9.269
9.248
9.257
9.268
9.288
9.258
9.286
9.251
9.257
9.268
9.291
9.219
9.27
9.219
9.241
9.27
9.227
9.259
9.286
9.32
9.328
9.263
9.248
9.239
9.225
9.221
9.271
9.252
9.281
9.271
9.295
9.302
9.279
9.237
9.234
9.245
9.222
9.207
9.259
9.276
9.269
9.257
9.265
9.296
9.293
9.264
9.281
9.267
9.301
9.253
9.261
9.238
9.225
9.236
9.24
9.264
9.244
9.278
9.311
9.262
9.26
9.253
9.246
9.284
9.251
9.275
9.255
9.28
9.275
9.262
9.275
9.252
9.23
9.255
9.269
9.29
9.274
9.256
9.262
9.25
9.262
9.264
9.265
9.242
9.24
9.222
9.242
9.215
9.286
9.272
9.266
9.285
9.269
9.268
9.246
9.231
9.241
9.261
9.274
9.292
9.271
9.267
9.309
9.264
9.279
9.255
9.229
9.253
9.256
9.263
9.22
9.258
9.268
9.268
9.249
9.235
9.243
9.253
9.263
9.243
9.261
9.26
9.253
9.241
9.239
9.264
9.243
9.247
9.252
9.262
9.247
9.306
9.238
9.249
9.257
9.266
9.299
9.245
9.287
9.301
9.257
9.271
9.275
9.282
9.253
9.269
9.282
9.278
9.285
9.24
9.268
9.248
9.225
9.231
9.27
9.265
9.284
9.281
9.263
9.292
9.252
9.244
9.283
9.18
9.231
9.233
9.235
9.217
9.274
9.274
n
length
y
i
0
n
1
x
i
i
2.
データセットの四分位範囲を定義します。
Q1
x
percentile
x
25
%
Q3
x
percentile
x
75
%
IQ
Q3
y
Q1
y
3.
点が外れ値となる境界を定義します。
LB
Q1
y
1.5
IQ
UB
Q3
y
1.5
IQ
4.
ベクトル
zero
で、検出された各外れ値に対応する成分にゼロの値を割り当てます。このベクトルを使用して各外れ値の添字を求めます。
zero
i
y
i
y
i
LB
y
i
UB
i_outliers
match
0
zero
i_outliers
5.
ベクトル
non_zero
に、外れ値だけをゼロ以外の値として残します。このベクトルを使用して、各外れ値の値を求めます。
non_zero
i
y
i
y
i
LB
y
i
y
i
UB
i_others
match
0
non_zero
nan_others
markNaN
non_zero
i_others
outliers
filterNaN
nan_others
outliers
boxplot
関数では、四分位範囲法によって外れ値が検出され、上記で計算されたものと同じ値が返されます。次に示す出力ベクトルの最後の 4 つの成分が外れ値です。
boxplot
y
6.
データと外れ値をプロットします。
lines
lines
11
x
i_outliers
0
200
12
y
outliers
9.17
9.19
9.37
青色の四角形によって外れ値が示されています。
式をコピー