関数 > データ解析 > 外れ値と NaN > 外れ値の検出と除去
外れ値の検出と除去
関数 GrubbsGrubbsClassicThreeSigma はデータセット内の外れ値を検出します。trim 関数は、指定された添字の行をデータセットから除去します。
Grubbs(v, a) - 指定された値をデータが無作為にとる確率 a における、疑わしい外れ値の添字、その外れ値の検定統計量、および臨界統計量から外れ値の検定統計量までの距離を返します。
GrubbsClassic(v, a) - 指定された値をデータが無作為にとる確率 a における、外れ値になる可能性が最も高いデータ点の添字、その検定統計量、および臨界統計量から外れ値の検定統計量までの距離を返します。
ThreeSigma(v) - 検定統計量が 3 より大きい v 内の点の添字と各点の検定統計量の値を返します。
trim(v, vindex) - vindex によって指定されたエントリ (行) を除去します。
外れ値の検出では、ある点とデータセットの平均値との間の距離を標準偏差で割った値が検定統計量として使用されます。
ベクトルの代わりに実数行列を使用した場合、外れ値を検出するこれらの関数は、各外れ値候補の添字のペアを入れ子行列として返します。
引数
v はデータ点を表す実数のベクトルまたは行列です。
a は 0 < a < 1 の確率です。
vindex は整数ベクトルです。vindex 内の添字は ORIGIN を基準にしています。
これは役に立ちましたか?