AI用語「MAD」とは?数学/統計学/機械学習における平均絶対偏差
AI初心者
先生、”MAD”ってなんですか?
AI研究家
MADは「平均絶対偏差」の略だよ。平均偏差とか絶対偏差とも言うね。
AI初心者
へぇ、数学や統計学で使われるんですか?
AI研究家
そうだよ。機械学習でもよく使うよ。モデルの予測誤差を測る指標としてね。
MADとは。
AI関連用語「MAD」は、「平均絶対偏差」を意味します。また、「平均偏差」や「絶対偏差」という呼び方もあります。
MADとは?
平均絶対偏差(MAD)とは、統計学や機械学習において使用される統計指標です。測定値と対応する真の値との差の絶対値の平均として定義されます。言い換えると、MADは各観測値が平均値からどれだけ離れているかを示す尺度です。
MADは、データを正規分布しないときや、外れ値に敏感に対応したい場合に、標準偏差の代替として使用されます。標準偏差は正規分布したデータに最適化されていますが、MADは分布の形状に関係ありません。また、MADは外れ値の影響を標準偏差よりも小さく受けるため、外れ値によって平均が大きく左右されるデータの分析に適しています。
平均偏差とMADの関係
平均偏差と平均絶対偏差(MAD)は密接に関連しており、両者ともデータセットの分散性を表す指標です。平均偏差はデータの平均値からの平均的な偏差として定義され、負の値を含むことができます。一方、MAD はデータの平均値からの絶対値の平均的な偏差として定義され、常に負でない値をとります。
平均偏差が負の値をとる可能性があるのに対し、MADは常に正の値をとる点が異なります。したがって、MADは平均偏差よりもデータの分散性を過小評価する傾向があります。ただし、MADは平均偏差よりも外れ値の影響を受けにくいため、外れ値が存在するデータセットではより堅牢であると見なされています。
絶対偏差とMADの違い
-絶対偏差とMADの違い-
MAD(平均絶対偏差)は、数学、統計学、機械学習において使用される統計量です。絶対偏差は、各データ点と平均値との差の絶対値です。MADは、すべての絶対偏差の平均です。
絶対偏差は、外れ値や極端値の影響を受けやすいという欠点があります。一方、MADは外れ値の影響を受けにくく、より堅牢です。そのため、MADは外れ値の影響が懸念される場合に、平均値の代わりに使用されます。
MADの求め方
-MADの求め方-
平均絶対偏差(MAD)を求める最も簡単な方法は、次の手順に従うことです。
1. データセットから平均値(μ)を求める。
2. 各データポイント(x)と平均値(μ)の絶対差を計算する(|x – μ|)。
3. これらの絶対差をすべて合計する(Σ|x – μ|)。
4. データセットの個数(n)で合計値を割る(Σ|x – μ|/n)。
MADの活用
-MADの活用-
平均絶対偏差(MAD)は、機械学習や統計学において、分散や標準偏差の代替手段として使用されます。MADは外れ値に対するロバスト性を持ち、偏った分布や外れ値が存在するデータセットに対しても頑強です。
MADが活用される主な場面として、モデルの予測精度を評価する指標として挙げられます。予測値と実測値の差の絶対値の平均を計算することで、モデルの予測誤差を測定できます。また、データの前処理時に外れ値の検出にも使用されます。MADが一定の閾値を超えるデータポイントは、外れ値として識別できます。
さらに、MADは時系列分析における季節性の検出にも役立ちます。時系列データのMADを計算することで、季節性パターンによるデータの変動を特定できます。これにより、より正確な予測モデルを構築することが可能になります。