共変量シフトとは?機械学習におけるドリフトとは
-共変量シフト-
共変量シフトとは、機械学習モデルの訓練データと実稼働データ間の分布のずれのことです。これは、モデルの予測性能の低下を引き起こす可能性があります。共変量シフトが発生する一般的な原因としては、データ収集方法の変化、時間経過によるデータの概念的変化、標本選択バイアスなどが挙げられます。例えば、オンラインショッピングの推薦モデルを、通常は在宅で買い物をする顧客のデータで訓練した場合、外出先でモバイルデバイスを使用して買い物をする顧客をより適切に予測できなくなる場合があります。これは、これらの顧客のショッピングパターンが、訓練データに含まれるパターンとは異なるためです。