訓練データ

機械学習に関する用語

ホールドアウト検証とは?k分割交差検証との違い

ホールドアウト検証の概要 ホールドアウト検証は、データセットをトレーニングセットとテストセットの2つに分割する方法で、機械学習モデルの性能を評価します。トレーニングセットは、モデルの学習に使用され、テストセットはモデルの性能を評価するために使用されます。通常、データセットは70%と30%の割合で分割されますが、比率は特定の状況に応じて調整できます。ホールドアウト検証は、限られたデータセットがあり、外部テストセットが利用できない場合に便利です。ただし、トレーニングセットとテストセットのデータ分布が異なる可能性があるため、評価結果のバイアスが生じる可能性があります。
機械学習に関する用語

AI用語『データリーケージ』の仕組みと対策

データリーケージとは、権限のない個人や団体が組織によって保護されているデータに不正にアクセス、使用、開示、破壊、変更することを指します。この悪意のある行為は、意図的または非意図的に発生し、個人情報や企業秘密など、機密情報が外部に漏洩する結果となります。データリーケージは、組織の評判や財務上の損失、法的責任を引き起こす可能性があります。