AI用語:第一種の過誤・第二種の過誤とは?
AI初心者
『第一種の過誤-第二種の過誤』って何ですか?
AI研究家
2値分類問題の評価指標で、実際の結果に対して真であるものを真と示す真陽性や、偽であるものを偽と示す真陰性とは別に、偽陽性(第一種の過誤)と偽陰性(第二種の過誤)があります。
AI初心者
真陽性や偽陽性とはどういう意味ですか?
AI研究家
真陽性は「実際に真である場合に真と示す」、偽陽性は「実際に偽である場合に真と示す」ことを意味します。
第一種の過誤-第二種の過誤とは。
AI用語の「第一種過誤」と「第二種過誤」について説明します。
2値分類問題の評価では、「偽陽性」と「偽陰性」という用語を使用します。これらは、真の正解に対して正しく分類された場合を「真陽性」、誤りに対して正しく分類された場合を「真陰性」、真の正解に対して誤りとして分類された場合を「偽陰性」、誤りに対して正しく分類された場合を「偽陽性」という4つのカテゴリーに分類できます。
「偽陽性」は「第一種過誤」、「偽陰性」は「第二種過誤」とも呼ばれます。
第一種の過誤(偽陽性)とは何か?
第一種の過誤(偽陽性)とは何か?
第一種の過誤は、実際には存在しない事象を予測するときに発生します。言い換えると、実際には存在しない事象に対して「陽性」と判定してしまうことです。この種の過誤は、モデルが真陰性(見逃し)の予測を避けるために偽陽性の予測を行う傾向がある場合に発生します。たとえば、スパムメールのフィルターが正当なメールをスパムとして誤分類する場合、これは第一種の過誤となります。
第二種の過誤(偽陰性)とは何か?
第二種の過誤(偽陰性)とは何か?これは、モデルが実際には陽性であるケースを陰性と予測してしまう過誤の一種です。言い換えると、実際に存在するものを存在しないと予測してしまうことになります。このタイプの過誤は、診断テストにおいて重要な結果をもたらす可能性があります。たとえば、病気があるかどうかを調べる検査において、第二種の過誤が発生すると、実際には病気であるにもかかわらず、健康であると判定されてしまうため、適切な治療が遅れてしまう可能性があります。
真陽性と真陰性について
-真陽性と真陰性について-
真陽性(TP)は、実際に陽性であるという結果が正しく陽性と予測された場合です。例えば、ある病気の検査で、実際にかかっている人が陽性と判定されれば、真陽性となります。
真陰性(TN)は、実際に陰性であるという結果が正しく陰性と予測された場合です。例えば、病気にかかっていない人が陰性と判定されれば、真陰性となります。
第一種の過誤と第二種の過誤の区別
-第一種の過誤と第二種の過誤の区別-
AI用語における「第一種の過誤」と「第二種の過誤」は、分類において誤って判断してしまう2つの異なるタイプの過誤です。
第一種の過誤は、ある条件を満たさない場合でも、満たしていると判断してしまう過誤です。たとえば、スパムメールフィルタが本来無害なメールをスパムと誤分類してしまう場合です。
一方、第二種の過誤は、ある条件を満たす場合でも、満たしていないと判断してしまう過誤です。スパムメールフィルタが本来スパムであるメールを無害と誤分類してしまう場合などがこれに当たります。
第一種の過誤は「偽陽性」とも呼ばれ、第二種の過誤は「偽陰性」とも呼ばれます。どちらの種類の過誤も、AIシステムの精度を低下させる可能性があります。
AIにおける第一種の過誤と第二種の過誤の例
AIにおける第一種の過スパムメールフィルターが正常なメールを誤ってスパムと分類してしまう場合です。この場合は、フィルターの感度が高すぎると言えます。一方、第二種の過誤は、スパムメールがフィルターをすり抜けて届いてしまう場合です。この場合は、フィルターの感度が低すぎると言えます。第一種の過誤では、無害なものを有害と誤って分類しますが、第二種の過誤では、有害なものを無害と誤って分類します。