コサイン類似度とは?数学・統計・機械学習での役割を解説
コサイン類似度は、2つのベクトルの類似性を測定する手法で、ベクトルのなす角のコサイン値に基づいています。ベクトル間の角度が小さければ、コサイン値は大きくなり、類似性が高くなります。逆に、角度が大きければコサイン値は小さくなり、類似性は低くなります。
コサイン類似度の計算方法は次のとおりです。2つのベクトルをaとbとし、aの要素をa1, a2, ..., an、bの要素をb1, b2, ..., bnとします。このとき、コサイン類似度cos(θ)は次式で求められます。
cos(θ) = (a1 × b1 + a2 × b2 + ... + an × bn) / (||a|| × ||b||)
ここで、||a||と||b||はaとbのユークリッドノルム(ベクトルの大きさ)を表します。