コサイン類似度

最も広く使用されている類似度メトリックの1つは、特に自然言語処理(NLP)では、2つのベクトル間の角度のコサインを測定するコサイン類似度です。

角度が小さいほど、2つのベクトルは似ています。コサイン類似度では、ベクトルの方向または角度の類似度を測定し、そのサイズ(マグニチュードとも呼ばれます)の違いは無視されます。角度が小さいほど、そのコサインが大きくなります。したがって、コサインの距離とコサインの類似度には反比例の関係があります。コサイン距離は2つのベクトルの差を測定しますが、コサイン類似度は2つのベクトルの類似度を測定します。