Similarité cosinus

La similarité cosinus donne la similarité de deux vecteurs à $n$ dimensions en déterminant le cosinus de leur angle. Ce score est fréquemment utilisé en fouille de textes^[1].

Soit deux vecteurs $A$ et $B$ , le cosinus de leur angle $θ$ s'obtient en prenant leur produit scalaire divisé par le produit de leur norme :

\cos \theta ={\frac {\mathbf {A} \cdot \mathbf {B} }{\|\mathbf {A} \|\|\mathbf {B} \|}}

.

La valeur d'un cosinus, donc celle calculée ici pour $cos θ$ , est comprise dans l'intervalle $[-1,1]$ . La valeur de -1 indique des vecteurs opposés, la valeur de 0 des vecteurs indépendants (orthogonaux) et la valeur de 1 des vecteurs colinéaires de coefficient positif. Les valeurs intermédiaires permettent d'évaluer le degré de similarité.

[1]

Similarité cosinus

Dans le cas d'une comparaison de documents textuels

Indice de Tanimoto

Voir aussi

Références

Wikiwand - on