Top Qs
Chronologie
Chat
Contexte

Coefficient de clustering

De Wikipédia, l'encyclopédie libre

Coefficient de clustering
Remove ads

En théorie des graphes et en analyse des réseaux sociaux, le coefficient de clustering d'un graphe (aussi appelé coefficient d'agglomération, de connexion, de regroupement, d'agrégation ou de transitivité), est une mesure du regroupement des nœuds dans un réseau. Plus précisément, ce coefficient est la probabilité que deux nœuds soient connectés sachant qu'ils ont un voisin en commun.

Thumb
Un graphe de fort coefficient de clustering.

C'est l'un des paramètres étudiés dans les réseaux sociaux : les amis de mes amis sont-ils mes amis ?

Remove ads

Définitions

Résumé
Contexte

Il existe deux définitions différentes du coefficient de clustering : une version globale et une version locale[1].

Coefficient global

Thumb
Graphe de coefficient de clustering : c'est la proportion de paires de voisins connectés dans le graphe.

Le coefficient de clustering global est défini comme :

où un triangle est une clique de trois nœuds.

Le nombre de paires de voisins distincts d'un nœud de degré étant égal à , on obtient :

est le degré du nœud et l'ensemble des nœuds du graphe.

On a , avec égalité si et seulement si le graphe est un ensemble de cliques de taille au moins 3 (un graphe complet si le graphe est connecté).

Coefficient local

Thumb
Noeud de coefficient de clustering (en rouge). C'est la proportion de ses paires de voisins connectés.

Le coefficient de clustering local d'un nœud est défini comme :

soit

C'est la fraction de ses paires de voisins connectés, égale à 0 si par convention.

On a , avec égalité si et seulement si le nœud et son voisinage forment une clique d'au moins 3 nœuds.

En prenant la moyenne des coefficients locaux, on obtient le coefficient local moyen :

.

On a également , avec égalité si et seulement si le graphe est un ensemble de cliques de taille au moins 3.

Remove ads

Propriétés et variantes

Résumé
Contexte

Relation entre les deux versions et interprétation

Le coefficient global s'exprime à partir des coefficients locaux comme  :

C'est donc une moyenne pondérée des coefficients locaux, qui diffère du coefficient local moyen , sauf cas particuliers (graphe régulier par exemple). Les nœuds de fort degré ont donc plus de poids que ceux de faible degré[1]. Les poids reviennent à sélectionner un nœud en proportion du nombre de ses paires de voisins distincts, de sorte que le coefficient de clustering global s'interprète comme la probabilité que deux nœuds distincts soient connectés sachant qu'ils ont un voisin en commun.

Expression à partir de la matrice d'adjacence

En notant la matrice d'adjacence du graphe, matrice binaire dont l'entrée est égale à 1 si et seulement si les nœuds sont voisins, le coefficient de clustering s'écrit :

En effet, le numérateur est égal à 6 fois le nombre de triangles et le dénominateur est égal à .

En l'absence de boucles (diagonale de nulle), le numérateur est la somme des éléments diagonaux de la matrice et le dénominateur la somme des éléments non-diagonaux de la matrice .

Variantes

Il existe des versions du coefficient adaptées à certains types de graphes, comme les graphes pondérés[2] ou les graphes bipartis[3].

Remove ads

Modèle

Le modèle de Watts-Strogatz permet de générer des graphes aléatoires ayant à la fois un fort coefficient de clustering et la propriété dite de petit monde[4],[5]. Ces deux propriétés sont caractéristiques des grands graphes réels, comme ceux formés par les réseaux sociaux[6].

Historique

Le coefficient global est souvent attribué[7] à Barrat et Weigt pour l'article On the properties of small-world network models publié en 2000[4]. Le coefficient moyen local est attribué à Watts et Strogatz, pour l'article Collective dynamics of ‘small-world’ networks de 1998[5].

Voir aussi

Notes et références

Bibliographie

Liens externes

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads