Лучшие вопросы
Таймлайн
Чат
Перспективы
Коэффициент кластеризации
Из Википедии, свободной энциклопедии
Remove ads
Коэффициент кластеризации — это показатель того, насколько сильно вершины в графе склонны группироваться. Имеющиеся данные свидетельствуют о том, что в большинстве реальных сетей, особенно в социальных сетях, вершины имеют тенденцию образовывать тесно связанные группы с относительно высокой плотностью связей. Эта вероятность, как правило, выше средней вероятности случайного установления связи между двумя узлами (Холланд и Лейнхардт, 1971[1]; Уоттс и Строгац, 1998[2]).
Существует две версии этой меры — глобальная и локальная. Глобальная версия была разработана для общего указания на кластеризацию в сети, тогда как локальная указывает на степень «кластеризации» отдельной вершины.
Remove ads
Локальный коэффициент кластеризации
Суммиров вкратце
Перспектива

Локальный коэффициент кластеризации вершины (узла) графа определяет, насколько близки её соседи к образованию клики (полного графа). Дункан Уоттс и Стивен Строгац ввели этот показатель в 1998 чтобы определить, принадлежит ли граф классу «Мир тесен».
Граф формально состоит из набора вершин и набора рёбер между ними. Ребро соединяет вершину с вершиной .
Окрестность для вершины определяется как непосредственно связанные с ней соседи:
Мы определим как , число вершин в , множестве соседей вершины .
Локальный коэффициент кластеризации вершины тогда задаётся числом связей между соседями, поделённом на число связей, которые могли бы быть между ними. Для ориентированного графа отличается от , а потому для каждого соседа из существуют связей, которые могли бы существовать между соседями ( является числом соседей вершины). Тогда локальный коэффициент кластеризации для ориентированного графа задаётся выражением[2]
Неориентированный граф имеет свойство, что дуги и считаются идентичными (одной дугой). Таким образом, если вершина имеет соседей, рёбер могли бы существовать между соседями. Тогда локальный коэффициент кластеризации для неориентированного графа может быть определён как
Пусть будет числом треугольников в для неориентированного графа . То есть, является числом подграфов графа с 3 рёбрами и 3 вершинами, одна из которых . Пусть будет числом троек на множестве . То есть, является числом подграфов (не обязательно порождённых) с 2 рёбрами и 3 вершинами, одна из которых и таких что инцидентна обоим рёбрам. Тогда мы можем определить коэффициент кластеризации также как
Легко показать, что два определения совпадают, поскольку
Показатель равен 1, если любой сосед соединён дугой с любым другим соседом, и 0, если любой сосед не имеет дуги ни с каким другим соседом.
Поскольку любой граф полностью задаётся его матрицей смежности A, локальный коэффициент кластеризации для простого неориентированного графа может быть выражен в терминах A как[3]:
где:
и Ci=0, когда ki нуль или единица. В приведенном выражении числитель отражает удвоенное количество полных треугольников, в которых участвует вершина i. В знаменателе ki2 отражает число пар рёбер, связанных с вершиной i, плюс число одиночных ребер, пройденных дважды. ki является число рёбер, связанных с вершиной i. Вычитая ki мы исключаем последнее слагаемое, оставляя лишь набор пар ребер, которые потенциально могут быть соединены в треугольники. Поскольку для каждой такой пары ребер существует другая пара, способная образовать тот же треугольник, знаменатель в итоге также отражает удвоенное количество возможных треугольников, в которых может участвовать вершина i.
Remove ads
Глобальный коэффициент кластеризации
Суммиров вкратце
Перспектива
Глобальный коэффициент кластеризации основан на тройках узлов. Тройка — это три вершины, соединенные двумя (открытая тройка) или тремя (замкнутая тройка) неориентированными рёбрами. Таким образом, треугольный граф включает три замкнутые тройки, по одной для каждой вершины (это означает, что три тройки в треугольнике образуются из пересекающихся выборок узлов). Глобальный коэффициент кластеризации равен отношению числа закрытых троек (или 3 x число треугольников) и полного числа троек (открытых и закрытых). Первая попытка измерить его была предпринята Люсом и Перри (1949)[4]. Этот показатель указывает на кластеризацию во всей сети (глобально) и может применяться как к неориентированным, так и к ориентированным сетям (часто называемым транзитивностью, см. Вассерман и Фауст , 1994, стр. 243[5]).
Глобальный коэффициент кластеризации определяется как
- .
Число закрытых троек встречается также в литературе как 3 × число треугоьников, так что
- .
Обобщение для сетей с весами[англ.] предложили Опсал и Панцараза (2009)[6], а переопределение для двумодальных сетей (как бинарных, так и взвешенных) — Опсалом (2009)[7].
Поскольку любой простой граф полностью определён его матрицей смежности A, глобальный коэффициент кластеризации для неориентированного графа может быть выражен в терминах A как:
где:
и C=0, если знаменатель равен нулю.
Средний коэффициент кластеризации сети
В качестве альтернативы глобальному коэффициенту кластеризации общий уровень кластеризации в сети измеряется Уоттсом и Строгацем[2] как среднее значение локальных коэффициентов кластеризации всех вершин [8]:
Данный показатель придает больший вес узлам с низкой степенью, в то время как коэффициент транзитивности уделяет большее внимание узлам с высокой степенью.
Обобщение для сетей с весами[англ.] было предложено Барраттом и др. (2004)[9], а переопределение для двудольных графов (также называемых двумодальными сетями) было предложено Латапи и др. (2008)[10] и Опсалом (2009)[7].
Альтернативное обобщение для взвешенных и ориентированных графов предложил Фаджиоло (2007)[11] и Клементе и Грасси (2018)[12].
Эта формула по умолчанию не определена для графов с изолированными вершинами (см. Кайзер (2008)[13] и Бармпутис и др.[14]). Сети с максимально возможным средним коэффициентом кластеризации имеют модульную структуру и, в то же время, наименьшее возможное среднее расстояние между различными узлами[14].
Remove ads
Протекание в кластеризованных сетях
Суммиров вкратце
Перспектива
Для случайной древовидной сети без корреляции степеней вершин можно показать, что сеть может иметь гигантскую компоненту, а порог протекания[англ.] (вероятность передачи) определяется как , где — производящая функция, соответствующая распределению избыточной степени.
В сетях с низкой кластеризацией, , критическая точка масштабируется множителем , так что
Это указывает на то, что для заданного распределения степеней кластеризация приводит к более высокому порогу протекания, в основном по причине, что при фиксированном числе связей кластерная структура укрепляет ядро сети, но ценой размывания глобальных связей. Для сетей с высокой кластеризацией, сильная кластеризация может порождать структуру «ядро–периферия», в которой ядро и переферия могут перколировать в различных критических точках и вышеупомянутое приближенное рассмотрение становится неприменимым[15].
Для изучения устойчивости кластеризованных сетей разработан подход на основе теории протекания[16][17].
Remove ads
Смотрите также
Примечания
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads