Топ питань
Часова шкала
Чат
Перспективи
Коефіцієнт кореляції
З Вікіпедії, вільної енциклопедії
Remove ads
Коефіціє́нт кореля́ції (англ. correlation coefficient) — це числова міра певного типу кореляції, тобто статистичного зв'язку між двома змінними.[a] Цими змінними можуть бути два стовпчики заданого набору даних спостережень, часто званого вибіркою, чи дві компоненти багатовимірної випадкової величини з відомим розподілом.[джерело?]
Існує кілька типів коефіцієнтів кореляції, кожен з власним визначенням, межами застосовності й характеристиками. Всі вони набувають значення в проміжку з −1 по +1, де ±1 вказує на найсильнішу можливу кореляцію, а 0 — на її відсутність.[2] Як інструменти аналізу, коефіцієнти кореляції стикаються з певними проблемами, включно зі схильністю деяких типів до спотворення через викиди, та можливістю неправильного використання для висновування причинно-наслідкового зв'язку між змінними (докладніше див. Корелювання не означає спричинювання).[3]
Remove ads
Типи
Узагальнити
Перспектива
Існує кілька різних мір для ступеню кореляції в даних, залежно від типу даних: головним чином, чи дані є вимірюванням, порядковими, чи категорійними.
Пірсона
Коефіцієнт кореляції моменту добутку Пірсона, відомий також як r, R, або r Пірсона, є мірою сили та напрямку лінійного зв'язку між двома змінними, визначеною як коваріація змінних, поділена на добуток їхніх стандартних відхилень.[4] Це найвідоміший і найчастіше вживаний тип коефіцієнта кореляції. Коли термін «коефіцієнт кореляції» використовують без подальших уточнень, зазвичай мають на увазі коефіцієнт кореляції моменту добутку Пірсона.
Внутрішньокласова
Внутрішньокласова кореляція[en] (ВКК, англ. intraclass correlation, ICC) — це описова статистика, яку можливо використовувати, коли кількісні вимірювання здійснюють над об'єктами, організованими в групи; вона описує, наскільки сильно об'єкти в одній і тій же групі схожі між собою.
Рангова
Рангова кореляція — це міра взаємозв'язку між рангами двох змінних або між двома ранжуваннями однієї змінної:
- Коефіцієнт рангової кореляції Спірмена є мірою того, наскільки добре відношення між двома змінними можливо описати монотонною функцією.
- Коефіцієнт рангової кореляції тау Кендалла є мірою частки рангів, що збігаються між двома наборами даних.
- Гамма Гудмена та Крускала[en] є мірою сили пов'язаності перехресно табульованих даних, коли обидві змінні вимірюють на порядковому рівні.
Тетрахорна й поліхорна
Коефіцієнт поліхорної кореляції[en] вимірює пов'язаність двох порядково-категорійних змінних. Технічно його визначають як оцінку коефіцієнта кореляції Пірсона, яку було би можливо отримати, якби:
- Ці дві змінні вимірювалися би на неперервній шкалі, а не як порядково-категорійні.
- Ці дві неперервні змінні мали би двовимірний нормальний розподіл.
Коли обидві змінні дихотомні, а не порядково-категорійні, то коефіцієнт поліхорної кореляції[en] називають коефіцієнтом тетрахорної кореляції.
Remove ads
Див. також
- Дезатенюація кореляції[en]
- Коефіцієнт детермінації
- Кореляція і залежність
- Кореляційне співвідношення[en]
- Кореляція по віддалі[en]
- Допасованість, один із декількох показників, які вимірюють, наскільки добре статистична модель допасовується до спостережень, узагальнюючи розбіжності між спостережуваними значеннями й очікуваними значеннями за моделлю
- Множинна кореляція[en]
- Частинна кореляція
Виноски
- Коефіцієнт кореляції: Статистика, яку використовують, щоби показувати, як оцінки одного виміру пов'язані з оцінками другого виміру для тієї ж групи осіб. Високе значення (що наближається до +1,00) означає сильний прямий зв'язок, значення близько 0,50 вважають помірними, а значення нижче 0,30, як вважають, показують слабкий зв'язок. Низьке від'ємне значення (що наближається до −1,00) так само є сильним зворотним зв'язком, а значення близько 0,00 вказують на незначний або відсутній зв'язок.[1]
Примітки
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads