統計相關
From Wikipedia, the free encyclopedia
Remove ads
統計學上講嘅相關(粵拼:soeng1 gwaan1;參見英文:correlation)定義如下:如果話 x 同 y 呢兩個變數成正相關,即係話 x 數值高嗰陣 y 數值都傾向高,而 x 數值低嗰陣 y 數值都傾向低;如果話 x 同 y 呢兩個變數成負相關,即係話 x 數值高嗰陣 y 數值傾向低,而 x 數值低嗰陣 y 數值就會傾向高;如果話 x 同 y 呢兩個變數冇明顯相關,即係話 x 嘅數值唔會點預測得到 y 嘅數值。
基本計法
皮亞遜積差相關係數(參見英文:Pearson correlation coefficient)係統計學成日用嘅一個指標,「兩個變數 同 之間嘅皮亞遜積差相關係數」()係噉樣定義嘅:
呢條式會得出一個相關值,個數值會喺 -1 同 1 之間,
- 負數表示兩個變數成反比(一個數值高嗰陣另一個傾向數值低),
- 正數就表示兩個變數成正比(兩個數值傾向一齊高或者一齊低),
- 個相關值愈接近零表示兩個變數之間嘅關係愈弱,
- 而如果個相關值等於零就表示兩個變數根本唔啦更。
喺做相關性研究嗰陣科學家會先收集一啲數據,再用好似上面呢條式等嘅方法計出變數之間嘅相關值,搵出研究緊嘅變數之間有乜嘢啦掕,而呢個過程俾出嚟嘅資訊喺將來有得攞嚟預測某啲現象[1]。

上圖嘅 X 軸同 Y 軸代表變數 同 ,每個有色圓點代表一個個案,每個個案都喺 同 上各有數值,而每幅圖表示唔同 值下啲數據會係點嘅樣。
Remove ads
進階變體
組內相關
内文:組內相關
典型相關
内文:典型相關
睇埋:降維
典型相關係一種統計分析方法,用嚟研究兩組連續變數之間嘅關係。例如,一組變數可能係學生嘅語文、數學、科學成績,另一組變數可能係佢哋嘅閱讀時間、溫習時間同埋網上學習活動。典型相關就幫研究者搵出兩組變數之間相關最高嘅線性組合,了解整體成績同整體學習行為之間嘅關聯。[2][3]
具體做法係:喺第一組變數中搵一個線性組合(叫做典型變數 U),喺第二組變數中搵另一個線性組合(叫做典型變數 V),令到 U 同 V 之間嘅皮亞遜積差相關係數最大。接住可以再搵第二對 U 同 V,係喺控制咗第一對典型變數之後,第二度最大化相關,依此類推。呢啲典型相關係數就代表兩組變數之間喺唔同維度上嘅關聯強度。
實際應用
統計相關有好多用途。
多角投資係投資上嘅一種做法,講到一位投資者要同時揸多種唔同嘅資產,即係例如同時又揸股票又揸黃金呀噉。多角投資相關嘅研究又提到,自己手上嘅唔同資產之間喺價格上唔應該有太強嘅正相關,即係呢啲資產嘅價唔可以傾向一齊升或者一齊跌,否則就好易出現「手上啲資產嘅價全部一齊下跌」嘅困境[4]。
實際行因素分析之前,研究者可以先睇吓啲變數之間嘅統計相關。有統計學專家主張,啲變數之間嘅統計相關最少要係 .30,先至有可能表示佢哋反映緊某啲潛在變數。
常犯錯誤
内文:相關唔蘊含因果
睇埋
文獻
- Gignac, G. E., & Szodorai, E. T. (2016). Effect size guidelines for individual differences researchers (PDF). Personality and individual differences, 102, 74-78. 呢篇文主張話喺社科當中,.30 嘅相關值經已算係幾高。
引咗
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads