多層模型
From Wikipedia, the free encyclopedia
Remove ads
等級線性模型,廣義化啲可以叫多層模型[註 1],係一種統計模型,能夠一次過計唔同層面嘅變數之間嘅關係。譬如依家要做管理學研究,由幾間企業嗰度各抽咗若干位經理嚟訪問,每間企業下都有若干個經理做分析樣本中嘅個案。好似噉嘅情況,喺各種社會科學裡便都好常見[1]。

基本概念
内文:等級結構同闊同窄數據
睇埋:生態謬論
喺現實世界,研究緊嘅個體(或者數據點)好多時都成等級結構。想像好似以下噉嘅 dataset:
喺上面例子中,學校係第二層、而個體學生係第一層。呢種情況顯示啲數據點有顯著嘅分層結構(等級)。好多現實統計上遇到嘅數據,都必然具備等級結構,例如教育學數據(若干個學生,一部份嚟自 A 校一部份嚟自 B 校)、醫療數據(若干個病人,一部份住喺 A 醫院一部份住喺 B 醫院)同埋係空間數據等等。假如喺分析過程中忽視咗呢一點,就有可能導致統計推論出現錯誤,產生生態謬誤等嘅問題。
此外,人力物力嘅限制亦可能會令到數據有噉嘅特性:喺實際研究,尤其係心理學、教育學或者其他社會科學範疇,研究者好多時都焗住要用便利抽樣,即係話佢哋要揀容易接觸到嘅個體,用呢啲個體做樣本,例如某兩間學校嘅學生、某兩個社區嘅居民呀噉。呢類樣本收集起上嚟方便,但往往會呈現群組結構,好似係上面個例子噉。
為咗解決呢個問題,研究者會用到多層模型。呢啲統計模型重點特徵係建模嗰陣,會考慮埋呢啲分層結構,唔單只提高模型嘅真確度,仲可以分析唔同層次之間點樣互相影響,係教育學同公共衛生等領域上常用嘅分析工具。[3]
Remove ads
數學表述
HLM 專門用嚟應付「樣本入邊啲受試者有明顯分組」嘅情況。好似簡單迴歸分析噉嘅統計模型,好多時都係假設咗啲受試者彼此之間係統計上獨立嘅,但係如果樣本入邊啲受試者有明顯分組,呢個假設就唔成立:例如想像做緊社科研究,想睇吓 500 位中學生學英文學得有幾好,班學生嚟自 5 間唔同嘅中學,一般認為嚟自同一間學校嘅學生因為喺同一環境下學習,所以佢哋喺各種特性上梗會有一定嘅統計相關,分析呢啲數據嗰陣一定要考慮埋呢一點,唔可以當同一間學校嘅學生嘅學習成效係彼此之間獨立嘅。HLM 正正就係做呢樣嘢嘅[4]。
搵個簡單例子說明,呢種分析方法會用類似以下噉嘅數學方程式將唔同層面嘅變數擺入去同一條式入面(對於以下嗰啲行話點解,可以睇統計學):
- 係一個喺層面 1 嘅應變數(細階 i 指個體,而細階 j 指個群體);
- 係一個喺層面 1 嘅自變數;
- 係一個喺層面 2(群體層面)嘅自變數,佢嘅數值對於同一個群體嘅成員嚟都係一樣嘅;
- 係個根(intercept);
- 淨低嗰啲 係迴歸系數(regression coefficient),反映咗佢掕住嗰個自變數有幾能夠預測個應變數嘅數值。
- 係指誤差。
上述呢條式講嘅用日常用語講嘅話如下: 嘅數值係受 同 呢兩個變數嘅數值影響嘅,而如果用呢個變數嘅數值去預測 嘅數值嘅話,誤差平均會係 。而家想像如果 係「個別員工嘅工作表現」, 係「嗰個員工嘅身體健康」,而 係「嗰個員工所屬嘅團隊嘅領袖嘅領導能力」-跟手個管理學研究者就可以去收數據,再做統計分析,用啲數據估計 同 嘅數值。如果啲數據反映(例如)一個員工嘅身體健康比起佢所屬嘅團隊嘅領袖嘅領導能力更加能夠預測佢嘅工作表現(即係 數值明顯大過 )嘅話,噉佢就發現咗啲有用嘅嘢,可以將佢嘅研究結果喺管理學期刊嗰度公佈。近期啲嘅等級線性模型研究仲有喺度用更新更先進嘅統計模型[1]。
Remove ads
計自由度
睇埋:統計自由度
外語嗌法
喺二十一世紀初,多層模型同相關嘅概念有多個名:
睇埋
註釋
引咗
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads