邏輯迴歸
統計模型 / 維基百科,自由的 encyclopedia
邏輯迴歸(英語:Logistic regression,又譯作邏輯斯迴歸、羅吉斯迴歸、邏輯斯諦迴歸、對數機率迴歸),在統計學中是一種對數機率模型(英語:Logit model,又譯作邏輯模型、評定模型、分類評定模型),是離散選擇法模型之一,屬於多變量分析範疇,是社會學、生物統計學、臨床、數量心理學、計量經濟學、市場行銷等統計實證分析的常用方法。
此條目需要精通或熟悉相關主題的編者參與及協助編輯。 (2016年9月17日) |
通過使事件的對數發生率(log-odd)成為一個或多個自變數的線性組合,對事件發生的機率進行建模。形式上,在二元邏輯迴歸中,有一個二元應變數,由指示變量編碼,其中兩個值標記為「0」和「1」,而自變數每個都可以是二元變量(兩個類,由指示變量)或連續變量(任何實值)。標記為「1」的值的相應機率可以在0和1之間變化;將對數發生率轉換為機率的函數就是邏輯斯諦函數,因此得名。對數發生率單位稱為logit,來自logistic unit。[1]
二元變量在統計學中廣泛用於對某一類別或事件發生機率的建模,例如團隊獲勝機率、患者健康機率等,而其中,邏輯模型則自大約 1970年以來最常用的二元迴歸模型。[2]當存在兩個以上可能值(例如圖像是否是貓、狗、獅子等)時,二元變量可以推廣為分類變量,並且二元邏輯迴歸推廣為多項邏輯迴歸。如果多個類別是有序的,則可以使用序數邏輯迴歸。邏輯迴歸模型本身只是簡單地根據輸入對輸出機率進行建模,並不執行統計分類。[3]