邏輯迴歸

邏輯迴歸（英語：Logistic regression，又譯作邏輯斯迴歸、羅吉斯迴歸、邏輯斯諦迴歸、對數機率迴歸），在統計學中是一種對數機率模型（英語：Logit model，又譯作邏輯模型、評定模型、分類評定模型），是離散選擇法模型之一，屬於多變量分析範疇，是社會學、生物統計學、臨床、數量心理學、計量經濟學、市場行銷等統計實證分析的常用方法。

通過使事件的對數發生率（log-odd）成為一個或多個自變數的線性組合，對事件發生的機率進行建模。形式上，在二元邏輯迴歸中，有一個二元應變數，由指示變量編碼，其中兩個值標記為「0」和「1」，而自變數每個都可以是二元變量（兩個類，由指示變量）或連續變量（任何實值）。標記為「1」的值的相應機率可以在0和1之間變化；將對數發生率轉換為機率的函數就是邏輯斯諦函數，因此得名。對數發生率單位稱為logit，來自logistic unit。^[1]

二元變量在統計學中廣泛用於對某一類別或事件發生機率的建模，例如團隊獲勝機率、患者健康機率等，而其中，邏輯模型則自大約 1970年以來最常用的二元迴歸模型。^[2]當存在兩個以上可能值（例如圖像是否是貓、狗、獅子等）時，二元變量可以推廣為分類變量，並且二元邏輯迴歸推廣為多項邏輯迴歸。如果多個類別是有序的，則可以使用序數邏輯迴歸。邏輯迴歸模型本身只是簡單地根據輸入對輸出機率進行建模，並不執行統計分類。^[3]

[1]

[2]

[3]