热门问题
时间线
聊天
视角
核迴歸
来自维基百科,自由的百科全书
Remove ads
核迴歸(又稱局部加權線性迴歸)是統計學中用於估計隨機變數的條件期望值的無母數方法。目的是找到一對隨機變數X和Y之間的非線性關係。
在任何無母數迴歸中 ,變量的條件期望值 相對於變量可以寫成:
m為一個未知函數。
Remove ads
Nadaraya–Watson核迴歸
1964年, Nadaraya和Watson都提出了估算作為局部加權平均值,使用內核作為加權函數的方法。 [1] [2] [3] Nadaraya–Watson估計量為:
是一個帶寬為 的核。 分母是一個總和為1的加權項。
Remove ads
將內核密度估計用於具有內核K的聯合分布f(x,y)和f(x) ,
, ,
我們得到
這便是Nadaraya–Watson估計量。
Remove ads
Priestley–Chao核估計函數
此處 為帶寬(或平滑參數)。
Gasser–Müller核估計函數
此處
Remove ads
示例
此示例基於加拿大截面工資數據,該數據由1971年加拿大人口普查公用帶中的隨機樣本組成,這些樣本適用於受過普通教育的男性(13年級)。共有205個觀測值。
右圖顯示了使用二階高斯核以及漸近變化範圍的估計迴歸函數
以下R語言命令使用npreg()
函數提供最佳平滑效果並創建上面給出的圖形。 這些命令可以通過剪切和粘貼在命令提示符下輸入。
install.packages("np")
library(np) # non parametric library
data(cps71)
attach(cps71)
m <- npreg(logwage~age)
plot(m,plot.errors.method="asymptotic",
plot.errors.style="band",
ylim=c(11,15.2))
points(age,logwage,cex=.25)
相關資料
大衛·薩爾斯堡 (David Salsburg)指出 ,用於內核迴歸的算法是獨立開發的,並且已用於模糊系統 :「通過幾乎完全相同的計算機算法,模糊系統和基於內核密度的迴歸似乎是完全獨立於彼此而開發的。 」 [4]
統計實現
- MATLAB 這些頁面 (頁面存檔備份,存於網際網路檔案館)上提供了免費的MATLAB工具箱,其中包括內核迴歸,內核密度估計,危險函數的內核估計以及許多其他工具的實現(此工具箱是本書的一部分[5] )。
- Stata npregress , kernreg2 (頁面存檔備份,存於網際網路檔案館)
- R : np package的函數
npreg
可以執行內核迴歸。 [6] [7] - Python :所述
KernelReg
在混合數據類型類statsmodels.nonparametric
子包(包括其他內核密度相關的類),封裝kernel_regression (頁面存檔備份,存於網際網路檔案館)作為的延伸sklearn (低效存儲器明智的,有用的,只有對於小數據集) - GNU Octave數學程序包:
相關資料
- 內核平滑
- 局部迴歸
參考文獻
延申閱讀
外部連結
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads