跳至內容

泰爾-森估算

維基百科,自由的百科全書
黑線為泰爾-森估算,藍線為簡單線性回歸模型,綠虛線用於生成樣本數據點。

泰爾-森估算(英語:Theil–Sen estimator)是非參數統計中一種擬合直線的穩健模型,名稱來源於荷蘭計量經濟學家亨利·泰爾英語Henri Theil與美國統計學家普拉納布·森英語Pranab K. Sen

假設有二維樣本數據(xi,yi),泰爾-森估算是指所有樣本點對所形成的斜率(yjyi)/(xjxi)中位數m。當擬合直線的斜率m確定後,可再由yimxi的中位數確定擬合直線的截距。[1]

泰爾-森估算不易受離群值影響。對於偏態分布或異方差的數據,泰爾-森估算的準確度遠高於非穩健的簡單線性回歸,而對於常態分布數據而言其與非穩健模型相比也有著相當的統計功效[2]

參考文獻

  1. ^ Rousseeuw & Leroy (2003), pp. 67, 164.
  2. ^ Wilcox (2001).