此條目需要
精通或熟悉相關主題的編者 參與及協助編輯。
(2015年12月14日 ) 請邀請 適合的人士改善本條目 。更多的細節與詳情請參見討論頁 。
核密度估計 (英語:Kernel density estimation ,縮寫 :KDE )是在概率論 中用來估計未知的密度函數 ,屬於非參數檢驗方法 之一,由Rosenblatt (1955)和Emanuel Parzen (1962)提出,又名Parzen窗 (Parzen window)。Ruppert和Cline基於數據集密度函數聚類算法提出修訂的核密度估計方法。
100個常態分佈 的亂數 的核密度估計
核密度估計在估計邊界區域的時候會出現邊界效應 。
在單變量核密度估計的基礎上,可以建立風險價值 的預測模型。通過對核密度估計變異係數的加權處理,可以建立不同的風險價值的預測模型。
一些比較常用的核函數是:
均勻核函數
k
(
x
)
=
1
2
,
−
1
≤
x
≤
1
{\displaystyle k(x)={\frac {1}{2}},\;-1\leq x\leq 1}
,
加入帶寬
h
{\displaystyle h}
後:
k
h
(
x
)
=
1
2
h
,
−
h
≤
x
≤
h
{\displaystyle k_{h}(x)={\frac {1}{2h}},\;-h\leq x\leq h}
。
三角核函數
k
(
x
)
=
1
−
|
x
|
,
−
1
≤
x
≤
1
{\displaystyle k(x)=1-|x|,\;-1\leq x\leq 1}
,
加入帶寬
h
{\displaystyle h}
後:
k
h
(
x
)
=
(
h
−
|
x
|
)
h
2
,
−
h
≤
x
≤
h
{\displaystyle k_{h}(x)={\frac {(h-|x|)}{h^{2}}},\;-h\leq x\leq h}
。
伽馬核函數
k
x
i
(
x
)
=
x
(
α
−
1
)
exp
(
−
x
α
/
x
i
)
(
x
i
/
α
)
α
Γ
(
α
)
{\displaystyle k_{x_{i}}(x)={\frac {x^{(\alpha -1)}\exp {(-x\alpha /x_{i})}}{(x_{i}/\alpha )^{\alpha }\Gamma (\alpha )}}}
。
定義
設
(
x
1
,
x
2
,
⋯
,
x
n
)
{\displaystyle \left(x_{1},x_{2},\cdots ,x_{n}\right)}
為從單變量分布中抽取的獨立同分布 樣本,給定點
x
{\displaystyle x}
有未知的概率密度
f
{\displaystyle f}
,我們對估計函數
f
{\displaystyle f}
的形狀感興趣,其核密度估計器是
f
^
h
(
x
)
=
1
n
∑
i
=
1
n
K
h
(
x
−
x
i
)
=
1
n
h
∑
i
=
1
n
K
(
x
−
x
i
h
)
,
{\displaystyle {\widehat {f}}_{h}(x)={\frac {1}{n}}\sum _{i=1}^{n}K_{h}(x-x_{i})={\frac {1}{nh}}\sum _{i=1}^{n}K{\Big (}{\frac {x-x_{i}}{h}}{\Big )},}
其中
K
{\displaystyle K}
是非負的核函數,帶寬
h
>
0
{\displaystyle h>0}
為平滑參數。帶下標h的核被稱為縮放核,定義為
K
h
(
x
)
=
1
/
h
⋅
K
(
x
/
h
)
{\displaystyle K_{h}(x)=1/h\cdot K(x/h)}
。直覺上講,在數據允許的範圍內應當選擇儘可能小的帶寬;然而,偏差 和方差之間總有所權衡。
常用的核函數有:均勻核(Uniform)、三角核(Triangular)、雙權核(Biweight)、三權核(Triweight)、Epanechnikov核、正態核(Normal)等。從均方誤差的角度來看,Epanechnikov核是最佳的[ 1] ,儘管對於前面列出的核來說,效率的損失很小[ 2] 。由於其數學特性良好,正態核經常被使用,即
K
(
x
)
=
ϕ
(
x
)
{\displaystyle K(x)=\phi (x)}
,其中
ϕ
{\displaystyle \phi }
是標準正態密度函數。
參考文獻
唐林俊、楊虎、張洪陽:核密度估計在預測風險價值中的應用 The Application of The Kernel Density Estimates in Predicting VaR,《數學的實踐與認識》2005年10期
^ Epanechnikov, V.A. Non-parametric estimation of a multivariate probability density. Theory of Probability and Its Applications. 1969, 14 : 153–158. doi:10.1137/1114019 .
^ Wand, M.P; Jones, M.C. Kernel Smoothing. London: Chapman & Hall/CRC. 1995. ISBN 978-0-412-55270-0 .