威沙特参数 |
自由度 (实数) 尺度矩阵 (正定) |
---|
值域 |
是正定的 |
---|
概率密度函数 |
|
---|
期望值 |
|
---|
众数 |
|
---|
特征函数 |
|
---|
以统计学家约翰·威沙特为名的威沙特分布是统计学上的一种半正定矩阵随机分布。[1]这个分布在多变量分析的协方差矩阵估计上相当重要。
定义
假设X为一n × p矩阵,其各行(row)来自同一均值向量为的维多变量正态分布且彼此独立。
则威沙特分布为散异矩阵
的几率分布。
有该几率分布通常记为
其中正整数为自由度。有时亦记号为。若且则该分布退化为一自由度为的单变量卡方分布。
常见应用
威沙特分布常用于多变量的概似比检定,亦用于随机矩阵的频谱理论中。
几率密度函数
威沙特分布具有下述的几率密度函数:
令'为一正定对称随机变数矩阵。令为一特定正定矩阵。
如此,若,则服从于一具自由度n的威沙特分布且有几率度函数
其中为多变量Gamma分布,其定义为
上述定义可推广至任一实数[2]
特征函数
威沙特分布的特征函数为
也就是说
其中为期望值
(这里的及 皆为与维度相同的矩阵。( 为单位矩阵,而为-1的平方根).[3]
理论架构
若为一自由度为m,共变异矩阵为的威沙特分布,记为——其中为一的q秩矩阵,则[4]
推论1
若为一非负常数向量,则[4]
.
则在此情形下,为一卡方分布且(因为正定,所以为一正常数)。
推论2
在 的情形下(亦即第j个元素为1其他为0),推论1可导出
为矩阵的每一个对对角元素的边际分布。
统计学家George Seber曾论证威沙特分布并非多变量卡方分布,这是因为非对角元素的边际分布并非卡方分布,Seber倾向于将某某多变量分布此一遣词用于所有元素的边际分布皆相同的情形。[5]
多变量正态分布的估计
由于威沙特分布可视为一多变量正态分布其共变异矩阵的最大概似估计量(MLE)的分布,其衍自MLE的计算可为令人惊喜地简约而优雅。[6] 基于频谱理论,可将一标量视为一矩阵的迹(trace)。请参考共变异矩阵的估计。
分布抽样
以下的算法取材自 Smith & Hocking (1972)。[7]一个来自自由度为n及共变异矩阵为的威沙特分布的(其中)随机样本可以如下方式抽样而得:
- 生成一随机下三角矩阵 使得:
- ,意即 为一卡方分布随机样本的平方根。
- 其中,为一正态分布的随机样本。[8]
- 计算的Cholesky分解。
- 计算。此时, 为一的随机样本。
若,则因,可以直接以进行抽样。
参考条目
参考资料
- ^ Wishart, J. The generalised product moment distribution in samples from a normal multivariate population. Biometrika. 1928, 20A (1–2): 32–52. JFM 54.0565.02. JSTOR 2331939. doi:10.1093/biomet/20A.1-2.32.
- ^ Uhlig, H. On Singular Wishart and Singular Multivariate Beta Distributions. The Annals of Statistics. 1994, 22: 395–405. doi:10.1214/aos/1176325375.
- ^ Anderson, T. W. An Introduction to Multivariate Statistical Analysis 3rd. Hoboken, N. J.: Wiley Interscience. 2003: 259. ISBN 0-471-36091-0.
- ^ 4.0 4.1 Rao, C. R. Linear Statistical Inference and its Applications. Wiley. 1965: 535.
- ^ Seber, George A. F. Multivariate Observations. Wiley. 2004. ISBN 978-0471691211.
- ^ Chatfield, C.; Collins, A. J. Introduction to Multivariate Analysis. London: Chapman and Hall. 1980: 103–108. ISBN 0-412-16030-7.
- ^ Smith, W. B.; Hocking, R. R. Algorithm AS 53: Wishart Variate Generator. Journal of the Royal Statistical Society, Series C. 1972, 21 (3): 341–345. JSTOR 2346290.
- ^ Anderson, T. W. An Introduction to Multivariate Statistical Analysis 3rd. Hoboken, N. J.: Wiley Interscience. 2003: 257. ISBN 0-471-36091-0.
- Gelman, Andrew. Bayesian Data Analysis 2nd. Boca Raton, Fla.: Chapman & Hall. 2003: 582 [3 June 2015]. ISBN 158488388X. (原始内容存档于2021-02-17).
- Zanella, A.; Chiani, M.; Win, M.Z. On the marginal distribution of the eigenvalues of wishart matrices. IEEE Transactions on Communications. April 2009, 57 (4): 1050–1060. doi:10.1109/TCOMM.2009.04.070143.
- Bishop, C. M. Pattern Recognition and Machine Learning. Springer. 2006: 693.
- Pearson, Karl; Jeffery, G. B.; Elderton, Ethel M. On the Distribution of the First Product Moment-Coefficient, in Samples Drawn from an Indefinitely Large Normal Population. Biometrika (Biometrika Trust). December 1929, 21: 164–201. JSTOR 2332556. doi:10.2307/2332556.
- Craig, Cecil C. On the Frequency Function of xy. Ann. Math. Statist. 1936, 7: 1–15 [2016-05-02]. doi:10.1214/aoms/1177732541. (原始内容存档于2020-06-07).
- Peddada and Richards, Shyamal Das; Richards, Donald St. P. Proof of a Conjecture of M. L. Eaton on the Characteristic Function of the Wishart Distribution,. Annals of Probability. 1991, 19 (2): 868–874. doi:10.1214/aop/1176990455.
- Gindikin, S.G. Invariant generalized functions in homogeneous domains,. Funct. Anal. Appl. 1975, 9 (1): 50–52. doi:10.1007/BF01078179.
- Dwyer, Paul S. Some Applications of Matrix Derivatives in Multivariate Analysis. J. Amer. Statist. Assoc. 1967, 62 (318): 607–625. JSTOR 2283988.