跳转到内容

顺序统计量

维基百科,自由的百科全书

统计学中,样本的第顺序统计量(英语:Order Statistics)即它从小到大排列时的第个值,常用于非参数估计推断中。常见的顺序统计量包括样本的最大值最小值中位数等。

记号

任给样本,将其从小到大排成一列,记为:则其第一顺序统计量(即最小值)为,第顺序统计量(即最大值)为

概率

随机变量累积分布函数由下式给出[1] 将累积分布函数求导可得其概率密度函数

连续均匀样本

单位区间上的连续型均匀分布取得的样本,其各顺序统计量的边缘分布属于Β分布族。此外,任意几个顺序统计量的联合分布也有简单的表示。本节将作介绍。藉赖累积分布函数(cdf),该些结果亦可推广到任意连续分布。

本节中,表示以为cdf的一组随机样本。记,则是从标准连续均匀分布抽取的对应样本。由的单调性,后者的顺序统计量为

顺序统计量的概率密度函数(pdf)等于[2]

换言之,均匀分布的第顺序统计量遵循Β分布[2][3]

证明如下:欲使介乎之间,样本须恰有个元素小于,并至少有一个介乎之间。该区间包含多于一个元素的概率已是(使用了大O符号),故只需计算三区间分别恰有个元素的概率。此即三项分布英语multinomial distribution概率

故上述pdf公式成立。该分布的平均值为

参考文献

  1. ^ Order Statistics. www.math.uah.edu. [2016-07-28]. (原始内容存档于2017-08-13). 
  2. ^ 2.0 2.1 Gentle, James E. Computational Statistics. Springer. 2009: 63. ISBN 9780387981444 (英语). 
  3. ^ Jones, M. C. Kumaraswamy's distribution: A beta-type distribution with some tractability advantages. Statistical Methodology. 2009, 6 (1): 70–81. doi:10.1016/j.stamet.2008.04.001. As is well known, the beta distribution is the distribution of the m’th order statistic from a random sample of size n from the uniform distribution (on (0,1)).