在统计学中,样本的第顺序统计量(英语:Order Statistics)即它从小到大排列时的第个值,常用于非参数估计与推断中。常见的顺序统计量包括样本的最大值、最小值、中位数等。
记号
任给样本,将其从小到大排成一列,记为:则其第一顺序统计量(即最小值)为,第顺序统计量(即最大值)为。
概率
随机变量的累积分布函数由下式给出[1]
将累积分布函数求导可得其概率密度函数为
连续均匀样本
从单位区间上的连续型均匀分布取得的样本,其各顺序统计量的边缘分布属于Β分布族。此外,任意几个顺序统计量的联合分布也有简单的表示。本节将作介绍。藉赖累积分布函数(cdf),该些结果亦可推广到任意连续分布。
本节中,表示以为cdf的一组随机样本。记,则是从标准连续均匀分布抽取的对应样本。由的单调性,后者的顺序统计量为。
顺序统计量的概率密度函数(pdf)等于[2]
换言之,均匀分布的第顺序统计量遵循Β分布[2][3]
证明如下:欲使介乎与之间,样本须恰有个元素小于,并至少有一个介乎与之间。该区间包含多于一个元素的概率已是(使用了大O符号),故衹需计算、、三区间分别恰有、、个元素的概率。此即三项分布概率
故上述pdf公式成立。该分布的平均值为。
参考文献
- ^ Order Statistics. www.math.uah.edu. [2016-07-28]. (原始内容存档于2017-08-13).
- ^ 2.0 2.1 Gentle, James E. Computational Statistics. Springer. 2009: 63. ISBN 9780387981444 (英语).
- ^ Jones, M. C. Kumaraswamy's distribution: A beta-type distribution with some tractability advantages. Statistical Methodology. 2009, 6 (1): 70–81. doi:10.1016/j.stamet.2008.04.001.
As is well known, the beta distribution is the distribution of the m’th order statistic from a random sample of size n from the uniform distribution (on (0,1)).