跳转到内容

泊松二项分布

本页使用了标题或全文手工转换
维基百科,自由的百科全书
泊松二项分布
Poisson binomial
参数 (试验数)
(各试验的成功概率)
值域 k ∈ { 0, …, n }
概率质量函数
累积分布函数
期望
方差
偏度
峰度
矩生成函数
特征函数
概率母函数

概率论统计学中,泊松二项分布是一个基于独立伯努利试验之和的离散概率分布。这一概念以西梅翁·德尼·泊松的名字命名。

换句话说,它是成功概率分别为n独立伯努利试验中,成功次数的概率分布。普通二项分布是泊松二项分布在所有成功概率相同(即)时的特例。

定义

概率质量函数

n次试验中有k次成功的概率可以写为以下总和[1]

其中是 {1,2,3,..., n } 的全体k元子集的集合。例如,如果n = 3,那么补集,也就是

将包含个元素,因此上述总和在实务中是很难计算的,除非试验次数n很小(例如,如果n = 30,包含超过1020个元素)。然而,还有其他更有效的方法可以计算

只要成功概率都不等于 1,就可以使用递归公式计算出k次成功的概率:[2][3]

其中

递归公式在数值上不稳定,在约大于20时应避免使用。另一种方法是使用分治算法:假设是2的幂,并以表示成功概率为的泊松二项分布,表示卷积,则

另一种可能性是使用离散傅立叶变换[4]

其中

Chen和Liu在“泊松二项式和条件伯努利分布的统计应用”中描述了其他方法。 [5]

特性

均值和方差

由于泊松二项式分布变数是n个独立伯努利分布变数的总和,因此其均值和方差将是n个伯努利分布的均值和方差之和:

当平均值()和次数(n)为定值,且所有成功概率相等时,我们会得到二项式分布,方差此时最大。当平均值固定时,方差的上界为具有相同均值的泊松分布的方差,该上界在n趋于无穷大时可以渐近取得。[来源请求]

泊松二项式分布的没有简单的公式,但熵的上限是具有相同数字参数和相同均值的二项式分布的熵。因此,熵也不大于相同均值的泊松分布的熵。

谢普-奥尔金凹性猜想由劳伦斯·谢普英语Lawrence Shepp英格拉姆·奥尔金英语Ingram Olkin于1981年提出,指出泊松二项式分布的熵是成功概率的凹函数。这个猜想由 Erwan Hillion 和 Oliver Johnson 于2015年证明。1981年同一篇论文亦提出谢普-奥尔金单调性猜想:若,则熵对为单调递增。这个猜想也被 Hillion 和 Johnson 于 2019 年证明。

参考资料

  1. ^ Wang, Y. H. On the number of successes in independent trials (PDF). Statistica Sinica. 1993, 3 (2): 295–312 [2023-07-29]. (原始内容存档 (PDF)于2016-03-03). 
  2. ^ Shah, B. K. On the distribution of the sum of independent integer valued random variables. American Statistician. 1994, 27 (3): 123–124. JSTOR 2683639. 
  3. ^ Chen, X. H.; A. P. Dempster; J. S. Liu. Weighted finite population sampling to maximize entropy (PDF). Biometrika. 1994, 81 (3): 457 [2023-07-29]. doi:10.1093/biomet/81.3.457. (原始内容存档 (PDF)于2022-01-07). 
  4. ^ Fernandez, M.; S. Williams. Closed-Form Expression for the Poisson-Binomial Probability Density Function. IEEE Transactions on Aerospace and Electronic Systems. 2010, 46 (2): 803–817. Bibcode:2010ITAES..46..803F. S2CID 1456258. doi:10.1109/TAES.2010.5461658. 
  5. ^ Chen, S. X.; J. S. Liu. Statistical Applications of the Poisson-Binomial and conditional Bernoulli distributions. Statistica Sinica. 1997, 7: 875–892.