概率质量函数
在概率论和统计学中,概率质量函数(probability mass function,简写作pmf)是离散随机变量在各特定取值上的概率[1]。有时它也被称为离散密度函数。 概率密度函数通常是定义离散概率分布的主要方法,并且此类函数存在于其定义域是离散的标量变量或多元随机变量。
概率质量函数和概率密度函数的一个不同之处在于:概率质量函数是对离散随机变量定义的,本身代表该值的概率;概率密度函数本身不是概率,只有对连续随机变量的概率密度函数必须在某一个区间内被积分后才能产生出概率[2]。
具有最大概率密度的随机变量的值称为众数。
数学定义
假设X是一个定义在可数样本空间S上的离散随机变量 S ⊆ R,则其概率质量函数 fX(x) 为
注意这在所有实数上,包括那些X不可能等于的实数值上,都定义了 fX(x)。在那些X不可能等于的实数值上, fX(x)取值为0 ( x ∈ R\S,取Pr(X = x) 为0)。
离散随机变量概率质量函数的不连续性决定了其累积分布函数也不连续。
例子
概率质量函数可以定义在任何离散随机变量上,包括常数分布, 二项分布(包括伯努利(Bernoulli)分布), 负二项分布, 泊松(Poisson)分布, 几何分布以及超几何分布随机变量上.
有限
存在三个相关的主要分布,伯努利分布、二项式分布、和几何分布。
伯努利分布
伯努利分布:ber(p) ,用于对只有两种可能结果的实验进行建模。 这两个结果通常编码为1和0。
一个伯努利分布的例子是抛硬币。假设X是抛硬币的结果,反面取值为0,正面取值为1。则在状态空间{0, 1}(这是一个伯努利(Bernoulli)随机变量)中,X = x的概率是0.5,所以概率质量函数是
无限
以下呈指数下降的分布是具有无限数量可能结果的分布示例——所有正整数:
尽管可能的结果有无限多,但总概率密度为 1/2 + 1/4 + 1/8 +⋯ = 1,满足概率分布的单位总概率要求。
多变量情况
两个或多个离散随机变量具有联合概率密度函数,它给出了随机变量的每个可能的实现组合的概率。
参见
参考文献
- ^ Stewart, William J. Probability, Markov Chains, Queues, and Simulation: The Mathematical Basis of Performance Modeling. Princeton University Press. 2011: 105 [2022-04-18]. ISBN 978-1-4008-3281-1. (原始内容存档于2022-04-18).
- ^ A modern introduction to probability and statistics : understanding why and how. Dekking, Michel, 1946-. London: Springer. 2005. ISBN 978-1-85233-896-1. OCLC 262680588.