在概率论与统计学中,超几何分布是一种重要的离散概率分布。它通常用于描述从有限总体中进行不放回抽样的情况下,某种特定事件发生的次数的概率分布。本文将深入探讨超几何分布的期望值与方差,并通过理论推导帮助读者更好地理解这一概念。
一、超几何分布的基本定义
假设有一个总数为 \( N \) 的总体,其中包含 \( K \) 个具有某种特性的个体(例如合格品或目标样本)。我们从中随机抽取 \( n \) 个个体(不放回),设 \( X \) 表示抽样中具有该特性的个体数量,则 \( X \) 服从超几何分布,记作 \( X \sim H(N, K, n) \)。
超几何分布的概率质量函数为:
\[
P(X = k) = \frac{\binom{K}{k} \cdot \binom{N-K}{n-k}}{\binom{N}{n}}, \quad k = 0, 1, 2, ..., \min(K, n)
\]
二、超几何分布的期望值
为了计算超几何分布的期望值 \( E[X] \),我们利用其概率质量函数和数学期望的定义。通过分析可以得出以下结论:
\[
E[X] = n \cdot \frac{K}{N}
\]
这个公式表明,超几何分布的期望值是总体大小 \( N \)、抽样数 \( n \) 和具有特定属性个体数 \( K \) 的线性关系。直观上,这表示抽样过程中具有特定属性个体的比例接近于总体中的比例。
三、超几何分布的方差
除了期望值外,方差也是衡量随机变量波动程度的重要指标。对于超几何分布,其方差公式为:
\[
Var(X) = n \cdot \frac{K}{N} \cdot \left( 1 - \frac{K}{N} \right) \cdot \frac{N-n}{N-1}
\]
需要注意的是,这里的分母 \( N-1 \) 是由于不放回抽样的特性引入的校正因子。当样本量 \( n \) 相对于总体大小 \( N \) 较小时,此因子趋于 1,此时方差近似于二项分布的形式。
四、实际应用举例
假设某工厂生产的产品总数为 500 件,其中有 100 件是次品。现随机抽取 20 件产品进行检测,求抽到的次品数量的期望值和方差。
根据公式:
\[
E[X] = 20 \cdot \frac{100}{500} = 4
\]
\[
Var(X) = 20 \cdot \frac{100}{500} \cdot \left( 1 - \frac{100}{500} \right) \cdot \frac{500-20}{500-1} \approx 3.16
\]
因此,在这种情况下,抽到的次品数量的平均值约为 4,而其波动范围可以通过标准差 \( \sqrt{Var(X)} \approx 1.78 \) 来估计。
五、总结
超几何分布在实际问题中有广泛的应用场景,尤其是在质量控制、市场调研等领域。通过掌握其期望值和方差的计算方法,我们可以更准确地预测和评估相关事件的发生情况。希望本文能够为读者提供清晰且实用的知识点梳理。