切比雪夫不等式

2023年12月27日

在概率论中,我们常常需要量化随机变量偏离其期望值的概率。切比雪夫不等式(Chebyshev’s Inequality)提供了一个与分布无关的通用边界,即使不知道具体分布形式,也能计算偏离概率的上限。

1. 定义

对于任意随机变量 XX(需满足 Var(X)<\text{Var}(X) < \infty),其期望值为 μ\mu,方差为 σ2\sigma^2,则对任意 k>0k > 0 有:

P(Xμkσ)1k2P\left( |X - \mu| \geq k \sigma \right) \leq \frac{1}{k^2}

2. 核心逻辑推导

2.1 从马尔可夫不等式出发

切比雪夫不等式是马尔可夫不等式的推广。马尔可夫不等式指出,对于非负随机变量 YY

P(Ya)E[Y]a,a>0P(Y \geq a) \leq \frac{E[Y]}{a}, \quad a > 0

2.2 构造非负随机变量

我们令 Y=(Xμ)2Y = (X - \mu)^2,则 E[Y]=σ2E[Y] = \sigma^2。根据马尔可夫不等式:

P((Xμ)2k2σ2)E[(Xμ)2]k2σ2=σ2k2σ2=1k2P\left( (X - \mu)^2 \geq k^2 \sigma^2 \right) \leq \frac{E[(X - \mu)^2]}{k^2 \sigma^2} = \frac{\sigma^2}{k^2 \sigma^2} = \frac{1}{k^2}

2.3 等价变形

注意到:

(Xμ)2k2σ2    Xμkσ(X - \mu)^2 \geq k^2 \sigma^2 \iff |X - \mu| \geq k \sigma

因此得到切比雪夫不等式:

P(Xμkσ)1k2P(|X - \mu| \geq k \sigma) \leq \frac{1}{k^2}

3. 几何解释

切比雪夫不等式表明:

4. 应用案例

案例1:数据范围估计

设某考试平均分 μ=70\mu = 70,标准差 σ=10\sigma = 10,求分数在50~90分外的概率上限。

解:

案例2:大数定律证明

切比雪夫不等式是证明弱大数定律的关键工具:

limnP(Snnμϵ)=0\lim_{n \to \infty} P\left( \left| \frac{S_n}{n} - \mu \right| \geq \epsilon \right) = 0

其中 Sn=X1++XnS_n = X_1 + \cdots + X_n

5. 局限性