切比雪夫不等式
2023年12月27日
在概率论中,我们常常需要量化随机变量偏离其期望值的概率。切比雪夫不等式(Chebyshev’s Inequality)提供了一个与分布无关的通用边界,即使不知道具体分布形式,也能计算偏离概率的上限。
1. 定义
对于任意随机变量 X(需满足 Var(X)<∞),其期望值为 μ,方差为 σ2,则对任意 k>0 有:
P(∣X−μ∣≥kσ)≤k21
2. 核心逻辑推导
2.1 从马尔可夫不等式出发
切比雪夫不等式是马尔可夫不等式的推广。马尔可夫不等式指出,对于非负随机变量 Y:
P(Y≥a)≤aE[Y],a>0
2.2 构造非负随机变量
我们令 Y=(X−μ)2,则 E[Y]=σ2。根据马尔可夫不等式:
P((X−μ)2≥k2σ2)≤k2σ2E[(X−μ)2]=k2σ2σ2=k21
2.3 等价变形
注意到:
(X−μ)2≥k2σ2⟺∣X−μ∣≥kσ
因此得到切比雪夫不等式:
P(∣X−μ∣≥kσ)≤k21
3. 几何解释
切比雪夫不等式表明:
- 随机变量偏离期望超过 k 倍标准差的概率,被方差控制。
- 方差 σ2 越小,数据越集中在期望附近。
4. 应用案例
案例1:数据范围估计
设某考试平均分 μ=70,标准差 σ=10,求分数在50~90分外的概率上限。
解:
- 边界 ∣X−70∣≥20,即 kσ=20⇒k=2
- 根据切比雪夫不等式:
P(∣X−70∣≥20)≤41=25%
- 因此至少有75%的学生分数在50~90之间。
案例2:大数定律证明
切比雪夫不等式是证明弱大数定律的关键工具:
n→∞limP(nSn−μ≥ϵ)=0
其中 Sn=X1+⋯+Xn。
5. 局限性
- 保守性:实际概率通常远低于切比雪夫上界(如正态分布中 P(∣X−μ∣≥2σ)≈5%,但切比雪夫给出25%上界)。
- 依赖方差:需方差有限,对柯西分布等方差不存在的情况不适用。