随机变量的数字特征
一维随机变量的数字特征
数学期望
概念
设\(X\)为随机变量, \(Y\)是\(X\)的函数, \(Y=g(X)\)(\(g\)为连续函数).
离散型
如果\(X\)是离散型随机变量, 其分布列为\(p_i=P\{X=x_i\}(i=1, 2, ...)\), 若级数\(\sum_{i=1}^{\infty}x_ip_i\)绝对收敛, 称随机变量\(X\)的数学期望存在, 并将级数\(\sum_{i=1}^{\infty}x_ip_i\)的和称为随机变量\(X\)的数学期望, 记为\(E(X)\)或\(EX\), 即\(EX=\sum_{i=1}^{\infty}x_ip_i\), 否则称\(X\)的数学期望不存在.
若级数\(\sum_{i=1}^{\infty}g(x_i)p_i\)绝对收敛, 则称\(Y=g(X)\)的数学期望\(E[g(X)]\)存在, 且\(E[g(X)]=\sum_{i=1}^{\infty}g(x_i)p_i\), 否则称\(g(X)\)的数学期望不存在.
连续型
如果\(X\)是连续型随机变量, 其概率密度为\(f(x)\), 若积分\(\int_{-\infty}^{\infty}xf(x)dx\)绝对收敛, 则称\(X\)的数学期望存在, 且\(EX=\int_{-\infty}^{+\infty}xf(x)dx\), 否则称\(X\)的数学期望不存在.
若积分\(\int_{-\infty}^{+\infty}g(x)f(x)dx\)绝对收敛, 则称\(g(X)\)的数学期望存在, 且\(E[g(X)]=\int_{-\infty}^{\infty}g(x)f(x)dx\), 否则称\(g(X)\)的数学期望不存在.
性质
- 对任意常数\(a_i\)和随机变量\(X_i(i=1, 2, ..., n)\)有\(E(\sum_{i=1}^{n}a_iX_i)=\sum_{i=1}^n a_iEX_i\)
- \(Ec=c, E(aX+c)=aEX+c, E(X\pm Y)=EX\pm EY\)
- 设\(X\)与\(Y\)相互独立, 则\(E(XY)=EX\cdot EY, E[g_1(X)\cdot g_2(Y)]=E[g_1(X)]\cdot E[g_2(Y)]\)
- 一般地, 设\(X_1, X_2, ..., X_n\)相互独立, 则\(E(\prod_{i=1}^{n}X_i)=\prod_{i=1}^{n}EX_i, E[\prod_{i=1}^ng_i(X_i)]=\prod_{i=1}^n E[g_i(X_i)]\)
方差/标准差/切比雪夫不等式
概念
设\(X\)是随机变量, 如果\(E[(X-EX)^2]\)存在, 则称\(E[(X-EX)^2]\)为\(X\)的方差, 记为\(DX\), 即\(DX=E[(X-EX)^2]=E(X^2)-(EX)^2\), 称\(\sqrt{DX}\)为\(X\)的标准差或均方差, 记为\(\sigma(X)\). 称随机变量\(X^*=\frac{X-EX}{\sqrt{DX}}\)为\(X\)的标准化随机变量, 此时\(EX^*=0, DX^*=1\).
性质
- \(DX\geq 0, E(X^2)=DX+(EX)^2\geq (EX)^2\)
- \(Dc = 0\)
- \(D(aX+b)=a^2DX\)
- \(D(X\pm Y)=DX+DY\pm 2Cov(X, Y)\)
- 如果\(X\)与\(Y\)相互独立, 则\(D(aX+bY)=a^2DX+b^2DY\)
- 一般地, 如果\(X_1, X_2, ..., X_n\)相互独立, \(g_i(x)\)为\(x\)的连续函数, 则\(D(\sum_{i=1}^n a_iX_i)=\sum_{i=1}^n a_i^2DX_i\)且\(D[\sum_{i=1}^ng_i(X_i)]=\sum_{i=1}^n D[g_i(X_i)]\)
切比雪夫不等式
如果随机变量\(X\)的期望\(EX\)和方差\(DX\)存在, 则对任意\(\epsilon>0\), 有\(P\{|X-EX|\geq \epsilon\}\leq \frac{DX}{\epsilon^2}\)或\(P\{|X-EX|<\epsilon\}\geq 1-\frac{DX}{\epsilon^2}\).
笔记
由切比雪夫不等式可知, 当\(DX\)愈小时, 概率\(P\{X-EX\}<\epsilon\)愈大, 这表明方差是刻画随机变量与其期望值偏离程度的量, 是描述随机变量\(X\)"分散程度"特征的指标.
常用分布的期望和方差列表如下:
分布 | 分布列\(P_x\)或概率密度\(f(x)\) | 期望 | 方差 |
---|---|---|---|
0-1 分布 | \( P\{X=k\} = p^k (1-p)^{1-k}, k=0,1 \) | \( p \) | \( p(1-p) \) |
二项分布 | \( P\{X=k\} = C_n^k p^k (1-p)^{n-k}, k=0,1,...,n \) | \( np \) | \( np(1-p) \) |
泊松分布 | \( P\{X=k\} = \frac{\lambda^k e^{-\lambda}}{k!}, k=0,1,... \) | \( \lambda \) | \( \lambda \) |
几何分布 | \( P\{X=k\} = (1-p)^{k-1} p, k=1,2,... \) | \( \frac{1}{p} \) | \( \frac{1-p}{p^2} \) |
正态分布 | \( f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp \{ - \frac{(x-\mu)^2}{2\sigma^2} \}, -\infty < x < \infty \) | \( \mu \) | \( \sigma^2 \) |
均匀分布 | \( f(x) = \frac{1}{b-a}, a < x < b \) | \( \frac{a+b}{2} \) | \( \frac{(b-a)^2}{12} \) |
指数分布 | \( f(x) = \lambda e^{-\lambda x}, x > 0 \) | \( \frac{1}{\lambda} \) | \( \frac{1}{\lambda^2} \) |
二维随机变量的数字特征
数学期望
概念
设\(X, Y\)为随机变量, \(g(X, Y)\)为\(X, Y\)的函数(\(g\)是连续函数).
离散型
如果\((X, Y)\)为离散型随机变量, 其联合分布为\(p_{ij}=P\{X=x_i, Y=y_i\}(i, j=1, 2, ...)\), 若级数\(\sum_i\sum_j g(x_i, y_j)p_{ij}\)绝对收敛, 则定义\(E[g(X, Y)]=\sum_i\sum_j g(x_i, y_j)p_{ij}\).
连续型
如果\((X, Y)\)为连续型随机变量, 其概率密度为\(f(x, y)\), 若积分\(\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}g(x, y)f(x, y)dxdy\)绝对收敛, 则定义\(E[g(X, Y)]=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}g(x, y)f(x, y)dxdy\).
协方差/相关系数
概念
如果随机变量\(X\)和\(Y\)的方差存在且\(DX>0, DY>0\), 则称\(E[(X-EX)(Y-EY)]\)为随机变量\(X\)与\(Y\)的协方差, 并记为\(Cov(X, Y)\), 即\(Cov(X, Y)=E[(X-EX)(Y-EY)]=E(XY)-EX\cdot EY\).
其中\(E(XY)\)为:
- \(\sum_i\sum_j x_iy_jP\{X=x_i, Y=y_j\}\) (离散型)
- \(\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}xyf(x, y)dxdy\) (连续型)
称\(\rho_{XY}=\frac{Cov(X, Y)}{\sqrt{DX}\sqrt{DY}}\)为随机变量\(X\)与\(Y\)的相关系数, 如果\(\rho_{XY}=0\), 则称\(X\)与\(Y\)不相关; 如果\(\rho_{XY}\neq 0\), 则称\(X\)与\(Y\)相关.
性质
- \(Cov(X, Y)=Cov(Y, X), \rho_{XY}=\rho_{YX}\), \(Cov(X, X)=DX, \rho_{XX}=1\)
- \(Cov(X, c)=0, Cov(aX+b, Y)=aCov(X, Y)\), \(Cov(X_1+X_2, Y)=Cov(X_1, Y)+Cov(X_2, Y)\), 一般的, \(Cov(\sum_{i=1}^n a_iX_i, Y)=\sum_{i=1}^n a_iCov(X_i, Y)\)
- \(|\rho_{XY}|\leq 1\)
- 如果\(Y=aX+b\), 则\(\rho_{XY}=1, a>0\), \(\rho_{XY}=-1, a < 0\)