跳转至

一维随机变量及其分布

随机变量

定义

随机变量\(X(\omega)\)是一个函数, 它将每一个随机试验结果\(\omega\)映射到一个实数.

分布函数

定义

\(X\)是随机变量, \(x\)是任意实数, 称函数\(F(x)=P\{X\leq x\}(x\in R)\)为随机变量\(X\)的分布函数, 或称\(X\)服从\(F(x)\)分布, 记为\(X\sim F(x)\).

性质

  • \(F(x)\)\(x\)的单调不减函数
  • \(F(x)\)\(x\)的右连续函数, 即对任意\(x_0\in R\), 有\(\lim_{x\rightarrow x_0^+}F(x)=F(x_0+0)=F(x_0)\)
  • \(F(-\infty)=\lim_{x\rightarrow -\infty}F(x)=0, F(+\infty)=\lim_{x\rightarrow +\infty}F(x)=1\)

应用

  • \(P\{X\leq a\}=F(a)\)
  • \(P\{X< a\}=F(a-0)\)
  • \(P\{X=a\}=F(a)-F(a-0)\)

离散型随机变量及其概率分布

分布律

如果随机变量\(X\)只能取有限个或可列个值\(x_1, x_2, ...\), 则称\(X\)为离散型随机变量, 称\(P\{X=x_i\}=p_i\), \(i=1, 2, ...\)\(X\)的分布列/律或者概率分布, 记为\(X\sim p\), 概率分布常常用表格形式或矩阵形式表示.

数列\(\{p_i\}\)是离散型随机变量的概率分布的充要条件: \(p_i\geq 0(i=1, 2, ...)\), 且\(\sum_i p_i = 1\).

分布函数

设离散型随机变量\(X\)的概率分布为\(P\{X=x_i\}=p_i\), 则\(X\)的分布函数为: \(F(x)=P\{X\leq x\}=\sum_{x\geq x_i}P\{X=x_i\}\). \(P\{X=x_i\}=P\{X\leq x_i\}-P\{X<x_i\}=F(x_i)-F(x_i-0)\)

对实数轴上任一集合\(B\)有: \(P\{X\in B\}=\sum_{x_i\in B}P\{X=x_i\}\).

特别地, \(P\{a<X\leq b\}=P\{X\leq b\}-P\{X\leq a\}=F(b)-F(a)\)

连续型随机变量及其概率密度

概率密度/分布函数

如果随机变量的分布函数可以表示为

\(F(x)=\int_{-\infty}^x f(t)d t(x\in R)\)

其中\(f(x)\)为非负可积函数, 则称\(X\)为连续型随机变量, 称\(f(x)\)\(X\)的概率密度函数, 简称概率密度, 记为\(X\sim f(x)\).

\(f(x)\)为某一随机变量\(X\)的概率密度的充分必要条件: \(f(x)\geq 0\), 且\(\int_{-\infty}^{\infty}f(x)dx=1\).

\(X\)为连续随机变量, \(X\sim f(x)\), 则对任意实数\(c\), 有\(P\{X=c\}=0\). 对实数轴上的任一集合\(B\), 有: \(P\{X\in B\}=\int_Bf(x)dx\)

特别地, \(P\{a<X<b\}=P\{a\leq X< b\}=P\{a<X\leq b\}=P\{a\leq X\leq b\}=\int_a^bf(x)dx=F(b)-F(a)\)

常见的随机变量分布类型

离散型

\(0-1\)分布

\(X\)的概率分布为

\(P\{X=1\}=p, P\{X=0\}=1-p\)

则称\(X\)服从参数为\(p\)\(0-1\)分布, 记为\(X\sim B(1, p)(0<p<1)\).

二项分布

如果\(X\)的概率分布为

\(P\{X=k\}=C_n^kp^k(1-p)^{n-k}(k=0, 1, ..., n; 0<p<1)\)

则称\(X\)服从参数为\((n, p)\)的二项分布, 记为\(X\sim B(n, p)\).

笔记

二项分布描述的是在\(n\)次独立的伯努利试验中, 成功次数分布的情况.

泊松分布

如果\(X\)的概率分布为

\(P\{X=k\}=\frac{\lambda^k}{k!}e^{-k}(k=0, 1, ...; \lambda>0)\)

则称\(X\)服从参数为\(\lambda\)的泊松分布, 记为\(X\sim P(\lambda)\).

笔记

泊松分布指的是在一个给定的时间或空间范围内, 某事件发生的次数的分布情况.

几何分布

如果\(X\)的概率分布为

\(P\{X=k\}=(1-p)^{k-1}p(k=1, 2, ...; 0< p< 1)\)

则称\(X\)服从参数为\(p\)的几何分布, 记为\(X\sim G(p)\).

笔记

几何分布描述的是进行独立重复试验, 知道第一次成功所需要的试验次数的分布情况.

超几何分布

如果\(X\)的概率分布为

\(P\{X=k\}=\frac{C^k_MC^{n-k}_{N-M}}{C^n_N}(max\{0, n-N+M\}\leq k\leq min\{M, n\}\); \(M, N, n\)为正整数且\(M\leq N, n\leq N, k\)为整数\()\)

则称\(X\)服从参数为\((n, N, M)\)的超几何分布, 记为\(X\sim H(n, N, M)\).

笔记

超几何分布描述的是从有限总体中不放回抽取样本后某种特定属性的元素个数的分布情况.

连续型

均匀分布

如果\(X\)的概率密度和分布函数分别为

  • 概率密度: \(f(x)=\frac{1}{b-a}, a<x<b\); \(f(x)=0,\) 其他
  • 分布函数: \(f(x)=0, x<a\); \(f(x)=\frac{x-a}{b-a}, a\leq x<b\); \(f(x)=1, x\geq b\)

则称\(X\)在区间\((a, b)\)上服从均匀分布, 记为\(X\sim U(a, b)\).

指数分布

如果\(X\)的概率密度和分布函数分别为

  • 概率密度: \(f(x)=\lambda e^{-\lambda x}, x>0\); \(0,\) 其他
  • 分布函数: \(f(x)=1-e^{-\lambda x}, x\geq 0\); \(0, x<0\)

则称\(X\)服从参数为\(\lambda\)的指数分布, 记为\(X\sim E(\lambda)\)

正态分布

如果\(X\)的概率密度为

\(f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{1}{2}(\frac{x-\mu}{\sigma})^2}(-\infty<x<+\infty)\)

其中\(-\infty<\mu<+\infty, \sigma>0\), 则称\(X\)服从参数为\((\mu, \sigma^2)\)的正态分布或称\(X\)为正态变量, 记为\(X\sim N(\mu, \sigma^2)\). 此时, \(f(x)\)的图形关于直线\(x=\mu\)对称, 并在\(x=\mu\)有唯一最大值\(f(\mu)=\frac{1}{\sqrt{2\pi}\sigma}\), 如下图所示.

标准正态分布

\(\mu=0, \sigma=1\)时的正态分布\(N(0, 1)\)为标准正态分布.

  • 概率密度\(\varphi(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{1}{2}x^2}\)
  • 分布函数\(\Phi(x)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^x e^{-\frac{t^2}{2}}dt\)

显然, \(\varphi(x)\)为偶函数, 则\(\Phi(0)=\frac{1}{2}, \Phi(-x)=1-\Phi(x)\)

\(\varphi(x)\)如下图所示:

\(X\sim N(0, 1), P\{X>\mu_0\}=a\), 则称\(\mu_0\)为标准正态分布的上侧\(a\)分位数(上\(a\)分位点).

性质

如果\(X\sim N(\mu, \sigma^2)\), 有:

  • \(F(x)=P\{X<x\}=\Phi(\frac{x-\mu}{\sigma})\)
  • \(F(\mu-x)+F(\mu+x)=1\)
  • \(P\{a<X<b\}=\Phi(\frac{b-\mu}{\sigma})-\Phi(\frac{a-\mu}{\sigma})\)
  • \(aX+b\sim N(a\mu+b, a^2\sigma^2), (a\neq 0)\)

利用这些性质可以将所有的正态分布都用标准正态分布求解.

一维随机变量函数的分布

\(X\)为随机变量, 函数\(y=g(x)\), 则以随机变量\(X\)作为自变量的函数\(Y=g(X)\)也是随机变量, 称为随机变量\(X\)的函数.

随机变量函数的分布

离散型 -> 离散型

\(X\)为离散型随机变量, 其概率分布为\(p_i=P\{X=x_i\}(i=1, 2, ...)\), 则\(X\)作为自变量的函数\(Y=g(X)\)也是离散型随机变量, 其概率分布为\(P\{Y=g(x_i)\}=p_i(i=1, 2, ...)\).

若有若干个\(g(x_i)\)值相同, 则合并诸项为一项\(g(x_k)\), 并将相应的概率相加作为\(Y\)\(g(x_k)\)值的概率(1).

  1. 例子

    \(W=X^2\)的分布率, \(X\)中有绝对值相同的正数和负数, 则需要合并诸项为一项, 并将相应的概率相加.

连续型 -> 连续型

\(X\)为连续型随机变量, 其分布函数, 概率密度分别为\(F_X(x)\)\(f_X(x)\), 随机变量\(Y=g(X)\)\(X\)的函数, 则\(Y\)的分布函数和概率密度可用分布函数法求得.

\(F_Y(y)=P\{Y\leq y\}=P\{g(X)\leq y\}=\int_{g(X)\leq y}f_X(x)dx\)

如果\(F_Y(y)\)连续, 且除有限个点外, \(F'_Y(y)\)存在且连续, 则\(Y\)的概率密度\(f_Y(y)=F'_Y(y)\).

Tip

思路: 若给出的是原始随机变量的概率密度函数, 则首先将其转为原始随机变量的分布函数, 新随机变量的分布函数可以和原始随机变量的分布函数产生联系, 通过这个联系求出新随机变量的分布函数, 最后求导得到新随机变量的概率密度函数.