概率论与数理统计(第二章):随机变量及其分布

  • 教材:普通高等教育“十一五”国家级规划教材《概率论与数理统计》(第四版)
  • 授课教师:孙小娟

随机变量

定义

设随机试验的样本空间$S={e}.X=(e)$是定义在样本空间上的实值单值函数。称$X=X(e)$为随机变量。

一般,若$L$是一个实数集,将$X$在$L$上取值携程${X\in L}$.它表示事件$B={e|X(e)\in L}$,即$B$是由 $S$中是的$X(e)\in L$的所有样本点$e$所组成的事件,此时有
$$
P{X\in L}=P(B)=P{e|X(e)\in L}
$$
随机事件是从静态的观点来研究随机现象,而随机变量则是一种动态的观点。


离散型随机变量及其分布

有些随机变量,它全部可能取到的值是有限个或可列无限多个,这种个随机变量称为离散型随机变量

设离散型随机限量$X$所有可能取的值为$x_k(l=1,2,\cdots),X$取各个可能值的概率,即事件${X=x_k}$的概率,为
$$
P{X=x_k}=p_k,k=1,2,\cdots.
$$
由概率的定义,$p_k$满足如下两个条件:

  • 1

$$
p_k\geq 0,k=1,2,\cdots;
$$

  • 2

$$
\sum^{\infty}_{k=1}p_k=1
$$

(0-1)分布

设随机变量$X$只可能取$0,1$两个值,它的分布律是
$$
p{X=k}=p^k(1-p)^{1-k},k=0,1,(0<p<1),
$$
则称$X$服从以$p$为参数的$(0-1)$分布,或两点分布。

伯努利实验,二项分布

设试验$E$只有两个结果:$A,\overline{A}$,则称$E$为伯努利试验。将$E$独立重复地进行$n$次,则称这一串重复的独立试验为n重伯努利试验

随机变量$X$服从参数为$n,p$的二项分布,记为$X\sim b(n,p)$.

泊松分布

设随机变量$X$所有可能取的值为$0,1,2,\cdots$,而取各个值的概率为
$$
P{X=k}=\frac{\lambda^ke^{-\lambda}}{k!},k=0,1,2,\cdots,
$$
其中$\lambda >0$是常数,则称$X$服从参数为$\lambda$的泊松分布,几位$X\sim\pi(\lambda)$.


$$
\sum^\infty_{k=0}P{X=k}=\sum^\infty_{k=0}\frac{\lambda e^{-\lambda}}{k!}
=e^{-\lambda}\sum^\infty_{k=0}\frac{\lambda^k}{k!}=e^{-\lambda}e^\lambda=1
$$
泊松定理

设$\lambda >0$是一个常数,$n$是任意正整数,设$np_n=\lambda$,则对于人一个固定的非负整数$k$,有
$$
\lim_{n\rightarrow \infty}C^k_np^k_n(1-p_n)^{n-k}
=\frac{\lambda^ke^{-\lambda}}{k!}.
$$
证明:

由$p_n=\frac{\lambda}{n}$,有
$$
\begin{align}
C^k_np^k_n(1-p)^{n-k}
&=\frac{n(n-1)\cdots(n-(k+1))}{k!}(\frac{\lambda}{n})^k(1-\frac{\lambda}{n})^{n-k} \
&=\frac{\lambda^k}{k!}[1\cdot(1-\frac{1}{n})\cdots(1-\frac{k-1}{n})]
(1-\frac{\lambda}{n})^n(1-\frac{\lambda}{n})^{-k}
\end{align}
$$
对于任意固定的$k$,当$n\rightarrow\infty$时
$$
1\cdot(1-\frac{1}{n})\cdots(1-\frac{k-1}{n})\rightarrow1,\
(1-\frac{\lambda}{n})^n\rightarrow e^{-\lambda} \
(1-\frac{\lambda}{n})^{-k}\rightarrow1.
$$
故有
$$
\lim_{n\rightarrow \infty}C^k_np^k_n(1-p_n)^{n-k}
=\frac{\lambda^ke^{-\lambda}}{k!}.
$$

定理的条件$np_n=\lambda(常数)$意味着当$n$很大时$p_n$必定很小,因此,当$n$很大,$p$很小$np=\lambda$时有近似式
$$
C^k_np^k(1-p)^{n-k}\approx\frac{\lambda^ke^{-\lambda}}{k!}.(其中\lambda=np)
$$
一般,当$n\geq20,p\leq 0.05$时用$\frac{\lambda^ke^{-\lambda}}{k!}(\lambda=np)$作为$C^k_np^k(1-p)^{n-k}$近似值。


随机变量和分布函数

定义

设$X$时一个随机变量,$x$时任意实数,函数
$$
F(X)=P{X\leq x},-\infty<x<\infty
$$
称为$X$的分布函数

对任意实数$x_1,x_2(x_1<x_2)$,有
$$
P{x_1<X\leq x_2}=P{X\leq x_2}-P{X\leq x_2} \
=F(x_2)-F(x_1)
$$
基本性质:

  • 1 $F(x)$是一个不减函数

    对于任意实数$x_1,x_2(x_1< x_2)$


    $$
    F(x_2)-F(x_1)=P{x_1<X<x_2}\geq 0
    $$

  • 2 $0\leq F(x)\leq 1$,且
    $$
    F(-\infty)=\lim F(x)=0,F(\infty)=\lim F(x)=1
    $$

  • 3 $F(x+0)=F(x)$,即$F(x)$是右连续的。

一般,设离散型随机变量$X$的分布律为:
$$
P{X=x_k}=p_k,k=1,2,\cdots,
$$
由概率的可列可加性得$X$的分布函数为
$$
F(x)=P{X\leq x}=\sum_{x_k\leq x}{X=x_k},\
F(x)=\sum_{x_k\leq x}p_k
$$


连续型随机变量及其概率密度

如果对于随机变量$X$的分布函数$F(x)$,存在非负可积函数$f(x)$,使得对于任意实数$x$有
$$
F(x)=\int^x_{-\infty}f(t)dt,
$$
则称$X$为连续型随机变量,$f(x)$称为$X$的概率密度函数,简称概率密度。

概率密度$f(x)$的性质

  • $f(x)\geq 0$

  • $\int^{\infty}_{-\infty}f(x)dx=1$

  • 对于任意实数$x_1,x_2(x_1\leq x_2)$,
    $$
    P{x_1<X \leq x_2}=F(x_2)-F(x_1)=\int^{x_2}_{x_1}f(x)\rm d x
    $$

  • 若$f(x)$在点$x$处连续,则有$F^\prime(x)=f(x)$

反之,若$f(x)$具备性质1,2,引入$G(x)=\int^x_{-\infty}f(t)\rm dt$,它就可以作为某一随机变量$X$的分布函数,$f(x)$是$X$的概率密度。

在这里,事件${X=a}$并非不可能事件,但有$P{A=0}=0$

均匀分布

若连续型随机变量$X$具有概率密度
$$
f(x)=
\begin{cases}
\frac{1}{b-a},&a<x<b \
0,&其它
\end{cases}
$$
则称$X$在区间$(a,b)$上服从均匀分布。记$X\sim \cup(a,b)$

对于任一长度为$l$的子区间$(c,c+l),a\leq c \leq c+l\leq b$,有
$$
P{c<X\leq c+l}=\int^{c+l}_c\frac{1}{b-a}\rm dx =\frac{l}{b-a}
$$
分布函数
$$
F(x)=
\begin{cases}
0, & x<a,\
\frac{x-a}{b-a},&a\leq x<b,\
1, & x\geq b,
\end{cases}
$$

指数分布

若连续型随机变量$X$的概率密度为
$$
f(x)=
\begin{cases}
\frac{1}{\theta}e^{-\frac{x}{\theta}},&x>0 \
0,& 其它
\end{cases}
$$
其中$\theta > 0$为常数,则称$X$服从参数为$\theta$的指数分布。

概率密度函数图

img

分布函数
$$
F(x)=
\begin{cases}
1-e^\frac{-x}{\theta},&x>0,\
0,& 其它,
\end{cases}
$$
无记忆性质

对于任意$s,t>0$,有
$$
P{X>s+t|X>s}=P{X>t}
$$
证明:

$$
\begin{align}
P{X>s+t|X>s}
=& \frac{P{x>S+t}\cap(X>s)}{P{X>s}} \
=&\frac{P{X>s+t}}{P{X>s}}
= \frac{1-F(s+t)}{1-F(s)} \
=&\frac{\frac{e^{-(s+t)}}{\theta}}{e^\frac{-s}{\theta}}
= e^\frac{-t}{\theta} \
=&P{X>t}
\end{align}
$$