概率论与数理统计(第二章):随机变量及其分布
- 教材:普通高等教育“十一五”国家级规划教材《概率论与数理统计》(第四版)
- 授课教师:孙小娟
随机变量
定义
设随机试验的样本空间$S={e}.X=(e)$是定义在样本空间上的实值单值函数。称$X=X(e)$为随机变量。
一般,若$L$是一个实数集,将$X$在$L$上取值携程${X\in L}$.它表示事件$B={e|X(e)\in L}$,即$B$是由 $S$中是的$X(e)\in L$的所有样本点$e$所组成的事件,此时有
$$
P{X\in L}=P(B)=P{e|X(e)\in L}
$$
随机事件是从静态的观点来研究随机现象,而随机变量则是一种动态的观点。
离散型随机变量及其分布
有些随机变量,它全部可能取到的值是有限个或可列无限多个,这种个随机变量称为离散型随机变量
。
设离散型随机限量$X$所有可能取的值为$x_k(l=1,2,\cdots),X$取各个可能值的概率,即事件${X=x_k}$的概率,为
$$
P{X=x_k}=p_k,k=1,2,\cdots.
$$
由概率的定义,$p_k$满足如下两个条件:
- 1
$$
p_k\geq 0,k=1,2,\cdots;
$$
- 2
$$
\sum^{\infty}_{k=1}p_k=1
$$
(0-1)分布
设随机变量$X$只可能取$0,1$两个值,它的分布律是
$$
p{X=k}=p^k(1-p)^{1-k},k=0,1,(0<p<1),
$$
则称$X$服从以$p$为参数的$(0-1)$分布,或两点分布。
伯努利实验,二项分布
设试验$E$只有两个结果:$A,\overline{A}$,则称$E$为伯努利试验。将$E$独立重复地进行$n$次,则称这一串重复的独立试验为n重伯努利试验
。
随机变量$X$服从参数为$n,p$的二项分布,记为$X\sim b(n,p)$.
泊松分布
设随机变量$X$所有可能取的值为$0,1,2,\cdots$,而取各个值的概率为
$$
P{X=k}=\frac{\lambda^ke^{-\lambda}}{k!},k=0,1,2,\cdots,
$$
其中$\lambda >0$是常数,则称$X$服从参数为$\lambda$的泊松分布
,几位$X\sim\pi(\lambda)$.
有
$$
\sum^\infty_{k=0}P{X=k}=\sum^\infty_{k=0}\frac{\lambda e^{-\lambda}}{k!}
=e^{-\lambda}\sum^\infty_{k=0}\frac{\lambda^k}{k!}=e^{-\lambda}e^\lambda=1
$$
泊松定理
设$\lambda >0$是一个常数,$n$是任意正整数,设$np_n=\lambda$,则对于人一个固定的非负整数$k$,有
$$
\lim_{n\rightarrow \infty}C^k_np^k_n(1-p_n)^{n-k}
=\frac{\lambda^ke^{-\lambda}}{k!}.
$$
证明:
由$p_n=\frac{\lambda}{n}$,有
$$
\begin{align}
C^k_np^k_n(1-p)^{n-k}
&=\frac{n(n-1)\cdots(n-(k+1))}{k!}(\frac{\lambda}{n})^k(1-\frac{\lambda}{n})^{n-k} \
&=\frac{\lambda^k}{k!}[1\cdot(1-\frac{1}{n})\cdots(1-\frac{k-1}{n})]
(1-\frac{\lambda}{n})^n(1-\frac{\lambda}{n})^{-k}
\end{align}
$$
对于任意固定的$k$,当$n\rightarrow\infty$时
$$
1\cdot(1-\frac{1}{n})\cdots(1-\frac{k-1}{n})\rightarrow1,\
(1-\frac{\lambda}{n})^n\rightarrow e^{-\lambda} \
(1-\frac{\lambda}{n})^{-k}\rightarrow1.
$$
故有
$$
\lim_{n\rightarrow \infty}C^k_np^k_n(1-p_n)^{n-k}
=\frac{\lambda^ke^{-\lambda}}{k!}.
$$
定理的条件$np_n=\lambda(常数)$意味着当$n$很大时$p_n$必定很小,因此,当$n$很大,$p$很小$np=\lambda$时有近似式
$$
C^k_np^k(1-p)^{n-k}\approx\frac{\lambda^ke^{-\lambda}}{k!}.(其中\lambda=np)
$$
一般,当$n\geq20,p\leq 0.05$时用$\frac{\lambda^ke^{-\lambda}}{k!}(\lambda=np)$作为$C^k_np^k(1-p)^{n-k}$近似值。
随机变量和分布函数
定义
设$X$时一个随机变量,$x$时任意实数,函数
$$
F(X)=P{X\leq x},-\infty<x<\infty
$$
称为$X$的分布函数
对任意实数$x_1,x_2(x_1<x_2)$,有
$$
P{x_1<X\leq x_2}=P{X\leq x_2}-P{X\leq x_2} \
=F(x_2)-F(x_1)
$$
基本性质:
1 $F(x)$是一个不减函数
对于任意实数$x_1,x_2(x_1< x_2)$
有
$$
F(x_2)-F(x_1)=P{x_1<X<x_2}\geq 0
$$2 $0\leq F(x)\leq 1$,且
$$
F(-\infty)=\lim F(x)=0,F(\infty)=\lim F(x)=1
$$3 $F(x+0)=F(x)$,即$F(x)$是右连续的。
一般,设离散型随机变量$X$的分布律为:
$$
P{X=x_k}=p_k,k=1,2,\cdots,
$$
由概率的可列可加性得$X$的分布函数为
$$
F(x)=P{X\leq x}=\sum_{x_k\leq x}{X=x_k},\
F(x)=\sum_{x_k\leq x}p_k
$$
连续型随机变量及其概率密度
如果对于随机变量$X$的分布函数$F(x)$,存在非负可积函数$f(x)$,使得对于任意实数$x$有
$$
F(x)=\int^x_{-\infty}f(t)dt,
$$
则称$X$为连续型随机变量,$f(x)$称为$X$的概率密度函数,简称概率密度。
概率密度$f(x)$的性质
$f(x)\geq 0$
$\int^{\infty}_{-\infty}f(x)dx=1$
对于任意实数$x_1,x_2(x_1\leq x_2)$,
$$
P{x_1<X \leq x_2}=F(x_2)-F(x_1)=\int^{x_2}_{x_1}f(x)\rm d x
$$若$f(x)$在点$x$处连续,则有$F^\prime(x)=f(x)$
反之,若$f(x)$具备性质1,2,引入$G(x)=\int^x_{-\infty}f(t)\rm dt$,它就可以作为某一随机变量$X$的分布函数,$f(x)$是$X$的概率密度。
在这里,事件${X=a}$并非不可能事件,但有$P{A=0}=0$
均匀分布
若连续型随机变量$X$具有概率密度
$$
f(x)=
\begin{cases}
\frac{1}{b-a},&a<x<b \
0,&其它
\end{cases}
$$
则称$X$在区间$(a,b)$上服从均匀分布
。记$X\sim \cup(a,b)$
对于任一长度为$l$的子区间$(c,c+l),a\leq c \leq c+l\leq b$,有
$$
P{c<X\leq c+l}=\int^{c+l}_c\frac{1}{b-a}\rm dx =\frac{l}{b-a}
$$
分布函数
$$
F(x)=
\begin{cases}
0, & x<a,\
\frac{x-a}{b-a},&a\leq x<b,\
1, & x\geq b,
\end{cases}
$$
指数分布
若连续型随机变量$X$的概率密度为
$$
f(x)=
\begin{cases}
\frac{1}{\theta}e^{-\frac{x}{\theta}},&x>0 \
0,& 其它
\end{cases}
$$
其中$\theta > 0$为常数,则称$X$服从参数为$\theta$的指数分布。
概率密度函数图
分布函数
$$
F(x)=
\begin{cases}
1-e^\frac{-x}{\theta},&x>0,\
0,& 其它,
\end{cases}
$$
无记忆性质
对于任意$s,t>0$,有
$$
P{X>s+t|X>s}=P{X>t}
$$
证明:
$$
\begin{align}
P{X>s+t|X>s}
=& \frac{P{x>S+t}\cap(X>s)}{P{X>s}} \
=&\frac{P{X>s+t}}{P{X>s}}
= \frac{1-F(s+t)}{1-F(s)} \
=&\frac{\frac{e^{-(s+t)}}{\theta}}{e^\frac{-s}{\theta}}
= e^\frac{-t}{\theta} \
=&P{X>t}
\end{align}
$$