概率论与数理统计(第二章)：随机变量及其分布

Posted on 2019-12-22 Edited on 2024-04-10 In 学习笔记 , 数学 Views: Disqus: Word count in article: 4.2k Reading time ≈ 4 mins.

教材：普通高等教育“十一五”国家级规划教材《概率论与数理统计》(第四版)
授课教师：孙小娟

随机变量

定义

设随机试验的样本空间$S={e}.X=(e)$是定义在样本空间上的实值单值函数。称$X=X(e)$为随机变量。

一般，若$L$是一个实数集，将$X$在$L$上取值携程${X\in L}$.它表示事件$B={e|X(e)\in L}$，即$B$是由 $S$中是的$X(e)\in L$的所有样本点$e$所组成的事件，此时有
$$
P{X\in L}=P(B)=P{e|X(e)\in L}
$$
随机事件是从静态的观点来研究随机现象，而随机变量则是一种动态的观点。

离散型随机变量及其分布

有些随机变量，它全部可能取到的值是有限个或可列无限多个，这种个随机变量称为离散型随机变量。

设离散型随机限量$X$所有可能取的值为$x_k(l=1,2,\cdots),X$取各个可能值的概率，即事件${X=x_k}$的概率，为
$$
P{X=x_k}=p_k,k=1,2,\cdots.
$$
由概率的定义，$p_k$满足如下两个条件：

$$
p_k\geq 0,k=1,2,\cdots;
$$

$$
\sum^{\infty}_{k=1}p_k=1
$$

（0-1）分布

设随机变量$X$只可能取$0,1$两个值，它的分布律是
$$
p{X=k}=p^k(1-p)^{1-k},k=0,1,(0<p<1),
$$
则称$X$服从以$p$为参数的$(0-1)$分布，或两点分布。

伯努利实验，二项分布

设试验$E$只有两个结果：$A,\overline{A}$，则称$E$为伯努利试验。将$E$独立重复地进行$n$次，则称这一串重复的独立试验为n重伯努利试验。

随机变量$X$服从参数为$n,p$的二项分布，记为$X\sim b(n,p)$.

泊松分布

设随机变量$X$所有可能取的值为$0,1,2,\cdots$,而取各个值的概率为
$$
P{X=k}=\frac{\lambda^ke^{-\lambda}}{k!},k=0,1,2,\cdots,
$$
其中$\lambda >0$是常数，则称$X$服从参数为$\lambda$的泊松分布，几位$X\sim\pi(\lambda)$.

有
$$
\sum^\infty_{k=0}P{X=k}=\sum^\infty_{k=0}\frac{\lambda e^{-\lambda}}{k!}
=e^{-\lambda}\sum^\infty_{k=0}\frac{\lambda^k}{k!}=e^{-\lambda}e^\lambda=1
$$
泊松定理

设$\lambda >0$是一个常数，$n$是任意正整数，设$np_n=\lambda$，则对于人一个固定的非负整数$k$，有
$$
\lim_{n\rightarrow \infty}C^k_np^k_n(1-p_n)^{n-k}
=\frac{\lambda^ke^{-\lambda}}{k!}.
$$
证明：

由$p_n=\frac{\lambda}{n}$，有
$$
\begin{align}
C^k_np^k_n(1-p)^{n-k}
&=\frac{n(n-1)\cdots(n-(k+1))}{k!}(\frac{\lambda}{n})^k(1-\frac{\lambda}{n})^{n-k} \
&=\frac{\lambda^k}{k!}[1\cdot(1-\frac{1}{n})\cdots(1-\frac{k-1}{n})]
(1-\frac{\lambda}{n})^n(1-\frac{\lambda}{n})^{-k}
\end{align}
$$
对于任意固定的$k$，当$n\rightarrow\infty$时
$$
1\cdot(1-\frac{1}{n})\cdots(1-\frac{k-1}{n})\rightarrow1,\
(1-\frac{\lambda}{n})^n\rightarrow e^{-\lambda} \
(1-\frac{\lambda}{n})^{-k}\rightarrow1.
$$
故有
$$
\lim_{n\rightarrow \infty}C^k_np^k_n(1-p_n)^{n-k}
=\frac{\lambda^ke^{-\lambda}}{k!}.
$$

定理的条件$np_n=\lambda(常数)$意味着当$n$很大时$p_n$必定很小，因此，当$n$很大，$p$很小$np=\lambda$时有近似式
$$
C^k_np^k(1-p)^{n-k}\approx\frac{\lambda^ke^{-\lambda}}{k!}.(其中\lambda=np)
$$
一般，当$n\geq20,p\leq 0.05$时用$\frac{\lambda^ke^{-\lambda}}{k!}(\lambda=np)$作为$C^k_np^k(1-p)^{n-k}$近似值。

随机变量和分布函数

定义

设$X$时一个随机变量，$x$时任意实数，函数
$$
F(X)=P{X\leq x},-\infty<x<\infty
$$
称为$X$的分布函数

对任意实数$x_1,x_2(x_1<x_2)$，有
$$
P{x_1<X\leq x_2}=P{X\leq x_2}-P{X\leq x_2} \
=F(x_2)-F(x_1)
$$
基本性质：

1 $F(x)$是一个不减函数

对于任意实数$x_1,x_2(x_1< x_2)$

有
$$
F(x_2)-F(x_1)=P{x_1<X<x_2}\geq 0
$$
2 $0\leq F(x)\leq 1$，且
$$
F(-\infty)=\lim F(x)=0,F(\infty)=\lim F(x)=1
$$
3 $F(x+0)=F(x)$，即$F(x)$是右连续的。

一般，设离散型随机变量$X$的分布律为：
$$
P{X=x_k}=p_k,k=1,2,\cdots,
$$
由概率的可列可加性得$X$的分布函数为
$$
F(x)=P{X\leq x}=\sum_{x_k\leq x}{X=x_k},\
F(x)=\sum_{x_k\leq x}p_k
$$

连续型随机变量及其概率密度

如果对于随机变量$X$的分布函数$F(x)$，存在非负可积函数$f(x)$，使得对于任意实数$x$有
$$
F(x)=\int^x_{-\infty}f(t)dt,
$$
则称$X$为连续型随机变量，$f(x)$称为$X$的概率密度函数，简称概率密度。

概率密度$f(x)$的性质

$f(x)\geq 0$
$\int^{\infty}_{-\infty}f(x)dx=1$
对于任意实数$x_1,x_2(x_1\leq x_2)$,
$$
P{x_1<X \leq x_2}=F(x_2)-F(x_1)=\int^{x_2}_{x_1}f(x)\rm d x
$$
若$f(x)$在点$x$处连续，则有$F^\prime(x)=f(x)$

反之，若$f(x)$具备性质1，2，引入$G(x)=\int^x_{-\infty}f(t)\rm dt$,它就可以作为某一随机变量$X$的分布函数，$f(x)$是$X$的概率密度。

在这里，事件${X=a}$并非不可能事件，但有$P{A=0}=0$

均匀分布

若连续型随机变量$X$具有概率密度
$$
f(x)=
\begin{cases}
\frac{1}{b-a},&a<x<b \
0,&其它
\end{cases}
$$
则称$X$在区间$(a,b)$上服从均匀分布。记$X\sim \cup(a,b)$

对于任一长度为$l$的子区间$(c,c+l),a\leq c \leq c+l\leq b$，有
$$
P{c<X\leq c+l}=\int^{c+l}_c\frac{1}{b-a}\rm dx =\frac{l}{b-a}
$$
分布函数
$$
F(x)=
\begin{cases}
0, & x<a,\
\frac{x-a}{b-a},&a\leq x<b,\
1, & x\geq b,
\end{cases}
$$

指数分布

若连续型随机变量$X$的概率密度为
$$
f(x)=
\begin{cases}
\frac{1}{\theta}e^{-\frac{x}{\theta}},&x>0 \
0,& 其它
\end{cases}
$$
其中$\theta > 0$为常数，则称$X$服从参数为$\theta$的指数分布。

概率密度函数图

分布函数
$$
F(x)=
\begin{cases}
1-e^\frac{-x}{\theta}，&x>0,\
0,& 其它，
\end{cases}
$$
无记忆性质

对于任意$s,t>0$，有
$$
P{X>s+t|X>s}=P{X>t}
$$
证明：

$$
\begin{align}
P{X>s+t|X>s}
=& \frac{P{x>S+t}\cap(X>s)}{P{X>s}} \
=&\frac{P{X>s+t}}{P{X>s}}
= \frac{1-F(s+t)}{1-F(s)} \
=&\frac{\frac{e^{-(s+t)}}{\theta}}{e^\frac{-s}{\theta}}
= e^\frac{-t}{\theta} \
=&P{X>t}
\end{align}
$$