概率论知识点总结（上）

概率论知识点总结（上）
参考资料
- 概率论 · 复习概要
- 何书元《概率论与数理统计》
1. 随机事件与概率

 1.1 古典概型

古典概型中常用计数一有重复的排列数
- 从 $n$ 个不同元素中有放回地每次随机抽取一个, 共抽取 $m$ 次, 有序地记录结果, 共有 $n^{m}$ 种等可能的不同结果。
- 例：掷骰子 3 次, 记录每次结果, 结果一共有 $\times 6 \times 6=6^{3}$ 种。
- 例：从 52 张扑克牌中随机有放回地抽取并记录 3 次, 结果共有 $52^{3}$ 种。
古典概型中常用计数一排列数
- 从 $n$ 个不同元素中无放回地每次随机抽取一个, 共抽取 $m$ 次 $\leq n)$ , 有序地记录结果, 共有
  $A_{n}^{m}=n(n-1) \ldots(n-m+1)=\frac{n !}{(n-m) !}$
  种等可能的不同结果。
- $A_{n}^{m}$ 在有的教材中记为 $P_{n}^{m}$ 。
- 例：从 52 张扑克牌中随机无放回地抽取 3 张, 记录每次结果, 结果有 $52 \times 51 \times 50=A_{52}^{3}$ 种。
古典概型中常用计数一组合数
- 从 $n$ 个不同元素中无放回地每次抽取一个, 共抽取 $m$ 次 $\leq n)$ , 不计次序地记录结果 (只要元素相同, 不管次序是否相同都算是相同结果), 共有
  $C_{n}^{m}=\frac{n(n-1) \ldots(n-m+1)}{m !}=\frac{n !}{m !(n-m) !}$
  种等可能的不同结果。
- 例：从一副扑克牌的 4 张 A 中随机无放回抽取 2 张组成一手牌, 不计次序。有 $C_{4}^{2}=4 \times 3 / 2=6$ 种结果。
古典概型中常用计数一分组方式数
- 将 $n$ 个不同元素分成有序号的 $k$ 组, 要求第 $i$ 组恰好有 $n_{i}$ 个元素 $\ldots, k)$ , 分组结果中同组的元素不考虑次序。则这样分组的所有不同分法个数为
  $\begin{matrix} n \\ n_{1}, n_{2}, \dots, n_{k} \end{matrix}$
- 当随机分组时, 这些分法是等可能的。
- 随机分组的方法是 $n$ 个元素随机排列 ( $n$ ! 种排法), 然后前 $n_{1}$ 个不计次序地归入 $i = 1$ 组, 后续 $n_{2}$ 个不计次序地归入 $i = 2$ 组, 以此类推。
- 例 10 个学生分成 $\mathrm{A}, \mathrm{B}, \mathrm{C}$ 三个组, 分别有 3、3、4人, 组内不计次序。
  分组方式个数为
  $\begin{matrix} 10 \\ 3, 3, 4 \end{matrix}$
古典概型中常用计数一可重复分组数
- 从 $n$ 个不同的球中有放回地每次抽取一个, 共抽取 $m$ 次, 结果不计次序。共有 $C_{n+m-1}^{m}$ 种不同的组合。
- 用 0 和 1 组成的序列表示一个结果。
- 用 $n - 1$ 个 1 分隔出 $n$ 个组, 1 表示组边界。这 $n$ 个组是结果排序后球号 $\ldots, n$ 的组。
- 每组内有若干个 0 表示该组个数, 如果出现 11 则该组没有球, 把 $m$ 个 0 分配到各个组中。
- 这样, 用长度为 $n + m - 1$ 的 0-1 向量表示一个结果, 结果个数为 $C_{n+m-1}^{n-1}$ (从 $n + m - 1$ 个二进制位中选择 1 的位置, 即边界的位置)。
- 可重复分组数在随机分组时一般不是等可能的。
- 例如, 从红、白两个球中有放回地抽取 2 次, 计数这 2 次红球、白球个数。共有 (红 0 , 白 2 $), ($ 红 1 , 白 1 $), ($ 红 2 , 白 0 $)$ 三种结果, 即 $C_{2+2-1}^{2}=3$ 种结果。随机抽取时 (红 1 , 白 1) 概率为 $\frac{1}{2}$ , (红 0 , 白 2) 和 (红 2 , 白 $0)$ 的概率都是 $\frac{1}{4}$ 。
例题

 1.2 加法公式与乘法公式

和事件的概率 $\cup B)$ 在不同场合下的求法:
- 一般形式:
  
  $\begin{aligned} P (A \cup B) & = P (A) + P (B) - P (A B) \\ P (A \cup B \cup C) & = P (A) + P (B) + P (C) - P (A B) - P (A C) - P (B C) + P (A B C) . \end{aligned}$ $P (A \cup B) P (A \cup B \cup C) = P (A) + P (B) - P (A B) = P (A) + P (B) + P (C) - P (A B) - P (A C) - P (BC) + P (A BC) .$
- 若 $A, B$ 互不相容: $\cup B)=P(A)+P(B)$ .
- 若 $A, B$ 相互独立:
  
  $\begin{aligned} P (A \cup B) & = 1 - P (\bar{A \cup B}) = 1 - P (\bar{A} \bar{B}) \\ = 1 - P (\bar{A}) P (\bar{B}) \end{aligned}$ $P (A \cup B) = 1 - P (\overline{A \cup B}) = 1 - P (\overset{ˉ}{A} \overset{ˉ}{B}) = 1 - P (\overset{ˉ}{A}) P (\overset{ˉ}{B})$
积事件的概率 $P (A B)$ 的求法:
- 一般形式:
  $\mid A)=P(B) P(A \mid B) .$
- 若 $A, B$ 相互独立:
  $P (A B) = P (A) P (B) .$
  乘法公式来自于条件概率公式:
  $\mid A)=\frac{P(A B)}{P(A)}$
1.3 全概率公式和 Bayes 公式

全概率公式

$\begin{aligned} P (A) & = P (A B_{1}) + P (A B_{2}) + \dots + P (A B_{n}) \\ = P (B_{1}) P (A ∣ B_{1}) + P (B_{2}) P (A ∣ B_{2}) + \dots + P (B_{n}) P (A ∣ B_{n}) . \end{aligned}$
P(A)=P(AB1)+P(AB2)+⋯+P(ABn)=P(B1)P(A∣B1)+P(B2)P(A∣B2)+⋯+P(Bn)P(A∣Bn).
Bayes 公式
$P\left(B_{i} \mid A\right)=\frac{P\left(B_{i}\right) P\left(A \mid B_{i}\right)}{\sum_{j=1}^{n} P\left(B_{j}\right) P\left(A \mid B_{j}\right)}, \quad i=1,2, \cdots, n .$
Bayes 公式本质上是条件概率公式:
$P\left(B_{i} \mid A\right)=\frac{P\left(A B_{i}\right)}{P(A)},$
只是其分子、分母进一步分别使用了乘法公式和全概率公式.
- 全概率公式表达了 “综合考虑引起结果 $A$ 的各种原因 $B_{i}$ , 计算导致结果 $A$ 出现的可能性的大小”; 如果一个事件的发生有多个 “诱因”, 就要用到全概率公式.
- Bayes 公式则反映了 “当结果 $A$ 出现时, 它是由原因 $B_{i}$ 引起的可能性的大小”. Bayes 公式常用来追究责任, 或者 “执果索因”. 也就是计算各个 “诱因” 对事件发生的 “贡献”.
例题：

发报台分别以概率0.6和0.4发出信号“1”和“0”。由于通讯系统受到干扰，当发出信号“1”时，收报台未必收到信号“1”，而是分别以概率0.8和0.2收到信号“1”和“0”；同时，当发出信号“0”时，收报台分别以概率0.9和0.1收到信号“0”和“1”。求（1）收报台收到信号“1”的概率；（2）当收报台收到信号“1”时，发报台确是发出信号“1”的概率。

正确答案：

设A1=“发出信号1”，A0=“发出信号0”，A=“收到信号1”

(1)由全概率公式，有P(A)=P(A|A1)P(A1)+P(A|A0)P(A0)=0.8x0.6+0.1x0.4=0.52

(2)由贝叶斯公式，有P(A1|A)=P(A|A1)P(A1)/P(A)=0.8x0.6/0.52=12/13

2. 随机变量及其概率分布

 2.0 密度函数与分布函数

概率密度函数定义
- 设 $X$ 是随机变量, 如果存在非负函数 $f (x)$ 使得对任何满足 $-\infty \leq a−∞≤a<b≤∞$
分布密度性质

设 $f (x)$ 是 $X$ 的概率密度, 则 $f (x)$ 有如下的基本性质.
(a) $\int_{-\infty}^{\infty} f(x) d x=1$ ,
(b) $P (X = a) = 0$ . 于是 $,$

证明: (a) 由
$\int_{-\infty}^{\infty} f(x) d x=P(-\infty∫−∞∞f(x)dx=P(−∞<X≤∞)=1$

(b)
$\operatorname{Pr}(X=a) \leq \operatorname{Pr}(X \in(a-\varepsilon, a])=\int_{a-\varepsilon}^{a} f(x) d x \rightarrow 0, \quad \varepsilon \rightarrow 0 .$

概率分布函数定义

对随机变量 $X$ , 称 $x$ 的函数
$\leq x), \quad-\infty \leq x \leq \infty,$
为 $X$ 的概率分布函数, 简称为分布函数 (distribution function), 也称为累积 (cumulative) 分布函数。
例: $\Phi(x)=\int_{-\infty}^{x} \varphi(t) d t$ 是标准正态分布的分布函数.

离散型随机变量的分布函数

从定义看出, 如果 $X$ 是离散型随机变量, 有概率分布
$p_{k}=P\left(X=x_{k}\right), k=1,2, \cdots,$
则 $X$ 的分布函数
$\leq x)=P\left(\bigcup_{j: x_{j} \leq x}\left\{X=x_{j}\right\}\right)=\sum_{j: x_{j} \leq x} p_{j}$
是单调不减的阶梯函数.

连续型随机变量的分布函数

如果 $X$ 是连续型随机变量, 有概率密度 $f (x)$ , 则
$F(x)=\int_{-\infty}^{x} f(t) d t$
是连续函数, 并且在 $f (x)$ 的连续点 $x$ 有 $f(x)=F^{\prime}(x)$ . 我们称 $F (x)$ 是 $f (x)$ 的分布函数.

分布函数性质

分布函数 $F (x)$ 的常用性质:
(1) $F$ 单调不减右连续,
(2) $F(\infty)=1, F(-\infty)=0$ .

证明

(1) 对 $x < y x, 单调不减性由 { x < X ≤ y } = { X ≤ y } − { X ≤ x } \{x 和 P ( x < X ≤ y ) = P ( X ≤ y ) − P ( X ≤ x ) = F ( y ) − F ( x ) ≥ 0 P(x 得到.$
由于 $n$ 越大, 集合 $\{X \leq x+1 / n\}$ 越小, 所以用 $F$ 的单调性和概率 $P$ 的连续性得到
$\begin{aligned} lim_{δ ↓ 0} F (x + δ) & = lim_{n \to \infty} F (x + 1 / n) \\ = lim_{n \to \infty} P (X \leq x + 1 / n) \\ = P (\cap_{n = 1}^{\infty} {X \leq x + 1 / n}) \\ = P (X \leq x) = F (x) . \end{aligned}$
(2) 由 $F(\infty)=P(X \leq \infty)=P(\Omega)=1$ 和 $F(-\infty)=P(X \leq-\infty)=$ $P(\emptyset)=0$ 得到 (2).

2.1 已知密度函数 $f (x)$ , 求分布函数 $F (x)$

密度函数 $f (x)$ 一般是分段函数. 由 $f (x)$ 求 $F (x)$ , 本质上是分段函数求积分的问题!

典型例题:
设随机变量 $X$ 具有概率密度

${\begin{cases} k x, & 0 ⩽ x < 3, \\ 2 - \frac{x}{2}, & 3 ⩽ x ⩽ 4, \\ 0, & 其它. \end{cases}$ $f (x) = ⎩ ⎨ ⎧ k x, 2 - \frac{x}{2}, 0, 0 ⩽ x < 3, 3 ⩽ x ⩽ 4, 其它 .$
(1) 确定常数 $k$ ; (2) 求 $X$ 的分布函数 $F (x)$ ; (3) 求 $\begin{aligned} F (x) & = \int_{- \infty}^{0} 0 d t + \int_{0}^{3} \frac{t}{6} d t + \int_{3}^{x} (2 - \frac{t}{2}) d t \\ = - 3 + 2 x - \frac{x^{2}}{4} \end{aligned}$ $f_{X} (x) = {\frac{x}{8}, 0, 0 < x < 4, 其他 .$
求 $Y = 2 X + 8$ 的概率密度 $f_{Y}(y)$ .

解先求 $Y$ 的分布函数. (请自已注明下述各个步骤的理由.)

$\begin{aligned} F_{Y} (y) & = P {Y ⩽ y} \\ = P {2 X + 8 ⩽ y} \\ = P {X ⩽ \frac{y - 8}{2}} \\ = \int_{- \infty}^{\frac{y - 8}{2}} f_{X} (x) d x \end{aligned}$ $F_{Y} (y) = P {Y ⩽ y} = P {2 X + 8 ⩽ y} = P {X ⩽ \frac{y - 8}{2}} = \int_{- \infty}^{\frac{y - 8}{2}} f_{X} (x) d x$
注意到积分上限函数求导法则 $\left(\int_{-\infty}^{\varphi(x)} f(x) \mathrm{d} x\right)^{\prime}=f(\varphi(x)) \varphi^{\prime}(x)$ , 上式两端关于 $y$ 求导, 得
$\begin{aligned} f_{Y} (y) & = f_{X} (\frac{y - 8}{2}) \cdot {(\frac{y - 8}{2})}_{y}^{'} \\ = \frac{1}{2} f_{X} (\frac{y - 8}{2}) \\ = {\begin{cases} \frac{1}{2} \cdot \frac{y - 8}{2}, & 0 < \frac{y - 8}{2} < 4, \\ 0, & 其他. \end{cases} \\ = {\begin{cases} \frac{y - 8}{32}, & 8 < y < 16, \\ 0, & 其他. \end{cases} \end{aligned}$
上述方法体现为下面的一般结论. 称为单调函数公式法:

2.3 正态分布

正态分布的标准化: 若 $\sim N\left(\mu, \sigma^{2}\right)$ , 则 $\frac{X-\mu}{\sigma} \sim N(0,1)$ .
对一般的随机变量也可以 “标准化”, 即使它不一定服从正态分布. 事实上, $X$ 标准化变量为
$X^{*}=\frac{X-E(X)}{\sqrt{D(X)}},$
则
$E\left(X^{*}\right)=0, \quad D\left(X^{*}\right)=1 .$
正态分布的再生性: 设 $X, Y$ 相互独立, $\sim N\left(\mu_{1}, \sigma_{1}^{2}\right), Y \sim N\left(\mu_{2}, \sigma_{2}^{2}\right)$ , 则
$\begin{matrix} X + Y \sim N (μ_{1} + μ_{2}, σ_{1}^{2} + σ_{2}^{2}) \\ a X \pm b Y \sim N (a μ_{1} \pm b μ_{2}, a^{2} σ_{1}^{2} + b^{2} σ_{2}^{2}) . \end{matrix}$
$\Phi(-x)=1-\Phi(x)$ .
$z_{1-\alpha}=-z_{\alpha}$ .

2.4 常用的概率分布表

 3. 多维随机变量及其概率分布

 3.1 边缘分布与边缘密度

边缘分布

设 $F (x, y)$ 是 $(X, Y)$ 的联合分布, 则 $X, Y$ 分别有概率分布
$\begin{aligned} F_{X} (x) = P (X \leq x, Y \leq \infty) = F (x, \infty), \\ F_{Y} (y) = P (X \leq \infty, Y \leq y) = F (\infty, y) . \end{aligned}$
我们称 $X$ 的分布函数 $F_{X}(x), Y$ 的分布函数 $F_{Y}(x)$ 为 $(X, Y)$ 的边缘分布函数 (marginal distribution function).

边缘密度

设 $f (x, y)$ 是随机向量 $(X, Y)$ 的概率密度, 则 $X$ 和 $Y$ 也都是连续型随机变量, 我们称 $X, Y$ 各自的概率密度为 $f (x, y)$ 或 $(X, Y)$ 的边缘密度 (marginal density).
对任何 $\begin{aligned} P (a < X \leq b) & = P (a < X \leq b, Y < \infty) \\ = \int_{a}^{b} (\int_{- \infty}^{\infty} f (x, y) d y) d x \end{aligned}$
完全对称地得到 $Y$ 的边缘函数
$f_{Y}(y)=\int_{-\infty}^{\infty} f(x, y) d x$

联合分布与联合密度

设 $(X, Y)$ 有连续的分布函数 $F (x, y)$ , 定义
${\begin{cases} \frac{\partial^{2} F (x, y)}{\partial x \partial y}, & 当该混合偏导数存在, \\ 0, & 其他. \end{cases}$
如果
$\iint_{R^{2}} f(x, y) d x d y=1,$
则 $f (x, y)$ 是 $(X, Y)$ 的联合密度.

独立性的判断, 即看下列式子是否成立:
$\times 边缘.$

联合概率计算的例子

两人某天在 1 点至 2 点间独立地随机到达某地会面, 先到者等候 20 分钟后离去. 求这两人能相遇的概率.
解认为每个人在 0 至 60 分钟内等可能到达, 用 $X, Y$ 分别表示他们的到达时间. 则 $\sim \mathrm{U}(0,60), Y \sim \mathrm{U}(0,60), X, Y$ 独立. 利用
${\begin{cases} \frac{1}{60}, & x \in (0, 60), \\ 0, & x \notin (0, 60), \end{cases}$
得到 $(X, Y)$ 的联合密度
${\begin{cases} 1 / 60^{2}, & (x, y) \in D, \\ 0, & (x, y) \notin D . \end{cases}$
其中 $D=\{(x, y) \mid 0 \leq x, y \leq 60\}$ .
$A=\{(x, y)|| x-y \mid \leq 20,(x, y) \in D\} .$
要计算的概率是
$\begin{aligned} P (| X - Y | \leq 20) & = \iint_{A} f (x, y) d x d y \\ = \frac{60^{2} - 40^{2}}{60^{2}} = \frac{5}{9} . \end{aligned}$

3.2 随机变量函数的分布

例题

设二维随机变量 $(X, Y)$ 的概率密度为

${\begin{cases} 1, & 0 < x < 1, 0 < y < 2 x, \\ 0, & 其他. \end{cases}$ $f (x, y) = {1, 0, 0 < x < 1, 0 < y < 2 x, 其他 .$
求:
(I) $(X, Y)$ 的边缘概率密度 $f_{X}(x), f_{Y}(y)$ ;
(II) $Z = 2 X - Y$ 的概率密度 $f_{Z}(z)$ .

解
(I) 注意到 $f (x, y)$ 在 $X$ -型区域 $\left\{$
$\begin{array}{l} 0 < y < 2 x, \\ 0 < x < 1 \end{array}$ \right. ${0 < y < 2 x, 0 < x < 1$ 上有非零表达式, 该区域可以转化为 $Y$ -型区域 $\begin{array}{l} \frac{y}{2} < x < 1, \\ 0 < y < 2 . \end{array}$ 则
$\begin{aligned} f_{X} (x) = \int_{- \infty}^{+ \infty} f (x, y) d y = {\begin{array}{ll} \int_{0}^{2 x} d y, & 0 < x < 1, \\ 0, & 其他. \end{array} = {\begin{cases} 2 x, & 0 < x < 1, \\ 0, & 其他. \end{cases} \\ f_{Y} (y) = \int_{- \infty}^{+ \infty} f (x, y) d x = {\begin{array}{ll} \int_{\frac{y}{2}}^{1} d x, & 0 < y < 2, \\ 0, & 其他. \end{array} = {\begin{cases} 1 - \frac{y}{2}, & 0 < y < 2, \\ 0, & 其他. \end{cases} \end{aligned}$
(II) 用积分转化法. 此时 $g (x, y) = 2 x - y$ . 对任何有界连续函数 $h (z)$ ,
$\begin{aligned} \int_{- \infty}^{+ \infty} \int_{- \infty}^{+ \infty} h [g (x, y)] f (x, y) d x d y & = \int_{0}^{1} (\int_{0}^{2 x} h (2 x - y) \cdot 1 d y) d x \\ = \int_{0}^{1} (\int_{2 x}^{0} h (z) (- 1) d z) d x (换元 z = 2 x - y) \\ = \int_{0}^{1} (\int_{0}^{2 x} h (z) d z) d x \\ = \int_{0}^{2} (h (z) \int_{\frac{z}{2}}^{1} d x) d z (交换积分次序) \\ = \int_{0}^{2} h (z) (1 - \frac{z}{2}) d z, \end{aligned}$
得 $Z$ 的概率密度为
${\begin{cases} 1 - \frac{z}{2}, & 0 < z < 2, \\ 0, & 其他. \end{cases}$

3.3 条件分布和条件密度

条件分布

设 $\boldsymbol{X}=\left(X_{1}, X_{2}, \cdots, X_{n}\right), \boldsymbol{Y}=\left(Y_{1}, Y_{2}, \cdots, Y_{m}\right)$ 是随机向量, 本节讨论已知 $\boldsymbol{X}=\left(x_{1}, x_{2}, \cdots, x_{m}\right)$ 的条件下, $\boldsymbol{Y}$ 的概率分布.
为了叙述的简单, 我们只对 $n = m = 1$ 的情况详细讨论.
离散型随机变量的条件分布
设 $(X, Y)$ 是离散型随机向量, 有概率分布
$p_{i j}=P\left(X=x_{i}, Y=y_{j}\right)>0, \quad i, j=1,2, \cdots,$
$X, Y$ 分别有边缘分布
$p_{i}=P\left(X=x_{i}\right), q_{j}=P\left(Y=y_{j}\right), i, j=1,2, \cdots .$
对每个固定的 $i$ , 由条件概率公式得到条件概率
$P\left(Y=y_{j} \mid X=x_{i}\right)=\frac{P\left(X=x_{i}, Y=y_{j}\right)}{P\left(X=x_{i}\right)}=\frac{p_{i j}}{p_{i}}, j=1,2, \ldots$
为条件 $X=x_{i}$ 下, $Y$ 的条件概率分布, 简称为条件分布 (conditional distribution).

条件密度

设随机向量 $(X, Y)$ 有联合密度 $f (x, y), X$ 有边缘密度 $f_{X}(x)$ , 若在 $x$ (确定的 $\left.x\right)$ 处 $f_{X}(x)>0$ , 就称
$\leq y \mid X=x)=\int_{-\infty}^{y} \frac{f(x, t)}{f_{X}(x)} d t, y \in \mathbb{R}$
为条件 $X = x$ 下, $Y$ 的条件分布函数 (conditional distribution function), 简称为条件分布, 记做 $F_{Y \mid X}(y \mid x)$ .
称
$f_{Y \mid X}(y \mid x)=\frac{f(x, y)}{f_{X}(x)}, y \in \mathbb{R},$
为条件 $X = x$ 下, $Y$ 的条件概率密度, 简称为条件密度 (conditional density).

4. 随机变量的数字特征

 4.1 数学期望

数学期望定义一离散型

定义 $1.1$ 设 $X$ 有概率分布
$p_{j}=P\left(X=x_{j}\right), j=0,1, \cdots,$
只要级数 $\sum_{j=0}^{\infty}\left|x_{j}\right| p_{j}$ 收敛, 就称
$\mathrm{E}(X)=\sum_{j=0}^{\infty} x_{j} p_{j}$
为 $X$ 或分布 $\left\{p_{j}\right\}$ 的数学期望 (expected value) 或均值 (mean).
要求 $\sum_{j=0}^{\infty}\left|x_{j}\right| p_{j}$ 收敛的原因是要使上式中的级数有确切的意义.
当所有的 $x_{j}$ 非负时, 如果上式中的级数是无穷, 由上式定义的 $\mathrm{E}(X)$ 也有明确的意义, 它表明 $X$ 的平均取值是无穷. 这时也称 $X$ 的数学期望是无穷.
不难看出, 只取有限个值的随机变量的数学期望总是存在的.

数学期望定义一连续型

设 $X$ 是有概率密度 $f (x)$ 的随机变量, 如果下式成立,
$\int_{-\infty}^{\infty}|x| f(x) d x<\infty,$
就称
$\int_{-\infty}^{\infty} x f(x) d x$
为 $X$ 或 $f (x)$ 的数学期望或均值.

由于随机变量的数学期望由随机变量的概率分布唯一决定, 所以也可以对概率分布定义数学期望.

概率分布的数学期望就是以它为概率分布的随机变量的数学期望. 有相同分布的随机变量必有相同的数学期望.

期望的计算

计算公式

$\begin{aligned} E (X) & = \int_{- \infty}^{+ \infty} x f (x) d x, \\ E (g (X)) & = \int_{- \infty}^{+ \infty} g (x) f (x) d x . \\ E (g (X)) & = \sum_{k = 1}^{\infty} g (x_{k}) p_{k} \end{aligned}$ $E (X) E (g (X)) E (g (X)) = \int_{- \infty}^{+ \infty} x f (x) d x, = \int_{- \infty}^{+ \infty} g (x) f (x) d x . = k = 1 \sum \infty g (x_{k}) p_{k}$

数学期望的几个重要性质

设 $C$ 是常数, 则有 $E (C) = C$
设 $\mathrm{X}$ 是随机变量, $\mathrm{C}$ 是常数, 则有 $E (CX) = CE (X)$
设 $\mathrm{X}, \mathrm{Y}$ 是两个随机变量, 则有 $E (X + Y) = E (X) + E (Y)$ ;
设 $X, Y$ 是相互独立的随机变量，则有 $E (X Y) = E (X) E (Y)$

4.2 方差的性质与计算

方差的计算:

$\begin{aligned} D (X) & = E [(X - E (X))^{2}] \\ = E (X^{2}) - (E (X))^{2} . \end{aligned}$ $D (X) = E [(X - E (X))^{2}] = E (X^{2}) - (E (X))^{2} .$

记 $E(X)=\mu$ , 由方差定义式 $D(X)=E\left[(X-\mu)^{2}\right]$ , 可见方差其实是一个期望, 是随机变量函数 $(X-\mu)^{2}$ 的期望. 由随机变量函数期望的求法, 故有
$D(X)=\int_{-\infty}^{+\infty}(x-\mu)^{2} f(x) \mathrm{d} x .$
方差的性质:

$D (C) = 0$ ,
$D (X + C) = D (X)$ .
$D(a X)=a^{2} D(X), D(-X)=D(X)$ .
$\operatorname{Cov}(X, Y)$ .
$X$ 与 $Y$ 不相关 $\Leftrightarrow D(X+Y)=D(X)+D(Y)$ .
$X$ 与 $Y$ 相互独立 $\Longrightarrow D(X+Y)=D(X)+D(Y)$ .
$\pm b Y)=a^{2} D(X)+b^{2} D(Y)$ , 其中 $X$ 与 $Y$ 相互独立.

例题

设随机变量 $X, Y$ 相互独立, 且都服从均值为 0 , 方差为 $\frac{1}{2}$ 的正态分布. 求随机变量 $∣ X - Y ∣$ 的方差,
解令 $Z = X - Y$ . 由题设知, $\sim N(0,1)$ . 对

$\begin{aligned} D (| X - Y |) & = D (| Z |) = E (| Z |^{2}) - [E (| Z |)]^{2} \\ = E (Z^{2}) - [E (| Z |)]^{2} \end{aligned}$ $D (∣ X - Y ∣) = D (∣ Z ∣) = E (∣ Z ∣^{2}) - [E (∣ Z ∣)]^{2} = E (Z^{2}) - [E (∣ Z ∣)]^{2}$
由 $E\left(Z^{2}\right)=D(Z)+[E(Z)]^{2}=1+0=1$ , 且
$\begin{aligned} E (| Z |) & = \frac{1}{\sqrt{2 π}} \int_{- \infty}^{+ \infty} | z | e^{- z^{2} / 2} d z = \frac{2}{\sqrt{2 π}} \int_{0}^{+ \infty} | z | e^{- z^{2} / 2} d z = \frac{2}{\sqrt{2 π}} \int_{0}^{+ \infty} z e^{- z^{2} / 2} d z \\ = - \frac{2}{\sqrt{2 π}} \int_{0}^{+ \infty} d (e^{- z^{2} / 2}) = {\frac{2}{\sqrt{2 π}} e^{- z^{2} / 2} |}_{0}^{+ \infty} \\ = \sqrt{\frac{2}{π}} \end{aligned}$
故 $D(|X-Y|)=E\left(Z^{2}\right)-[E(|Z|)]^{2}=1-\frac{2}{\pi}$ .

4.3 协方差与相关系数

协方差的计算:

$\begin{aligned} Cov (X, Y) & = E [(X - E (X)) (Y - E (Y))] \\ = E (X Y) - E (X) E (Y) . \end{aligned}$ $Cov (X, Y) = E [(X - E (X)) (Y - E (Y))] = E (X Y) - E (X) E (Y) .$

相关系数的计算:

$\begin{aligned} ρ_{X Y} & = \frac{Cov (X, Y)}{\sqrt{D (X)} \sqrt{D (Y)}} \\ = \frac{E [(X - E (X)) (Y - E (Y))]}{\sqrt{D (X)} \sqrt{D (Y)}} . \end{aligned}$ $ρ_{X Y} = \frac{Cov ( X , Y )}{D ( X ) D ( Y )} = \frac{E [( X - E ( X )) ( Y - E ( Y ))]}{D ( X ) D ( Y )} .$
随机变量的相关系数 $=$ 随机变量 “标准化” 后的协方差. 事实上, $X, Y$ 标准化为
$X^{*}=\frac{X-E(X)}{\sqrt{D(X)}}, \quad Y^{*}=\frac{Y-E(Y)}{\sqrt{D(Y)}},$
则
$\rho_{X Y}=\frac{\operatorname{Cov}(X, Y)}{\sqrt{D(X)} \sqrt{D(Y)}}=\operatorname{Cov}\left(X^{*}, Y^{*}\right) .$
相关系数的性质

$|\rho| \leqslant 1$ . 其中
$|\rho|=1 \Longleftrightarrow X$ 与 $Y$ 之间存在线性关系，即存在常数 a， b 使 $P\{Y = a + bX\}=1$ ;
$\rho=0 \Longleftrightarrow X$ 与 $Y$ 之间不存在线性关系, 或称 $X$ 与 $Y$ 不相关.
强调: 不相关是 “不线性相关”的简称!

以下命题是等价的:
$X$ 与 $Y$ 不相关.
$\rho_{X Y}=0$ .
$\operatorname{Cov}(X, Y)=0$ .
$E (X Y) = E (X) E (Y)$ .
$D (X + Y) = D (X) + D (Y)$ .

$X$ 与 $Y$ 独立 $\Longrightarrow X$ 与 $Y$ 不相关. 反之不一定成立.

4.4 切比雪夫不等式

$P\{|X-E(X)| \geqslant \varepsilon\} \leqslant \frac{D(X)}{\varepsilon^{2}},$
或等价地
$P\{|X-E(X)|<\varepsilon\} \geqslant 1-\frac{D(X)}{\varepsilon^{2}} .$

5. 概率极限定理

中心极限定理即言: 大量独立同分布的随机变量之和, 近似服从正态分布

中心极限定理:

(1) 设随机变量 $X_{1}, X_{2}, \cdots, X_{n}$ 独立同分布, $E\left(X_{k}\right)=\mu, D\left(X_{k}\right)=\sigma^{2}, k=1,2 \cdots, n$ . 从而,
$E\left(\sum_{k=1}^{n} X_{k}\right)=n \mu, \quad D\left(\sum_{k=1}^{n} X_{k}\right)=n \sigma^{2} .$
则近似地有
$\sum_{k=1}^{n} X_{k} \sim N\left(n \mu, n \sigma^{2}\right),$
上式一般用于求解和的概率问题.

进一步 “标准化” 得
$\frac{\sum_{k=1}^{n} X_{k}-n \mu}{\sqrt{n} \sigma} \sim N(0,1) .$
等价地,
$\frac{\frac{1}{n} \sum_{k=1}^{n} X_{k}-\mu}{\sigma / \sqrt{n}} \sim N(0,1) .$
记 $\bar{X}=\frac{1}{n} \sum_{k=1}^{n} X_{k}$ , 则
$\frac{\bar{X}-\mu}{\sigma / \sqrt{n}} \sim N(0,1) .$
等价地,
$\bar{X} \sim N\left(\mu, \frac{\sigma^{2}}{n}\right) .$
也可以直接由 $E\left(X_{k}\right)=\mu, D\left(X_{k}\right)=\sigma^{2}$ , 得 $E(\bar{X})=\mu, D(\bar{X})=\frac{\sigma^{2}}{n}$ .
上式一般用于求解平均值的概率问题.

(2) 设 $n_{A}$ 为 $n$ 重伯努利试验中事件 $A$ 出现的次数, 且 $A$ 在每次实验中发生的概率为 $p$ . 则 $n_{A}$ 服从二项分布 $B (n, p)$ , 从而
$E\left(n_{A}\right)=n p, \quad D\left(n_{A}\right)=n p(1-p) .$
当 $n$ 很大时, $n_{A}$ 的 “标准化” 变量 $\frac{n_{A}-E\left(n_{A}\right)}{\left.\sqrt{D\left(n_{A}\right.}\right)}$ 近似服从正态分布, 即
$\frac{n_{A}-n p}{\sqrt{n p(1-p)}} \sim N(0,1) .$

例题

一生产线生产的产品成箱包装, 每箱的重量是随机的. 假设每箱平均重 50 千克, 标准差为 5 千克. 若用最大载重量为 5 吨的汽车承运, 试利用中心极限定理说明每辆车最多可以装多少箱, 才能保障不超载的概率大于 $0.977$ .

解：

设所求箱数为 $n$ , 每箱的重量记为 $X_{1}, X_{2}, \cdots, X_{n}$ . 由题设可把 $X_{1}, X_{2}, \cdots, X_{n}$ 视为独立同分布随机变量. 又
$E\left(X_{i}\right)=50, \quad D\left(X_{i}\right)=5^{2}, \quad(i=1,2, \cdots, n)$
根据中心极限定理, 有 $\sum_{i=1}^{n} X_{i}$ 近似服从正态分布 $\left(n \cdot 50, n \cdot 5^{2}\right)$ .
问题即求 $n$ 使
$P\left\{\sum_{i=1}^{n} X_{i} \leqslant 5000\right\}>0.977 .$
其中

$\begin{aligned} P {\sum_{i = 1}^{n} X_{i} ⩽ 5000} & = P {\frac{\sum_{i = 1}^{n} X_{i} - 50 n}{5 \sqrt{n}} ⩽ \frac{5000 - 50 n}{5 \sqrt{n}}} \\ \approx Φ (\frac{1000 - 10 n}{\sqrt{n}}) \end{aligned}$ $P {i = 1 \sum n X_{i} ⩽ 5000} = P {\frac{\sum _{i = 1}^{n} X _{i} - 50 n}{5 n} ⩽ \frac{5000 - 50 n}{5 n}} \approx Φ (\frac{1000 - 10 n}{n})$
故
$\Phi\left(\frac{1000-10 n}{\sqrt{n}}\right)>0.977=\Phi(2),$
即
$\frac{1000-10 n}{\sqrt{n}}>2,$
从而 $n < 98.0199$ , 即最多可以装 98 箱.

相关阅读:
[如何编译openGauss对应版本的wal2json.so]
代码随想录刷题 Day 22
生成元 rust解法
 POSIX线程与Win32线程
 OpenCV快速入门：窗口交互
 机器学习常见的sampling策略附PyTorch实现
 JS超集对TypeScript的Map对象以及联合类型的深入实战
 RocketMQ部署
 【附源码】计算机毕业设计JAVA人口老龄化常态下的社区老年人管理与服务平台
 新版本Spring Security 2.7 + 用法，直接旧正版粘贴

原文地址：https://blog.csdn.net/weixin_42301220/article/details/126478226

最新文章

攻防演习之三天拿下官网站群
 数据安全治理学习——前期安全规划和安全管理体系建设
 企业安全 | 企业内一次钓鱼演练准备过程
 内网渗透测试 | Kerberos协议及其部分攻击手法
 0day的产生 | 不懂代码的"代码审计"
安装scrcpy-client模块av模块异常，环境问题解决方案
 leetcode hot100【LeetCode 279. 完全平方数】java实现
 OpenWrt下安装Mosquitto
AnatoMask论文汇总
 【AI日记】24.11.01 LangChain、openai api和github copilot

热门文章

十款代码表白小特效一个比一个浪漫赶紧收藏起来吧！！！
奉劝各位学弟学妹们，该打造你的技术影响力了！
五年了，我在 CSDN 的两个一百万。
Java俄罗斯方块，老程序员花了一个周末，连接中学年代！
面试官都震惊，你这网络基础可以啊！
你真的会用百度吗？我不信 — 那些不为人知的搜索引擎语法
 心情不好的时候，用 Python 画棵樱花树送给自己吧
 通宵一晚做出来的一款类似CS的第一人称射击游戏Demo！原来做游戏也不是很难，连憨憨学妹都学会了！
13 万字 C 语言从入门到精通保姆级教程2021 年版
 10行代码集2000张美女图，Python爬虫120例，再上征途

参考资料

1. 随机事件与概率

1.1 古典概型

1.2 加法公式与乘法公式

1.3 全概率公式和 Bayes 公式

2. 随机变量及其概率分布

2.0 密度函数与分布函数

2.1 已知密度函数 f ( x ) f(x) f(x), 求分布函数 F ( x ) F(x) F(x)

2.2 随机变量的函数

2.3 正态分布

2.4 常用的概率分布表

3. 多维随机变量及其概率分布

3.1 边缘分布与边缘密度

3.2 随机变量函数的分布

3.3 条件分布和条件密度

4. 随机变量的数字特征

4.1 数学期望

4.2 方差的性质与计算

4.3 协方差与相关系数

4.4 切比雪夫不等式

5. 概率极限定理

2.1 已知密度函数 $f (x)$ , 求分布函数 $F (x)$