[学习笔记] 概率与期望及其应用

[学习笔记] 概率与期望及其应用
前言

这是一篇初学者的学习笔记，可能有些不准确或者遗漏的地方，还请各位指出。

可以通过目录或者 Ctrl + F 寻找所需内容。
点击展开目录
目录
前言
引入 - 蒙提霍尔问题
1. 事件的概念、运算与关系
1.1 基础概念
1.1.1 随机试验
1.1.2 基本事件
1.1.3 样本空间
1.1.4 随机事件
1.1.5 事件发生
1.1.6 必然事件
1.1.7 不可能事件
1.2 事件运算
1.2.1 事件的和（并）
1.2.2 事件的差
1.2.3 事件的积（交）
1.2.4 推广
1.3 事件关系
1.3.1 包含
1.3.2 相等
1.3.3 互斥
1.3.4 对立（互逆）
1.3.5 举例理解
2. 概率
2.1 概率的数学定义
2.2 概率的性质及应用
2.2.1 概率的性质
2.3 条件概率
3. 公式与模型
3.1 全概率公式
3.2 贝叶斯公式
3.3 波利亚瓦罐模型
4. 例题
4.1 绿豆蛙的归宿
4.1.1 题目大意
4.1.2 思路
4.1.3 代码实现
4.2 [NOIP2016 提高组] 换教室
4.2.1 题目大意
4.2.2 思路
4.2.3 代码实现
参考资料
引入 - 蒙提霍尔问题

~~如果不需要可以跳过。~~

你正在参加活动。在你面前有三扇关闭的门，其中一扇门后面是奖品，另外两扇门后面是空的。你希望能获得奖品。

在这个题目背景下，有以下几个问题：

你选定了一扇门后直接打开。

此时获得奖品的概率为 $\frac{1}{3}$ 。

在你选定了一扇门后，主持人随机打开剩下两扇门中的一扇，如果发现是空的，他会问你是否更换选择。你的决定是？

考虑以下情况：
- 你最开始选的门为奖励门（概率为 $\frac{1}{3}$ ），在主持人开了空门（概率为 $\frac{1}{2}$ ）后，选择换门。获得奖品的概率为 $0$ 。
- 你最开始选的门为奖励门（概率为 $\frac{1}{3}$ ），在主持人开了空门（概率为 $\frac{1}{2}$ ）后，选择不换门。获得奖品的概率为 $\frac{1}{3}$ 。
- 你最开始选的门为空门（概率为 $\frac{1}{3}$ ），在主持人开了空门（概率为 $\frac{1}{2}$ ）后，选择换门。获得奖品的概率为 $\frac{1}{3}$ 。
- 你最开始选的门为空门（概率为 $\frac{1}{3}$ ），在主持人开了空门（概率为 $\frac{1}{2}$ ）后，选择不换门。获得奖品的概率为 $0$ 。
- 你最开始选的门为空门（概率为 $\frac{1}{3}$ ），在主持人开了奖励门（概率为 $\frac{1}{2}$ ）后，选择换门。获得奖品的概率为 $0$ 。
- 你最开始选的门为空门（概率为 $\frac{1}{3}$ ），在主持人开了奖励门（概率为 $\frac{1}{2}$ ）后，选择不换门。获得奖品的概率为 $0$ 。
综上，无论换不换门，获得奖品的概率都为 $\frac{1}{3}$ 。

在你选定了一扇门后，主持人打开剩下两扇门中的一扇空门，然后他问你是否更换选择。你的决定是？

考虑以下情况：
- 你最开始选的门为奖励门（概率为 $\frac{1}{3}$ ），在主持人开了空门后，选择换门。获得奖品的概率为 $0$ 。
- 你最开始选的门为奖励门（概率为 $\frac{1}{3}$ ），在主持人开了空门后，选择不换门。获得奖品的概率为 $\frac{1}{3}$ 。
- 你最开始选的门为空门（概率为 $\frac{2}{3}$ ），在主持人开了空门后，选择换门。获得奖品的概率为 $\frac{2}{3}$ 。
- 你最开始选的门为空门（概率为 $\frac{2}{3}$ ），在主持人开了空门后，选择不换门。获得奖品的概率为 $0$ 。
综上，换门获得奖品的概率为 $\frac{2}{3}$ ，不换门获得奖品的概率为 $\frac{1}{3}$ 。

通过以上问题的讨论，你已经初步接触了概率论。下文会继续讲解相关内容。

1. 事件的概念、运算与关系

1.1 基础概念

1.1.1 随机试验

具有以下特点的试验称为随机试验：
- 试验可在相同条件下重复进行。
- 试验可能出现多种结果，且试验前已知所有结果的可能性。
- 无法预测试验出现哪一结果。
通常用 $E$ 来表示随机试验。

举个栗子：
- E1：摇一次骰子，观察点数出现情况。
- E2：抛一次硬币，观察正反面出现情况。
1.1.2 基本事件

随机试验中可能出现的每一个结果，也称样本点。记作 $ω$ 。

举个栗子：
- 前文 E1 有六个基本事件，其中第 $i$ 个基本事件为出现点数为 $i$ 。
- 前文 E2 有两个基本事件，出现正面和出现反面。
1.1.3 样本空间

随机试验中所有基本事件构成一个集合，称为样本空间。记作 $Ω$ 。

举个栗子：
- 前文 E1 的样本空间为 ${1, 2, 3, 4, 5, 6}$ 。
- 前文 E2 的样本空间为 ${正面, 反面}$ 。
1.1.4 随机事件

随机试验中部分基本事件构成一个集合，称为随机事件。随机事件是样本空间的子集。使用大写字母进行表示。

举个栗子：
- 前文 E1 中出现偶数点数的事件可表示为 $A = {2, 4, 6}$ 。
- 前文 E1 中出现奇数点数的事件可表示为 $B = {1, 3, 5}$ 。
1.1.5 事件发生

当某一事件所包含的基本事件中至少有一个发生，那么该事件发生了。

~~好像有点废话~~

1.1.6 必然事件

一定发生的事件。也就是样本空间 $Ω$ 。

1.1.7 不可能事件

一定不发生的事件。记作 $Φ$ 。~~（然而我并不是很清楚这是什么符号，有没有大佬给个解答）~~

1.2 事件运算

1.2.1 事件的和（并）

事件 $A$ 与事件 $B$ 至少有一个发生，这个事件称为事件 $A$ 与事件 $B$ 的和（并），记作 $A + B$ 或 $A \cup B$ 。

举个栗子：

$A = {1, 2}$

$B = {3, 4, 5}$

$A + B = {1, 2, 3, 4, 5}$

1.2.2 事件的差

事件 $A$ 发生而事件 $B$ 不发生，这个事件称为事件 $A$ 与事件 $B$ 的差，记作 $A - B$ 。 $A - B = ∁_{A} (A \cap B)$

举个栗子：

$A = {1, 2, 4, 5}$

$B = {1, 4}$

$A - B = {2, 5}$

1.2.3 事件的积（交）

事件 $A$ 与事件 $B$ 同时发生，这个事件称为事件 $A$ 与事件 $B$ 的积（交），记作 $A B$ 或 $A \cap B$ 。

1.2.4 推广

事件的和与积可推广到多个事件，而差不可以。

为什么差不可以推广？

和与积的推广长这样：

$A + B + C = A \cup B \cup C$

$A B C = A \cap B \cap C$

然而当你计算差时：

$A - B - C = (A - B) - C = ∁_{A} (A \cap B) - C = ∁_{∁_{A} (A \cap B)} (∁_{A} (A \cap B) \cap C)$

它似乎……不大一样呢？

1.3 事件关系

1.3.1 包含

若事件 $A$ 发生，那么事件 $B$ 必然发生。

具体表示 $A \subset B$ 或者 $B \supset A$ 。

注意： $Φ \subset A \subset Ω$ 。

1.3.2 相等

若 $A \subset B$ 且 $B \subset A$ ，那么 $A = B$ 。

1.3.3 互斥

若事件 $A$ 与事件 $B$ 不能同时发生（ $A B = Φ$ ），则称事件 $A$ 与事件 $B$ 互不相容或互斥。 $A$ 与 $B$ 互不相容意味着 $A$ 与 $B$ 不含公共基本事件。

1.3.4 对立（互逆）

若事件 $A$ 与事件 $B$ 发生了有且仅有一个，且 $A \cup B = Ω$ 、 $A \cap B = Φ$ ，则称事件 $A$ 与事件 $B$ 对立（互逆）。

其中事件 $B$ 叫做事件 $A$ 的逆事件，记作 $B = \overset{―}{A}$ 。事件 $A$ 叫做事件 $B$ 的逆事件，记作 $A = \overset{―}{B}$ 。

1.3.5 举例理解

进行三次射击， $A_{i}$ 表示第 $i$ 次击中。

$A_{1} + A_{2}$ 表示前两次射击至少击中一次

$\overset{―}{A_{2}}$ 表示第二次未击中。

$A_{2} - A_{3} = ∁_{A_{2}} (A_{2} \cap A_{3}) = A_{2} \overset{―}{A_{3}}$ 表示第二次击中而第三次未击中。

2. 概率

2.1 概率的数学定义

设 $Ω$ 是随机试验 $E$ 的样本空间，找到一个对应法则，使得 $E$ 的每一个事件 $A$ 都对应一个实数，这记为 $P (A)$ 。

2.2 概率的性质及应用

2.2.1 概率的性质
- $P (Ω) = 1$ 。（正则性）
- $P (\emptyset) = 0$ 。
- $0 \leq P (A) \leq 1$ 。（非负性）
- 若 $A_{1}, A_{2}, A_{3}, . . ., A_{n}, . . .$ 互不相容，则 $P (⋃_{i = 1}^{\infty} A_{i}) = \sum_{i = 1}^{\infty} P (A_{i})$ 。（可列可加性）
- 若 $A B = Φ$ ，则 $P (A \cup B) = P (A) + P (B)$ 。（有限可加性）（可推广到 $n$ 个互不相容的事件）
- $P (A) = 1 - P (\overset{―}{A})$ 。
- $P (B - A) = P (B) - P (A B)$ 。
- $P (A \cup B) = P (A) + P (B) - P (A B)$ 。
~~应该不用证明吧？~~

2.3 条件概率

设 $E$ 为一随机试验， $A$ 和 $B$ 为其中的两个事件且 $P (A) > 0$ ，那么 $\frac{P (A B)}{P (A)}$ 为发生事件 $A$ 的情况下事件 $B$ 发生的条件概率，记作 $P (B | A)$ 。所以 $P (B | A) = \frac{P (A B)}{P (A)}$ 。（公式可变形为 $P (A B) = P (A) \times P (B | A)$ ）

举个栗子：

布袋中有 $3$ 个黑球和 $2$ 个白球，每次随机取出一颗球（不放回），求第两次摸到白球的概率。
- 如果第一次取出了黑球（概率为 $\frac{3}{5}$ ），那么袋子中还剩下 $2$ 个黑球和 $2$ 个白球，第二次摸到白球的概率为 $\frac{1}{2}$ ，该情况的概率为 $\frac{3}{5} \times \frac{1}{2} = \frac{3}{10}$ 。
- 如果第一次取到了白球（概率为 $\frac{2}{5}$ ），那么袋子中还剩下 $3$ 个黑球和 $1$ 个白球，第二次摸到白球的概率为 $\frac{1}{4}$ ，该情况的概率为 $\frac{2}{5} \times \frac{1}{4} = \frac{1}{10}$ 。
第二次摸到白球的总概率就是 $\frac{3}{10} + \frac{1}{10} = \frac{2}{5}$ 。

由条件概率公式可推得 $P (A B) = P (A \cap B) = P (B) P (A | B) = P (A) P (B | A)$ 。

3. 公式与模型

3.1 全概率公式

如果事件 $B_{1}, B_{2}, . . ., B_{n}$ 两两互不相容，且和为全集， $\forall P (B_{i}) > 0$ 。

那么对于任一事件 $A$ 有：。 $P (A) = \sum_{i = 1}^{n} P (A B_{i}) = \sum_{i = 1}^{n} (P (A | B_{i}) \cdot P (B_{i}))$ 。

特别地，对于任意两个随机事件 $A$ 和 $B$ （ $A, B$ 对立），有式子 $P (B) = P (B | A) P (A) + P (B | \overset{―}{A}) P (\overset{―}{A})$ 。

3.2 贝叶斯公式

设 $B 1, B 2, . . .$ 是样本空间 $Ω$ 的一个划分，则对任一事件 $A$ （ $P (A) > 0$ ），有：

$P (B_{i} | A) = \frac{P (B_{i}) P (A | B_{i})}{\sum_{j = 1}^{n} P (B_{j}) P (A | B_{j})}$ 。

上式即为贝叶斯公式， $B_{i}$ 常被视为导致试验结果 $A$ 发生的”原因“。

贝叶斯公式建立在条件概率的基础上，寻找事件发生的原因。（即大事件A已经发生的条件下，分割中的小事件Bi的概率）

3.3 波利亚瓦罐模型

一个瓦罐中有 $n$ 个黑球和 $m$ 个白球。每次取出一个，记录其颜色，再将它和另外 $r$ 个与它同色的球放入瓦罐中，如此循环。

结论1：第 $k$ 次取到黑球的概率为 $\frac{n}{n + m}$ ，取到白球的概率为 $\frac{m}{n + m}$ 。

证明：

当 $k = 1$ 时，取到黑球的概率为 $\frac{n}{n + m}$ ，取到白球的概率为 $\frac{m}{n + m}$ 。

假设第 $k$ 次成立。

考虑取到黑球的概率：

$P (k + 1) = \frac{n}{n + m} \cdot \frac{n + r}{n + m + r} + \frac{m}{n + m} \cdot \frac{n}{n + m + r} = \frac{n (n + m + r)}{(n + m) (n + m + r)} = \frac{n}{n + m}$ 。

取到白球的概率：

$P (k + 1) = \frac{n}{n + m} \cdot \frac{m}{n + m + r} + \frac{m}{n + m} \cdot \frac{m + r}{n + m + r} = \frac{m (n + m + r)}{(n + m) (n + m + r)} = \frac{m}{n + m}$ 。

由数学归纳法得证。

结论2：无论 $a, b (a \neq b)$ 取什么值，第 $a$ 次与第 $b$ 次同时取出黑（白）球的概率始终相等。

证明：

设 $P_{a, b} (n, m)$ 为对应的概率，不难求出 $P_{1, b} = \frac{n}{n + m} \times \frac{n + r}{n + m + r}$ 。

同样考虑数学归纳法。

$P_{a, b} (n, m) = \frac{n}{n + m} \cdot \frac{n + r}{n + m + r} \cdot \frac{n + 2 r}{n + m + 2 r} + \frac{m}{n + m} \cdot \frac{n}{n + m + r} \cdot \frac{n + r}{n + m + 2 r}$
$= \frac{n (n + r) (n + m + 2 r)}{(n + m) (n + m + r) (n + m + 2 r)} = \frac{n}{n + m} \cdot \frac{n + r}{n + m + r} = P_{1, 2} (n, m)$ 。

得证。

4. 例题

两道期望DP题。~~似乎和上文没什么关系？？？~~

4.1 绿豆蛙的归宿

https://www.luogu.com.cn/problem/P4316

4.1.1 题目大意

给一张 $n$ 个点 $m$ 条边的有向图，每条边有边权。现从 $1$ 走到 $n$ ，每次等概率选取一条边走，求路径总长度的期望。

4.1.2 思路

考虑进行期望DP。

设 $f_{i}$ 表示从点 $i$ 出发走到点 $n$ 的期望路径长度，答案即为 $f_{1}$ 。初始状态 $f_{n} = 0$ 。

反向连边建图，在图上跑拓扑进行转移。

具体地讲，每次取出一个入度为零的点 $x$ ，枚举它能到的点 $v$ ，在正常拓扑的同时转移，转移式为 $f_{v} = \frac{f_{x} + w (x, v)}{d e g_{v}}$ 。

4.1.3 代码实现
```
int n, m;
int last[N], cnt;
struct edge {
	int to, next, w;
} e[N << 1];
void addedge(int x, int y, int w) {
	e[++cnt].to = y;
	e[cnt].next = last[x];
	e[cnt].w = w;
	last[x] = cnt;
}
int deg[N], lne[N]; //deg为拓扑所用的入度数, lne为出边数 
queue <int> s;
double f[N];
void topsort() {
	for (int i = 1; i <= n; i++)
		if (deg[i] == 0) s.push(i);
	while (s.size()) {
		int x = s.front(); s.pop();
		for (int i = last[x]; i; i = e[i].next) {
			int v = e[i].to; deg[v]--;
			f[v] += (f[x] + e[i].w) * 1.0 / lne[v];
			if (!deg[v]) s.push(v);
		}
	}
}
int main() {
	n = read(), m = read();
	for (int i = 1; i <= m; i++) {
		int u = read(), v = read(), w = read();
		addedge(v, u, w); deg[u]++, lne[u]++; //反向建边 
	}
	topsort();
	printf("%.2lf", f[1]);
	return 0;
}
```
4.2 [NOIP2016 提高组] 换教室

https://www.luogu.com.cn/problem/P1850

4.2.1 题目大意

一共有 $n$ 个时间节点上安排了课程，对于每个时间节点 $i$ ，两节内容相同的课会占用 $c_{i}$ 和 $d_{i}$ 两间教室。

一般来讲，学生需按时间在 $c_{i}$ 教室完成第 $i$ 节课。但他们也可以通过提交申请尝试更换教室。具体地，申请更换第 $i$ 节课的教室通过的概率为已知实数 $k_{i}$ ，如果申请通过，学生就可以去 $d_{i}$ 教室上课。

牛牛可以提交最多 $m$ 次申请。由于两教室间的距离和拥堵程度不同，牛牛在前往教室时耗费的体力也不同。当第 $i (1 \leq i < n)$ 节课结束后，他会从这间教室沿耗费体力最少的路径前往下个教室。

问申请更换教室后在教室间移动耗费的体力值的总和的期望值最小是多少。

4.2.2 思路

需要知道每两间教室直接的最短路长度时多少。这可以用 Floyed 解决。

然后考虑DP，设 $f_{i, j, 0 / 1}$ 表示前 $i$ 个时间节点换了 $j$ 次教室，第 $i$ 个时间节点换/没换教室，耗费的体力值的总和的期望最小是多少。

怎么转移？

$f_{i, j, 0} = min {f_{i - 1, j, 0} + d i s (c_{i - 1}, c_{i}), f_{i - 1, j, 1} + d i s (d_{i - 1}, c_{i}) \times k_{i - 1} + d i s (c_{i - 1}, c_{i}) \times (1 - k_{i - 1})}$

$f_{i, j, 1} = min {f_{i - 1, j - 1, 0} + d i s (c_{i - 1}, d_{i}) \times k_{i} + d i s (c_{i - 1}, c_{i}) \times (1 - k_{i}),$ $f_{i - 1, j - 1, 1} + d i s (d_{i - 1}, d_{i}) \times k_{i - 1} \times k_{i} + d i s (d_{i - 1}, c_{i}) \times k_{i - 1} \times (1 - k_{i})$ $+ d i s (c_{i - 1}, d_{i}) \times (1 - k_{i - 1}) \times k_{i} + d i s (c_{i - 1}, c_{i}) \times (1 - k_{i - 1}) \times (1 - k_{i})}$

答案即为 ${min}_{i = 0}^{m} m i n (f_{n, i, 0}, f_{n, i, 1})$ 。

4.2.3 代码实现

dp转移太长了，代码很丑，见谅~
```
const int N = 2010, M = 90010;
const double INF = 1e17;
int n, m, cntroom, cntedge, c[N], d[N];
ll dis[N][N];
double f[N][N][2], k[N];
int main() {
	n = read(), m = read(), cntroom = read(), cntedge = read();
	for (int i = 1; i <= cntroom; i++)
		for (int j = i + 1; j <= cntroom; j++)
			dis[i][j] = dis[j][i] = INF;
	for (int i = 1; i <= n; i++) c[i] = read();
	for (int i = 1; i <= n; i++) d[i] = read();
	for (int i = 1; i <= n; i++) scanf("%lf", &k[i]);
	for (int i = 1; i <= cntedge; i++) {
		int u = read(), v = read(), w = read();
		dis[u][v] = dis[v][u] = min(dis[u][v], w * 1ll);
	}
	for (int p = 1; p <= cntroom; p++)
		for (int i = 1; i <= cntroom; i++)	
			for (int j = 1; j <= cntroom; j++)
				dis[i][j] = min(dis[i][j], dis[i][p] + dis[p][j]);
	for (int i = 0; i <= n; i++)
		for (int j = 0; j <= m; j++)
			f[i][j][0] = f[i][j][1] = INF;
	f[1][0][0] = f[1][1][1] = 0;
	for (int i = 2; i <= n; i++) f[i][0][0] = f[i - 1][0][0] + dis[c[i - 1]][c[i]];
	for (int i = 2; i <= n; i++)
		for (int j = 1; j <= min(i, m); j++) {
			f[i][j][0] = min(f[i - 1][j][0] + dis[c[i - 1]][c[i]], f[i - 1][j][1] + dis[d[i - 1]][c[i]] * k[i - 1] + dis[c[i - 1]][c[i]] * (1 - k[i - 1]));
			f[i][j][1] = min(f[i - 1][j - 1][0] + dis[c[i - 1]][d[i]] * k[i] + dis[c[i - 1]][c[i]] * (1 - k[i]), f[i - 1][j - 1][1] + dis[d[i - 1]][d[i]] * k[i - 1] * k[i] + dis[d[i - 1]][c[i]]* k[i - 1] * (1 - k[i]) + dis[c[i - 1]][d[i]] * (1 - k[i - 1]) * k[i] + dis[c[i - 1]][c[i]] * (1 - k[i - 1]) * (1 - k[i]));
		}
	double ans = INF;
	for (int i = 0; i <= m; i++) ans = min(ans, min(f[n][i][0], f[n][i][1]));
	printf("%.2lf\n", ans);
	return 0;
}
```
参考资料

蒙提霍尔问题（又称三门问题、山羊汽车问题）的正解是什么？ - 知乎

第一章, 随机事件 - 帅爆太阳的男人

概率与期望及其应用 - 曹文

全概率公式、贝叶斯公式推导过程 - ohshit
相关阅读:
四大函数式接口（重点，必须掌握）
MySQL为自动编号的字段赋值
 Diffusion-VITS：VITS与Grad-TTS的融合
 Java观察者模式之总有你想不到的知识
 推理性能提升10倍，成本下降一半！第四范式发布大模型推理加速卡、推理框架...
使用apose.pdf批量导出图片
 不会还有人觉得会员营销很难做吧？教你几招速成！
传奇登录器打不开的四种原因
 Unity学习——坐标系
 谁说后端不能画出美丽的动图？让我来给大家拜个年！
原文地址：https://www.cnblogs.com/shiranui/p/16858780.html

前言

引入 - 蒙提霍尔问题

1. 事件的概念、运算与关系

1.1 基础概念

1.1.1 随机试验

1.1.2 基本事件

1.1.3 样本空间

1.1.4 随机事件

1.1.5 事件发生

1.1.6 必然事件

1.1.7 不可能事件

1.2 事件运算

1.2.1 事件的和（并）

1.2.2 事件的差

1.2.3 事件的积（交）

1.2.4 推广

1.3 事件关系

1.3.1 包含

1.3.2 相等

1.3.3 互斥

1.3.4 对立（互逆）

1.3.5 举例理解

2. 概率

2.1 概率的数学定义

2.2 概率的性质及应用

2.2.1 概率的性质

2.3 条件概率

3. 公式与模型

3.1 全概率公式

3.2 贝叶斯公式

3.3 波利亚瓦罐模型

4. 例题

4.1 绿豆蛙的归宿

4.1.1 题目大意

4.1.2 思路

4.1.3 代码实现

4.2 [NOIP2016 提高组] 换教室

4.2.1 题目大意

4.2.2 思路

4.2.3 代码实现

参考资料