古典概型中常用计数一有重复的排列数
古典概型中常用计数一排列数
古典概型中常用计数一组合数
古典概型中常用计数一分组方式数
古典概型中常用计数一可重复分组数
例题
和事件的概率 P ( A ∪ B ) P(A \cup B) P(A∪B) 在不同场合下的求法:
一般形式:
P
(
A
∪
B
)
=
P
(
A
)
+
P
(
B
)
−
P
(
A
B
)
P
(
A
∪
B
∪
C
)
=
P
(
A
)
+
P
(
B
)
+
P
(
C
)
−
P
(
A
B
)
−
P
(
A
C
)
−
P
(
B
C
)
+
P
(
A
B
C
)
.
若 A , B A, B A,B 互不相容: P ( A ∪ B ) = P ( A ) + P ( B ) P(A \cup B)=P(A)+P(B) P(A∪B)=P(A)+P(B).
若
A
,
B
A, B
A,B 相互独立:
P
(
A
∪
B
)
=
1
−
P
(
A
∪
B
‾
)
=
1
−
P
(
A
ˉ
B
ˉ
)
=
1
−
P
(
A
ˉ
)
P
(
B
ˉ
)
积事件的概率 P ( A B ) P(A B) P(AB) 的求法:
全概率公式
P
(
A
)
=
P
(
A
B
1
)
+
P
(
A
B
2
)
+
⋯
+
P
(
A
B
n
)
=
P
(
B
1
)
P
(
A
∣
B
1
)
+
P
(
B
2
)
P
(
A
∣
B
2
)
+
⋯
+
P
(
B
n
)
P
(
A
∣
B
n
)
.
Bayes 公式
P
(
B
i
∣
A
)
=
P
(
B
i
)
P
(
A
∣
B
i
)
∑
j
=
1
n
P
(
B
j
)
P
(
A
∣
B
j
)
,
i
=
1
,
2
,
⋯
,
n
.
P\left(B_{i} \mid A\right)=\frac{P\left(B_{i}\right) P\left(A \mid B_{i}\right)}{\sum_{j=1}^{n} P\left(B_{j}\right) P\left(A \mid B_{j}\right)}, \quad i=1,2, \cdots, n .
P(Bi∣A)=∑j=1nP(Bj)P(A∣Bj)P(Bi)P(A∣Bi),i=1,2,⋯,n.
Bayes 公式本质上是条件概率公式:
P
(
B
i
∣
A
)
=
P
(
A
B
i
)
P
(
A
)
,
P\left(B_{i} \mid A\right)=\frac{P\left(A B_{i}\right)}{P(A)},
P(Bi∣A)=P(A)P(ABi),
只是其分子、分母进一步分别使用了乘法公式和全概率公式.
例题:
发报台分别以概率0.6和0.4发出信号“1”和“0”。由于通讯系统受到干扰,当发出信号“1”时,收报台未必收到信号“1”,而是分别以概率0.8和0.2收到信号“1”和“0”;同时,当发出信号“0”时,收报台分别以概率0.9和0.1收到信号“0”和“1”。求(1)收报台收到信号“1”的概率;(2)当收报台收到信号“1”时,发报台确是发出信号“1”的概率。
正确答案:
设A1=“发出信号1”,A0=“发出信号0”,A=“收到信号1”
(1)由全概率公式,有P(A)=P(A|A1)P(A1)+P(A|A0)P(A0)=0.8x0.6+0.1x0.4=0.52
(2)由贝叶斯公式,有P(A1|A)=P(A|A1)P(A1)/P(A)=0.8x0.6/0.52=12/13
概率密度函数定义
分布密度性质
设
f
(
x
)
f(x)
f(x) 是
X
X
X 的概率密度, 则
f
(
x
)
f(x)
f(x) 有如下的基本性质.
(a)
∫
−
∞
∞
f
(
x
)
d
x
=
1
\int_{-\infty}^{\infty} f(x) d x=1
∫−∞∞f(x)dx=1,
(b)
P
(
X
=
a
)
=
0
P(X=a)=0
P(X=a)=0. 于是
P
(
a
<
X
≤
b
)
=
P
(
a
≤
X
≤
b
)
P(a
证明: (a) 由
∫
−
∞
∞
f
(
x
)
d
x
=
P
(
−
∞
<
X
≤
∞
)
=
1
\int_{-\infty}^{\infty} f(x) d x=P(-\infty
可得。
(b)
Pr
(
X
=
a
)
≤
Pr
(
X
∈
(
a
−
ε
,
a
]
)
=
∫
a
−
ε
a
f
(
x
)
d
x
→
0
,
ε
→
0.
\operatorname{Pr}(X=a) \leq \operatorname{Pr}(X \in(a-\varepsilon, a])=\int_{a-\varepsilon}^{a} f(x) d x \rightarrow 0, \quad \varepsilon \rightarrow 0 .
Pr(X=a)≤Pr(X∈(a−ε,a])=∫a−εaf(x)dx→0,ε→0.
概率分布函数定义
离散型随机变量的分布函数
连续型随机变量的分布函数
分布函数性质
证明
密度函数 f ( x ) f(x) f(x) 一般是分段函数. 由 f ( x ) f(x) f(x) 求 F ( x ) F(x) F(x), 本质上是分段函数求积分的问题!
典型例题:
设随机变量
X
X
X 具有概率密度
f
(
x
)
=
{
k
x
,
0
⩽
x
<
3
,
2
−
x
2
,
3
⩽
x
⩽
4
,
0
,
其它.
f(x)=
(1) 确定常数
k
k
k; (2) 求
X
X
X 的分布函数
F
(
x
)
F(x)
F(x); (3) 求
P
{
1
<
X
⩽
3.5
}
P\{1
解
(1) 由
∫
−
∞
+
∞
f
(
x
)
d
x
=
1
\int_{-\infty}^{+\infty} f(x) \mathrm{d} x=1
∫−∞+∞f(x)dx=1, 得
∫
0
3
k
x
d
x
+
∫
3
4
(
2
−
x
2
)
d
x
=
1
,
\int_{0}^{3} k x \mathrm{~d} x+\int_{3}^{4}\left(2-\frac{x}{2}\right) \mathrm{d} x=1,
∫03kx dx+∫34(2−2x)dx=1,
解得
k
=
1
6
k=\frac{1}{6}
k=61.
(2) 对 F ( x ) = ∫ − ∞ x f ( t ) d t F(x)=\int_{-\infty}^{x} f(t) \mathrm{d} t F(x)=∫−∞xf(t)dt,
(3)
P
{
1
<
x
⩽
3.5
}
=
F
(
3.5
)
−
F
(
1
)
=
41
/
48
P\{1
已知连续型随机变量 X X X 的概率密度 f X ( x ) f_{X}(x) fX(x), 求随机变量 Y = g ( X ) Y=g(X) Y=g(X) 的概率密度 f Y ( y ) f_{Y}(y) fY(y), 两种方法:
典型例题:
设随机变量
X
X
X 具有概率密度
f
X
(
x
)
=
{
x
8
,
0
<
x
<
4
,
0
,
其他.
f_{X}(x)=
求
Y
=
2
X
+
8
Y=2 X+8
Y=2X+8 的概率密度
f
Y
(
y
)
f_{Y}(y)
fY(y).
解 先求
Y
Y
Y 的分布函数. (请自已注明下述各个步骤的理由.)
F
Y
(
y
)
=
P
{
Y
⩽
y
}
=
P
{
2
X
+
8
⩽
y
}
=
P
{
X
⩽
y
−
8
2
}
=
∫
−
∞
y
−
8
2
f
X
(
x
)
d
x
注意到积分上限函数求导法则
(
∫
−
∞
φ
(
x
)
f
(
x
)
d
x
)
′
=
f
(
φ
(
x
)
)
φ
′
(
x
)
\left(\int_{-\infty}^{\varphi(x)} f(x) \mathrm{d} x\right)^{\prime}=f(\varphi(x)) \varphi^{\prime}(x)
(∫−∞φ(x)f(x)dx)′=f(φ(x))φ′(x), 上式两端关于
y
y
y 求导, 得
f
Y
(
y
)
=
f
X
(
y
−
8
2
)
⋅
(
y
−
8
2
)
y
′
=
1
2
f
X
(
y
−
8
2
)
=
{
1
2
⋅
y
−
8
2
,
0
<
y
−
8
2
<
4
,
0
,
其他.
=
{
y
−
8
32
,
8
<
y
<
16
,
0
,
其他.
上述方法体现为下面的一般结论. 称为单调函数公式法:
边缘分布
边缘密度
联合分布与联合密度
独立性的判断, 即看下列式子是否成立:
联合
=
边缘
×
边缘
.
联合 = 边缘 \times 边缘.
联合=边缘×边缘.
联合概率计算的例子

例题
设二维随机变量
(
X
,
Y
)
(X, Y)
(X,Y) 的概率密度为
f
(
x
,
y
)
=
{
1
,
0
<
x
<
1
,
0
<
y
<
2
x
,
0
,
其他.
f(x, y)=
求:
(I)
(
X
,
Y
)
(X, Y)
(X,Y) 的边缘概率密度
f
X
(
x
)
,
f
Y
(
y
)
f_{X}(x), f_{Y}(y)
fX(x),fY(y);
(II)
Z
=
2
X
−
Y
Z=2 X-Y
Z=2X−Y 的概率密度
f
Z
(
z
)
f_{Z}(z)
fZ(z).
解
(I) 注意到
f
(
x
,
y
)
f(x, y)
f(x,y) 在
X
X
X-型区域
{
0
<
y
<
2
x
,
0
<
x
<
1
\left\{
f
X
(
x
)
=
∫
−
∞
+
∞
f
(
x
,
y
)
d
y
=
{
∫
0
2
x
d
y
,
0
<
x
<
1
,
0
,
其他.
=
{
2
x
,
0
<
x
<
1
,
0
,
其他.
f
Y
(
y
)
=
∫
−
∞
+
∞
f
(
x
,
y
)
d
x
=
{
∫
y
2
1
d
x
,
0
<
y
<
2
,
0
,
其他.
=
{
1
−
y
2
,
0
<
y
<
2
,
0
,
其他.
(II) 用积分转化法. 此时
g
(
x
,
y
)
=
2
x
−
y
g(x, y)=2 x-y
g(x,y)=2x−y. 对任何有界连续函数
h
(
z
)
h(z)
h(z),
∫
−
∞
+
∞
∫
−
∞
+
∞
h
[
g
(
x
,
y
)
]
f
(
x
,
y
)
d
x
d
y
=
∫
0
1
(
∫
0
2
x
h
(
2
x
−
y
)
⋅
1
d
y
)
d
x
=
∫
0
1
(
∫
2
x
0
h
(
z
)
(
−
1
)
d
z
)
d
x
(
换元
z
=
2
x
−
y
)
=
∫
0
1
(
∫
0
2
x
h
(
z
)
d
z
)
d
x
=
∫
0
2
(
h
(
z
)
∫
z
2
1
d
x
)
d
z
(交换积分次序)
=
∫
0
2
h
(
z
)
(
1
−
z
2
)
d
z
,
得
Z
Z
Z 的概率密度为
f
Z
(
z
)
=
{
1
−
z
2
,
0
<
z
<
2
,
0
,
其他.
f_{Z}(z)=
条件分布
条件密度
数学期望定义一离散型
数学期望定义一连续型
设
X
X
X 是有概率密度
f
(
x
)
f(x)
f(x) 的随机变量, 如果下式成立,
∫
−
∞
∞
∣
x
∣
f
(
x
)
d
x
<
∞
,
\int_{-\infty}^{\infty}|x| f(x) d x<\infty,
∫−∞∞∣x∣f(x)dx<∞,
就称
∫
−
∞
∞
x
f
(
x
)
d
x
\int_{-\infty}^{\infty} x f(x) d x
∫−∞∞xf(x)dx
为
X
X
X 或
f
(
x
)
f(x)
f(x) 的数学期望或均值.
由于随机变量的数学期望由随机变量的概率分布唯一决定, 所以也可 以对概率分布定义数学期望.
概率分布的数学期望就是以它为概率分布的随机变量的数学期望. 有 相同分布的随机变量必有相同的数学期望.
期望的计算
计算公式
E
(
X
)
=
∫
−
∞
+
∞
x
f
(
x
)
d
x
,
E
(
g
(
X
)
)
=
∫
−
∞
+
∞
g
(
x
)
f
(
x
)
d
x
.
E
(
g
(
X
)
)
=
∑
k
=
1
∞
g
(
x
k
)
p
k
数学期望的几个重要性质
方差的计算:
D
(
X
)
=
E
[
(
X
−
E
(
X
)
)
2
]
=
E
(
X
2
)
−
(
E
(
X
)
)
2
.
记
E
(
X
)
=
μ
E(X)=\mu
E(X)=μ, 由方差定义式
D
(
X
)
=
E
[
(
X
−
μ
)
2
]
D(X)=E\left[(X-\mu)^{2}\right]
D(X)=E[(X−μ)2], 可见方差其实是一个期望, 是随机变量函 数
(
X
−
μ
)
2
(X-\mu)^{2}
(X−μ)2 的期望. 由随机变量函数期望的求法, 故有
D
(
X
)
=
∫
−
∞
+
∞
(
x
−
μ
)
2
f
(
x
)
d
x
.
D(X)=\int_{-\infty}^{+\infty}(x-\mu)^{2} f(x) \mathrm{d} x .
D(X)=∫−∞+∞(x−μ)2f(x)dx.
方差的性质:
例题
设随机变量
X
,
Y
X, Y
X,Y 相互独立, 且都服从均值为 0 , 方差为
1
2
\frac{1}{2}
21 的正态分布. 求随机变量
∣
X
−
Y
∣
|X-Y|
∣X−Y∣ 的方 差,
解 令
Z
=
X
−
Y
Z=X-Y
Z=X−Y. 由题设知,
Z
∼
N
(
0
,
1
)
Z \sim N(0,1)
Z∼N(0,1). 对
D
(
∣
X
−
Y
∣
)
=
D
(
∣
Z
∣
)
=
E
(
∣
Z
∣
2
)
−
[
E
(
∣
Z
∣
)
]
2
=
E
(
Z
2
)
−
[
E
(
∣
Z
∣
)
]
2
由
E
(
Z
2
)
=
D
(
Z
)
+
[
E
(
Z
)
]
2
=
1
+
0
=
1
E\left(Z^{2}\right)=D(Z)+[E(Z)]^{2}=1+0=1
E(Z2)=D(Z)+[E(Z)]2=1+0=1, 且
E
(
∣
Z
∣
)
=
1
2
π
∫
−
∞
+
∞
∣
z
∣
e
−
z
2
/
2
d
z
=
2
2
π
∫
0
+
∞
∣
z
∣
e
−
z
2
/
2
d
z
=
2
2
π
∫
0
+
∞
z
e
−
z
2
/
2
d
z
=
−
2
2
π
∫
0
+
∞
d
(
e
−
z
2
/
2
)
=
2
2
π
e
−
z
2
/
2
∣
0
+
∞
=
2
π
故
D
(
∣
X
−
Y
∣
)
=
E
(
Z
2
)
−
[
E
(
∣
Z
∣
)
]
2
=
1
−
2
π
D(|X-Y|)=E\left(Z^{2}\right)-[E(|Z|)]^{2}=1-\frac{2}{\pi}
D(∣X−Y∣)=E(Z2)−[E(∣Z∣)]2=1−π2.
协方差的计算:
Cov
(
X
,
Y
)
=
E
[
(
X
−
E
(
X
)
)
(
Y
−
E
(
Y
)
)
]
=
E
(
X
Y
)
−
E
(
X
)
E
(
Y
)
.
相关系数的计算:
ρ
X
Y
=
Cov
(
X
,
Y
)
D
(
X
)
D
(
Y
)
=
E
[
(
X
−
E
(
X
)
)
(
Y
−
E
(
Y
)
)
]
D
(
X
)
D
(
Y
)
.
随机变量的相关系数
=
=
= 随机变量 “标准化” 后的协方差. 事实上,
X
,
Y
X, Y
X,Y 标准化为
X
∗
=
X
−
E
(
X
)
D
(
X
)
,
Y
∗
=
Y
−
E
(
Y
)
D
(
Y
)
,
X^{*}=\frac{X-E(X)}{\sqrt{D(X)}}, \quad Y^{*}=\frac{Y-E(Y)}{\sqrt{D(Y)}},
X∗=D(X)X−E(X),Y∗=D(Y)Y−E(Y),
则
ρ
X
Y
=
Cov
(
X
,
Y
)
D
(
X
)
D
(
Y
)
=
Cov
(
X
∗
,
Y
∗
)
.
\rho_{X Y}=\frac{\operatorname{Cov}(X, Y)}{\sqrt{D(X)} \sqrt{D(Y)}}=\operatorname{Cov}\left(X^{*}, Y^{*}\right) .
ρXY=D(X)D(Y)Cov(X,Y)=Cov(X∗,Y∗).
相关系数的性质
P
{
∣
X
−
E
(
X
)
∣
⩾
ε
}
⩽
D
(
X
)
ε
2
,
P\{|X-E(X)| \geqslant \varepsilon\} \leqslant \frac{D(X)}{\varepsilon^{2}},
P{∣X−E(X)∣⩾ε}⩽ε2D(X),
或等价地
P
{
∣
X
−
E
(
X
)
∣
<
ε
}
⩾
1
−
D
(
X
)
ε
2
.
P\{|X-E(X)|<\varepsilon\} \geqslant 1-\frac{D(X)}{\varepsilon^{2}} .
P{∣X−E(X)∣<ε}⩾1−ε2D(X).
中心极限定理即言: 大量独立同分布的随机变量之和, 近似服从正态分布
中心极限定理:
(1) 设随机变量
X
1
,
X
2
,
⋯
,
X
n
X_{1}, X_{2}, \cdots, X_{n}
X1,X2,⋯,Xn 独立同分布,
E
(
X
k
)
=
μ
,
D
(
X
k
)
=
σ
2
,
k
=
1
,
2
⋯
,
n
E\left(X_{k}\right)=\mu, D\left(X_{k}\right)=\sigma^{2}, k=1,2 \cdots, n
E(Xk)=μ,D(Xk)=σ2,k=1,2⋯,n. 从而,
E
(
∑
k
=
1
n
X
k
)
=
n
μ
,
D
(
∑
k
=
1
n
X
k
)
=
n
σ
2
.
E\left(\sum_{k=1}^{n} X_{k}\right)=n \mu, \quad D\left(\sum_{k=1}^{n} X_{k}\right)=n \sigma^{2} .
E(k=1∑nXk)=nμ,D(k=1∑nXk)=nσ2.
则近似地有
∑
k
=
1
n
X
k
∼
N
(
n
μ
,
n
σ
2
)
,
\sum_{k=1}^{n} X_{k} \sim N\left(n \mu, n \sigma^{2}\right),
k=1∑nXk∼N(nμ,nσ2),
上式一般用于求解和的概率问题.
进一步 “标准化” 得
∑
k
=
1
n
X
k
−
n
μ
n
σ
∼
N
(
0
,
1
)
.
\frac{\sum_{k=1}^{n} X_{k}-n \mu}{\sqrt{n} \sigma} \sim N(0,1) .
nσ∑k=1nXk−nμ∼N(0,1).
等价地,
1
n
∑
k
=
1
n
X
k
−
μ
σ
/
n
∼
N
(
0
,
1
)
.
\frac{\frac{1}{n} \sum_{k=1}^{n} X_{k}-\mu}{\sigma / \sqrt{n}} \sim N(0,1) .
σ/nn1∑k=1nXk−μ∼N(0,1).
记
X
ˉ
=
1
n
∑
k
=
1
n
X
k
\bar{X}=\frac{1}{n} \sum_{k=1}^{n} X_{k}
Xˉ=n1∑k=1nXk, 则
X
ˉ
−
μ
σ
/
n
∼
N
(
0
,
1
)
.
\frac{\bar{X}-\mu}{\sigma / \sqrt{n}} \sim N(0,1) .
σ/nXˉ−μ∼N(0,1).
等价地,
X
ˉ
∼
N
(
μ
,
σ
2
n
)
.
\bar{X} \sim N\left(\mu, \frac{\sigma^{2}}{n}\right) .
Xˉ∼N(μ,nσ2).
也可以直接由
E
(
X
k
)
=
μ
,
D
(
X
k
)
=
σ
2
E\left(X_{k}\right)=\mu, D\left(X_{k}\right)=\sigma^{2}
E(Xk)=μ,D(Xk)=σ2, 得
E
(
X
ˉ
)
=
μ
,
D
(
X
ˉ
)
=
σ
2
n
E(\bar{X})=\mu, D(\bar{X})=\frac{\sigma^{2}}{n}
E(Xˉ)=μ,D(Xˉ)=nσ2.
上式一般用于求解平均值的概率问题.
(2) 设
n
A
n_{A}
nA 为
n
n
n 重伯努利试验中事件
A
A
A 出现的次数, 且
A
A
A 在每次实验中发生的概率为
p
p
p. 则
n
A
n_{A}
nA 服从 二项分布
B
(
n
,
p
)
B(n, p)
B(n,p), 从而
E
(
n
A
)
=
n
p
,
D
(
n
A
)
=
n
p
(
1
−
p
)
.
E\left(n_{A}\right)=n p, \quad D\left(n_{A}\right)=n p(1-p) .
E(nA)=np,D(nA)=np(1−p).
当
n
n
n 很大时,
n
A
n_{A}
nA 的 “标准化” 变量
n
A
−
E
(
n
A
)
D
(
n
A
)
\frac{n_{A}-E\left(n_{A}\right)}{\left.\sqrt{D\left(n_{A}\right.}\right)}
D(nA)nA−E(nA) 近似服从正态分布, 即
n
A
−
n
p
n
p
(
1
−
p
)
∼
N
(
0
,
1
)
.
\frac{n_{A}-n p}{\sqrt{n p(1-p)}} \sim N(0,1) .
np(1−p)nA−np∼N(0,1).
例题
一生产线生产的产品成箱包装, 每箱的重量是随机的. 假设每箱平均重 50 千克, 标准差为 5 千克. 若用最大载重量为 5 吨的汽车承运, 试利用中心极限定理说明每辆车最多可以装多少箱, 才能保障不超 载的概率大于 0.977 0.977 0.977.
解 :
设所求箱数为
n
n
n, 每箱的重量记为
X
1
,
X
2
,
⋯
,
X
n
X_{1}, X_{2}, \cdots, X_{n}
X1,X2,⋯,Xn. 由题设可把
X
1
,
X
2
,
⋯
,
X
n
X_{1}, X_{2}, \cdots, X_{n}
X1,X2,⋯,Xn 视为独立同分布 随机变量. 又
E
(
X
i
)
=
50
,
D
(
X
i
)
=
5
2
,
(
i
=
1
,
2
,
⋯
,
n
)
E\left(X_{i}\right)=50, \quad D\left(X_{i}\right)=5^{2}, \quad(i=1,2, \cdots, n)
E(Xi)=50,D(Xi)=52,(i=1,2,⋯,n)
根据中心极限定理, 有
∑
i
=
1
n
X
i
\sum_{i=1}^{n} X_{i}
∑i=1nXi 近似服从正态分布
(
n
⋅
50
,
n
⋅
5
2
)
\left(n \cdot 50, n \cdot 5^{2}\right)
(n⋅50,n⋅52).
问题即求
n
n
n 使
P
{
∑
i
=
1
n
X
i
⩽
5000
}
>
0.977.
P\left\{\sum_{i=1}^{n} X_{i} \leqslant 5000\right\}>0.977 .
P{i=1∑nXi⩽5000}>0.977.
其中
P
{
∑
i
=
1
n
X
i
⩽
5000
}
=
P
{
∑
i
=
1
n
X
i
−
50
n
5
n
⩽
5000
−
50
n
5
n
}
≈
Φ
(
1000
−
10
n
n
)
故
Φ
(
1000
−
10
n
n
)
>
0.977
=
Φ
(
2
)
,
\Phi\left(\frac{1000-10 n}{\sqrt{n}}\right)>0.977=\Phi(2),
Φ(n1000−10n)>0.977=Φ(2),
即
1000
−
10
n
n
>
2
,
\frac{1000-10 n}{\sqrt{n}}>2,
n1000−10n>2,
从而
n
<
98.0199
n<98.0199
n<98.0199, 即最多可以装 98 箱.