充分统计量，因子分解定理与Rao-Blackwewll定理

充分统计量的一种定义是：数据为 $X^n$ ，如果给定充分统计量的一组取值 $T(X^n=x^n)=t$ ，能够使得数据的分布不依赖于参数 $\theta$ ，则 $T$ 是充分统计量。

粗略的说，如果已经知道 $T(x^n)$ 就可以计算似然函数，则该统计量是充分的。

$X=(X_1, X_2) \sim Bernoulli(p)$ ，充分统计量是 $T=X_1+X_2$ 。原因是给定任意T的取值，都可以知道数据的分布，而不依赖于参数 $p$ 。

$T = 0$ 时，两个数据取0的概率为1，其他为0。 $T = 1$ ，时，两者取1另一个取0的概率各自为0.5，其他情况为0。当 $T = 2$ 时，两者取1的概率为1，其他情况为0。

倘若统计量 $T=X_1$ ，则不是充分统计量。例如当 $T = 0$ 时，只知道 $X_1$ 取1的概率为0，而 $X_2$ 取1的概率是参数 $p$ 。

$T$ 是充分统计量当且仅当存在 $g(t,\theta)$ 和 $h (x)$ 使得: $f(x^n;\theta)=g(t(x^n),\theta)h(x^n)$ .
将此定理应用于上面的例子，首先把似然函数写出来：

\begin{aligned} f (X; θ) & = f (x_{1}; θ) f (x_{2}; θ) \\ = θ^{x_{1} + x_{2}} (1 - θ)^{2 - x_{1} - x_{2}} \end{aligned}

f (X; θ) = f (x_{1}; θ) f (x_{2}; θ) = θ^{x_{1} + x_{2}} (1 - θ)^{2 - x_{1} - x_{2}}

令统计量

T=X_1+X_2

，则成为

f(X;\theta)=\theta^{t}(1-\theta)^{2-t}

此时，

g(t(x^n),\theta)=\theta^{t}(1-\theta)^{2-t}

而

h (x) = 1

。因此，

T

是充分统计量。

这个定理指出，一个估计应该依赖于充分统计量，否则从MSE的角度上可以被改进。

令 $\hat{\theta}$ 为估计， $T$ 为充分统计量。定义估计
$\theta_{new}=E[\hat{\theta}|T]$ 则对任意 $\theta$ ，有 $R(\theta,\theta_n) \le R(\theta, \hat{\theta})$ .

应用于抛两枚硬币的问题，首先假设 $\hat{\theta}=X_1$ ， $E[X_1]=p$ 是一个无偏估计。定义充分统计量 $T=X_1+X_2$ ，则由Rao-Blackwell定理就可以得到：

\begin{aligned} θ_{n} & = E [\hat{θ} | T] = 0 \times P (X = 0 | T = t) + 1 \times P (X = 1 | T = t) \\ = P (X_{1} = 1 | T = t) \\ = \frac{P (X_{1} = 1, T = t)}{P (T = t)} \\ = \frac{P (X_{1} = 1, X_{2} = t - 1)}{P (T = t)} = \frac{P (X_{1} = 1) P (X_{2} = t - 1)}{P (X_{1} + X_{2} = t)} \\ = \frac{p \cdot C_{1}^{t - 1} p^{t - 1} (1 - p)^{1 - (t - 1)}}{C_{2}^{t} p^{t} (1 - p)^{2 - t}} \\ = \frac{C_{1}^{t - 1}}{C_{2}^{t}} = \frac{t}{2} = \frac{X_{1} + X_{2}}{2} \end{aligned}

θ_{n} = E [\hat{θ} ∣ T] = 0 \times P (X = 0∣ T = t) + 1 \times P (X = 1∣ T = t) = P (X_{1} = 1∣ T = t) = \frac{P ( X _{1} = 1 , T = t )}{P ( T = t )} = \frac{P ( X _{1} = 1 , X _{2} = t - 1 )}{P ( T = t )} = \frac{P ( X _{1} = 1 ) P ( X _{2} = t - 1 )}{P ( X _{1} + X _{2} = t )} = \frac{p \cdot C _{1}^{t - 1} p ^{t - 1} ( 1 - p ) ^{1 - (t - 1)}}{C _{2}^{t} p ^{t} ( 1 - p ) ^{2 - t}} = \frac{C _{1}^{t - 1}}{C _{2}^{t}} = \frac{t}{2} = \frac{X _{1} + X _{2}}{2}

得到了一个估计

\theta_n=\frac{X_1+X_2}{2}

，其MSE会比

\hat{\theta}=X_1

更小。

相关阅读:
Android Gradle插件与Gradle的区别
Mongodb实验二——分片集群搭建
SQL sever中的存储过程
【Flutter】vscode快速估计插件 Flutter Intl
【C++ 构造函数和析构函数：对象生命周期的关键】
C# 9.0语法标准 “函数指针” 深度解读！
简单排序算法、二分法以及对数器
python基于PHP+MySQL的个人博客系统毕设
Dynamic Bone ——Unity 3D动态骨骼插件
【MQTT】基于阿里云物联网平台实现两设备间相互订阅及发布消息

原文地址：https://blog.csdn.net/RSstudent/article/details/126768192