【白板推导系列笔记】线性分类-高斯判别分析（Gaussian Discriminant Analysis）-模型定义 - 码农知识堂

【白板推导系列笔记】线性分类-高斯判别分析（Gaussian Discriminant Analysis）-模型定义

$\begin{matrix} {(x_{i}, y_{i})}_{i = 1}^{N}, x_{i} \in R^{p}, y_{i} \in {0, 1} \end{matrix}$ ${(x_{i}, y_{i})}_{i = 1}^{N}, x_{i} \in R^{p}, y_{i} \in {0, 1}$
逻辑回归是直接对 $p (y ∣ x)$ 建模，而高斯判别分析作为概率生成模型，是通过引入类型的先验，通过贝叶斯公式，得到联合分布 $p (x, y) = p (x ∣ y) p (y)$ ，再对联合分布的对数似然得到参数

贝叶斯公式为
$p(y|x)=\frac{p(x|y)p(y)}{p(x)}$

但是由于我们只关心
$\begin{aligned} p (y = 1 | x) = \frac{p (x | y = 1) p (y = 1)}{p (x)} \end{aligned}$ $p (y = 1∣ x) = \frac{p ( x ∣ y = 1 ) p ( y = 1 )}{p ( x )}$ 和 $\begin{aligned} p (y = 0 | x) = \frac{p (x | y = 0) p (y = 0)}{p (x)} \end{aligned}$ 的大小关系，因此不需要关注分母，因为二者是一样的，即
$\begin{aligned} \hat{y} & = \underset{y \in {0, 1}}{a r g m a x} p (y | x) \\ 由于 p (y | x) \propto p (x | y) p (y) \\ = \underset{y}{a r g m a x} p (y) \cdot p (x | y) \end{aligned}$
高斯判别分析我们对数据集作出的假设有，类的先验是二项分布，每一类的似然是高斯分布，即
$\begin{aligned} y & \sim B(1,\phi)\Rightarrow p(y)=\left\{\begin{aligned}&\phi^{y}&y=1\\&(1-\phi)^{1-y}&y=0\end{aligned}$
因此，最大后验
$\begin{aligned} L (μ_{1}, μ_{2}, Σ, ϕ) & = \log \prod_{i = 1}^{N} [p (x_{i} | y_{i}) p (y_{i})] \\ = \sum_{i = 1}^{N} [\log p (x_{i} | y_{i}) + \log p (y_{i})] \\ = \sum_{i = 1}^{N} [\log N (μ_{1}, Σ)^{y_{i}} + \log N (μ_{2}, Σ)^{1 - y_{i}} + \log ϕ^{y_{i}} (1 - ϕ)^{1 - y_{i}}] \end{aligned}$

CSDN话题挑战赛第2期
参赛话题：学习笔记
相关阅读:
力扣--深度优先算法/回溯算法40.组合总和 Ⅱ
合并word中参考文献-（Endnote生成）
微信小程序快速入门【四】
windows使用命令行创建文件echo ＞test.txt(可以是.gp .js .ts..)
VM虚拟机的安装与配置及操作系统的安装
 OpenCV(二十二)：均值滤波、方框滤波和高斯滤波
 微服务系统设计——接口文档管理设计
 VMware-Linux切换桥接模式上网教程（超详细）
上班摸鱼与网络安全
 Flutter中set和get方法
原文地址：https://blog.csdn.net/liu20020918zz/article/details/127134813