• 4.1-支持向量机



    上一章的二分类问题

    • 由于原来右图中黄色的loss函数是无法做梯度下降的,因此我们对它做一个近似(Approximation),用 l l l 来取代 δ δ δ ,此时的 l l l 可以采用很多不同的函数,比如:方差,Sigmoid+方差,Sigmoid+交叉熵(Cross entropy),铰链损失(Hinge loss)

    image-20220809200039487image-20220809214242255y

    image-20220809215112431image-20220809215140255

    • 当数据中有离群点(Outlier)时,铰链损失(Hinge loss)往往要比交叉熵(Cross entropy)表现得更好

    image-20220809215208210image-20220809215226059

    一、铰链损失(Hinge loss)

    • 根据下图的推导过程,SVM的loss函数可以通过梯度下降来求解,最后并将SVM转换成了教科书里常见的表达形式。

    image-20220809195904047image-20220809220856142

    image-20220809220953343image-20220809221126389

    二、核方法(Kernel Method)

    • 对偶表示(Dual Representation):在SVM中, α n ∗ \alpha_n^* αn可能是稀疏的,意味着存在一些 α n ∗ = 0 \alpha_n^*=0 αn=0的xn,而那些 α n ∗ ≠ 0 \alpha_n^*\neq 0 αn=0的xn就是支持向量(support vector)。这些不是0的点最终决定着我们整个模型的好坏,这也是为什么数据中的一些离群点难以对SVM造成影响的原因。
    • 核函数(Kernel Fountion):右图中 K ( x n , x ) K(x^n,x) K(xn,x)就是核函数,也就是做 x n 和 x x^n和x xnx的内积(inner product)

    image-20220810084957771

    • 核方法(Kernel Trick):当我们的loss函数可以写成左图蓝线那样时,我们就只需要计算 K ( x n ′ , x n ) K(x^{n'},x^n) K(xn,xn),而并不需要知道向量x的具体值。这就是核方法带来的好处,他不仅可以应用在SVM上,还可以应用在线性回归和逻辑回归上。
    • 在右图的推导中我们可以看到x与z做特征变换后再内积是十分复杂的,当我们用核方法后就不需要这么做,直接对x,z进行内积后平方即可。

    image-20220810090525242image-20220810090550438

    image-20220810091605143

    2.1 径向基函数核(Radial Basis Function Kernel)

    • 当x与z越像时,其Kernel值就越大。如果x=z,值为1;x与z完全不一样时,值为0。
    • 根据下图的公式推导很容易看出来RBF Kernel是在无穷多维的平面上去做事情,因此模型的复杂度会非常高,这样是非常容易过拟合的。
    image-20220810100626799

    2.2 Sigmoid Kernel

    • 左图中做Sigmoid Kernel时,只有一个隐藏层网络,并且每一个神经元的权重就是一笔数据,神经元的个数就是支持向量的数目。
    • 右图中解释了如何直接设计一个核函数K(x,z)来代替Φ(x)和Φ(z),以及通过Mercer’s theory来检验这个核函数是否符合要求。

    image-20220810100710674image-20220810100822150

    三、支持向量机相关方法(SVM related methods)

    • SVR(支持向量回归):当预测值和真实值的差距在某一个范围内时,loss=0

    • Ranking SVM:当要考虑的东西是一个排序的list时

    • One-class SVM:他希望属于positive的example都是同一个类别,negative的example就散布在其他地方

    • 下图是SVM和深度学习两者之间的相似之处

    image-20220810102900573
  • 相关阅读:
    go反射特性实践——获取结构体标签的值、获取结构体属性信息、获取和修改结构体属性值
    [leetcode hot150]第二百三十六题,二叉树的最近公共祖先
    基于Python实现的英文文本信息检索系统
    Android 11 IP白名单功能
    操作系统(2.8)--线程的实现
    基于consul的服务注册与消费案例
    cordic IP核中,sin and cos的使用
    4405. 统计子矩阵
    每日五题-202112
    【postgres】docker desktop全部署后端MVC + postgres + Adminer可视化数据库
  • 原文地址:https://blog.csdn.net/weixin_46227276/article/details/126261504