• 一、基础知识(3)-共轭函数、次梯度


    一、共轭函数

    1.1 共轭函数的定义和例子

    1. 共轭函数: f ∗ ( y ) = s u p x ∈ d o m f { y T x − f ( x ) } f^*(y)=\underset{x\in dom f}{sup}\{y^Tx-f(x)\} f(y)=xdomfsup{yTxf(x)}
      • 几何意义: x y xy xy f ( x ) f(x) f(x)之间差值的最大值。
        在这里插入图片描述
    2. Fenchel 不等式: f ( x ) + f ∗ ( y ) ⩾ x T y f(x)+f^*(y)\geqslant x^Ty f(x)+f(y)xTy

    1.2 二次共轭函数

    1. 二次共轭函数: f ∗ ∗ ( y ) = s u p x ∈ d o m f ∗ { x T y − f ∗ ( x ) } f^{**}(y)=\underset{x\in dom f*}{sup}\{x^Ty-f^*(x)\} f(y)=xdomfsup{xTyf(x)}

    二、次梯度

    2.1 次梯度的定义

    1. 次梯度:设 f f f为适当凸函数, x x x为定义域 d o m f domf domf中的一个点,若向量 g ∈ R n g\in \R^n gRn满足, f ( y ) ⩾ f ( x ) + g T ( y − x ) , ∀ y ∈ d o m f f(y) \geqslant f(x)+g^T(y-x),\forall y\in domf f(y)f(x)+gT(yx),ydomf,则称 g g g为函数 f f f在点 x x x处的一个次梯度。
    2. 次微分: ∂ f ( x ) = { g ∣ g ∈ R n , f ( y ) ⩾ f ( x ) + g T ( y − x ) , ∀ y ∈ d o m f } \partial f(x)=\{g|g\in \R^n,f(y)\geqslant f(x) + g^T(y-x),\forall y \in domf\} f(x)={ggRn,f(y)f(x)+gT(yx),ydomf}
    3. 形式化理解:对于 f ( x ) = ∣ x ∣ f(x)=|x| f(x)=x,在 x = 0 x=0 x=0的点,无导数,所以可以用次梯度。
      在这里插入图片描述
    4. 次微分: ∂ f ( x ) \partial f(x) f(x)为在 [ a , b ] [a,b] [a,b]区间内的次梯度

    2.2 次梯度的性质

    1. 次梯度的单调性: f : R n → R f:\R^n \rightarrow \R f:RnR为凸函数, x , y ∈ d o m f x,y\in dom f x,ydomf,则 μ ∈ ∂ f ( x ) , v ∈ ∂ f ( y ) \mu\in \partial f(x),v\in \partial f(y) μf(x),vf(y)
    2. 待补…

    2.3 凸函数的方向导数

    1. f f f为适当函数,给定点 x 0 x_0 x0以及方向 d ∈ R n d\in \R^n dRn,方向导数定义为: l i m ϕ ( t ) t ↓ 0 = l i m t ↓ 0 f ( x 0 + t d ) − f ( x 0 ) t \underset{t\downarrow 0}{lim\phi(t)}=\underset{t\downarrow 0}{lim}\frac{f(x_0+td)-f(x_0)}{t} t0limϕ(t)=t0limtf(x0+td)f(x0)
    2. 方向导数定义: ∂ f ( x 0 ; d ) = i n f t > 0 f ( x 0 + t d ) − f ( x 0 ) t \partial f(x_0;d)=\underset{t>0}{inf}\frac{f(x_0+td)-f(x_0)}{t} f(x0;d)=t>0inftf(x0+td)f(x0)

    2.4 次梯度的计算规则

    1. 基本规则

    1. 可微凸函数: f f f为凸函数,若 f f f在点 x x x处可微,则 ∂ f ( x ) = { ∇ f ( x ) } \partial f(x)=\{\nabla f(x)\} f(x)={f(x)}
    2. 凸函数的非负线性组合: f 1 , f 2 f_1,f_2 f1,f2为凸函数,且满足 i n t d o m f 1 ∩ d o m f 2 ≠ ∅ , x ∈ d o m f 1 ∩ d o m f 2 int domf_1\cap domf_2 \neq \varnothing,x\in domf_1\cap domf_2 intdomf1domf2=,xdomf1domf2,若 f ( x ) = a 1 f 1 ( x ) + a 2 f 2 ( x ) , a 1 , a 2 ⩾ 0 f(x)=a_1f_1(x)+a_2f_2(x),a_1,a_2\geqslant 0 f(x)=a1f1(x)+a2f2(x),a1,a20,则次微分为 ∂ f ( x ) = a 1 ∂ f 1 ( x ) + a 2 ∂ f 2 ( x ) \partial f(x)=a_1\partial f_1(x)+a_2\partial f_2(x) f(x)=a1f1(x)+a2f2(x)
    3. 线性变量替换: h h h为适当凸函数,且函数 f f f满足 f ( x ) = h ( A x + b ) , ∀ x ∈ R m f(x)=h(Ax+b),\forall x\in \R^m f(x)=h(Ax+b),xRm,其中 A ∈ R n × m , b ∈ R n A\in \R^{n×m},b\in R^n ARn×m,bRn。若存在 x # ∈ R m x^{\#}\in \R^m x#Rm,使得 A x # + b ∈ i n t d o m h Ax^{\#}+b\in int domh Ax#+bintdomh,则 ∂ f ( x ) = A T ∂ h ( A x + b ) , ∀ x ∈ i n t d o m f \partial f(x)=A^T\partial h(Ax+b),\forall x\in int dom f f(x)=ATh(Ax+b),xintdomf
      待补…
  • 相关阅读:
    在使用SpringBoot时遇到的异常总结(持续更新...)
    UI高度自适应的修改方案
    【文件终结者 Objective-C语言】
    效果最大化的所需素材
    计算机毕业设计选什么题目好?springboot 医院门诊在线预约挂号系统
    生产过程建模在MES管理系统中的重要性
    【无标题】
    探索图像分辨率对于模型的影响,基于yolov5x开发构建桥洞、隧道、涵洞等水泥洞体建筑裂缝缺陷等检测识别系统
    股票量化怎么用?怎样才能做好量化交易?
    一些与VIO/SLAM有关又无关的杂谈
  • 原文地址:https://blog.csdn.net/acm_durante/article/details/127845265