• 数学小抄:线性回归与协方差


    前言

    最近在阅读论文时,有一篇论文提到了一个广义的线性回归.在介绍中,它提到了线性回归的斜率与协方差的关系. 下面简单推导一下, 加深理解.

    正文
    1. 线性回归: 寻找一条直线 y = x β + α y=x\beta+\alpha y=xβ+α 满足数据之间的误差平方最小
      ( α ^ , β ^ ) = a r g m i n ( α , β ) ∑ n = 1 N ∣ ∣ y i − α − x i β ∣ ∣ 2 (\hat{\alpha},\hat{\beta})=\underset{ (\alpha,\beta)}{\rm{argmin}} \sum^{N}_{n=1}||y_i-\alpha-x_i\beta||^2 (α^,β^)=(α,β)argminn=1N∣∣yiαxiβ2

    2. 右边式展开以及求偏导
      = ∑ n = 1 N y i 2 − ∑ n = 1 N 2 α y i − ∑ n = 1 N 2 β y i x i + ∑ n = 1 N 2 α β x i + ∑ n = 1 N β 2 x i 2 + ∑ n = 1 N α 2 = N y 2 ˉ − N 2 α y ˉ − 2 β N y x ˉ + 2 α β N x ˉ + β 2 N x 2 ˉ + N α 2

      =n=1Nyi2n=1N2αyin=1N2βyixi+n=1N2αβxi+n=1Nβ2xi2+n=1Nα2=Ny2¯N2αy¯2βNyx¯+2αβNx¯+β2Nx2¯+Nα2" role="presentation">=n=1Nyi2n=1N2αyin=1N2βyixi+n=1N2αβxi+n=1Nβ2xi2+n=1Nα2=Ny2¯N2αy¯2βNyx¯+2αβNx¯+β2Nx2¯+Nα2
      =n=1Nyi2n=1N2αyin=1N2βyixi+n=1N2αβxi+n=1Nβ2xi2+n=1Nα2=Ny2ˉN2αyˉ2βNyxˉ+2αβNxˉ+β2Nx2ˉ+Nα2
      β \beta β求偏导并令其为0有(1):
      − y x ˉ + α x ˉ + β x 2 ˉ = 0 -\bar{yx}+\alpha\bar{x}+\beta\bar{x^2} = 0 yxˉ+αxˉ+βx2ˉ=0
      α \alpha α求偏导并令其为0有(2):
      − y ˉ + β x ˉ + α = 0 -\bar{y}+\beta\bar{x}+\alpha=0 yˉ+βxˉ+α=0
      (2)代入(1)有:
      β = y x ˉ − y ˉ x ˉ x 2 ˉ − x ˉ 2 \beta = \frac{\bar{yx}-\bar{y}\bar{x}}{\bar{x^2}-\bar{x}^2} β=x2ˉxˉ2yxˉyˉxˉ
      α = y ˉ − β x ˉ \alpha=\bar{y}-\beta\bar{x} α=yˉβxˉ

    3. 协方差公式:
      C o v ( X , Y ) = E [ ( X − E ( X ) ) ( Y − E ( Y ) ) ] = E [ X Y − X E ( Y ) − Y E ( X ) + E ( X ) E ( Y ) ] Cov(X,Y)= E[(X-E(X))(Y-E(Y))]=E[XY-XE(Y)-YE(X)+E(X)E(Y)] Cov(X,Y)=E[(XE(X))(YE(Y))]=E[XYXE(Y)YE(X)+E(X)E(Y)]
      C o v ( X , Y ) = E [ X Y ] − E [ X ] E [ Y ] − E [ Y ] E [ X ] + E ( X ) E ( Y ) = E [ X Y ] − E [ X ] E [ Y ] Cov(X,Y)=E[XY]-E[X]E[Y]-E[Y]E[X]+E(X)E(Y)=E[XY]-E[X]E[Y] Cov(X,Y)=E[XY]E[X]E[Y]E[Y]E[X]+E(X)E(Y)=E[XY]E[X]E[Y]

    4. 代入 β \beta β式中

      β = C o v ( X , Y ) V a r ( x ) \beta = \frac{Cov(X,Y)}{Var(x)} β=Var(x)Cov(X,Y)

  • 相关阅读:
    彻底理解Java并发:synchronized关键字
    【滤波跟踪】基于Huber函数和最大相关熵的抗差滤波算法实现GNSS导航定位粗差处理附matlab代码
    【牛客刷题】——Python入门 05 运算符(上)
    [Linux] 进程等待
    【老生谈算法】matlab实现基本遗传算法应用实例——遗传算法
    linux环境下编译,安卓平台使用的luajit库
    command
    PostGIS数据测试-一百万点要素
    算术优化与阿奎拉鹰优化的混合算法
    头歌——机器、深度学习——图像生成
  • 原文地址:https://blog.csdn.net/nkc555/article/details/127610044