码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • L1&L2,范数&损失


    目录

      • 1. L2范数(欧氏距离)
      • 2. L2范数损失,这个听的/用的少一些
      • 3-1. L2损失(均方误差)
      • 3-2. L1损失(平均绝对误差)
      • 4. L1范数L2范数在机器学习方面的区别
      • 5. 为什么L2范数可以防止过拟合?

    1. L2范数(欧氏距离)

    L2 范数 = 欧几里得范数(Euclidean norm) = 欧式长度(欧氏距离) = L2距离,对应 ||x||2
    在这里插入图片描述

    2. L2范数损失,这个听的/用的少一些

    L2范数损失 = L2-norm损失 = 最小平方误差(least squares error, LSE) = 最小二乘误差 。它是把目标值y与估计值f(x)的差值的平方和最小化。一般回归问题会用此损失,离群点对次损失影响较大。
    在这里插入图片描述

    3-1. L2损失(均方误差)

    L2损失(L2 Loss) = 均方误差(Mean Square Error,MSE)。是模型预测值f(x)与真实样本值y之间差值平方的均值,其公式如下
    在这里插入图片描述

    • 优点:各点都连续光滑,方便求导,具有较为稳定的解
    • 缺点:不是特别的稳健,因为当函数的输入值距离真实值较远的时候,对应loss值很大在两侧,则使用梯度下降法求解的时候梯度很大,可能导致梯度爆炸

    参考:区分混淆概念之L2范数,L2范数损失,L2损失,均方误差

    像下式也是均方误差(摘自我的毕设答辩PPT,含义是感知损失perceptual reconstruction loss)
    在这里插入图片描述

    3-2. L1损失(平均绝对误差)

    L1损失 = 平均绝对误差(Mean Absolute Error,MAE)
    在这里插入图片描述

    • 优点:无论对于什么样的输入值,都有着稳定的梯度,不会导致梯度爆炸问题,具有较为稳健性的解
    • 缺点:在中心点是折点,不能求导,梯度下降时要是恰好学习到w=0就没法接着进行了

    参考:深度学习中常见的损失函数(L1Loss、L2loss)

    4. L1范数L2范数在机器学习方面的区别

    • L1范数可以进行特征选择,即让特征的系数变为0。
    • L2范数可以防止过拟合,提升模型的泛化能力,有助于处理 condition number不好下的矩阵(数据变化很小矩阵求解后结果变化很大)。(核心:L2对大数,对outlier离群点更敏感!)
    • 下降速度:最小化权值参数L1比L2变化的快。
    • 模型空间的限制:L1会产生稀疏 L2不会。
    • L1会趋向于产生少量的特征,而其他的特征都是0,而L2会选择更多的特征,这些特征都会接近于0。
      原文链接:欧氏距离,l2范数,l2-loss,l2正则化

    5. 为什么L2范数可以防止过拟合?

    在回归里面,有人把有它的回归叫“岭回归”(Ridge Regression),有人也叫它“权值衰减weight decay”。L2范数强大功效是改善机器学习里面一个非常重要的问题:过拟合。
    范数是指向量各元素的平方和然后求平方根。我们让L2范数的规则项||W||2最小,可以使得W的每个元素都很小,都接近于0,但与L1范数不同,它不会让它等于0,而是接近于0,这里是有很大的区别的哦。而越小的参数说明模型越简单,越简单的模型则越不容易产生过拟合现象。为什么越小的参数说明模型越简单?一种理解是:“限制了参数很小,实际上就限制了多项式某些分量大小,使分量的影响很小,这样就相当于减少参数个数”。
    原文链接:欧氏距离,l2范数,l2-loss,l2正则化

  • 相关阅读:
    Android 行情都这样了,面试问的还这么难?
    RFSoC应用笔记 - RF数据转换器 -05- RFSoC关键配置之RF-ADC内部解析(三)
    WPS或EXCEL表格单元格下拉快捷选择项修改及设置方法
    webmin远程命令执行漏洞(CVE-2019-15107)
    nginx之基于LNMP搭建论坛
    QTday2
    About Covariance and Correlation(协方差和相关)
    前端常用布局方式大全——细致讲解
    【前端】Vue实现个人空间
    Java面试突击
  • 原文地址:https://blog.csdn.net/double_yellow/article/details/130833272
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号