码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 13model selection和bias/variance1


    目录

    model selection and training cross

    Bias/variance

    判断bias和variance

    regularization bias and variance


    model selection and training cross

            actual generalization error指的是用不在训练集上的数据测试模型。

            从低次方模型开始,用测试集测试,然后计算出Jtest,在所有的10个模型中找到Jtest最小的。此图中的例子,第五个是最小的。实际上,测试也会和训练一样可能出现过拟合。

            cross validation有时也被叫做validation set、dev set或development set,都是为了验证模型的accuracy或validity。

            这三个公式都没有加regularization项。可使用这三项对模型的性能评估。

            对于每一个f(x)的参数选择,我们会通过cross validation set测试参数,而不是在test set上,选择cross validation set的J最小的一项。本例子中J4是最小的,意味着我们选择了J4对应的多项式作为模型的应用。最后可以把选好的模型应用到test set上,估算generalization error。

    步骤是:第一,通过训练集选择每个式子的参数;第二,通过验证集选择式子中J最小的一个;第三,通过测试集估算选择后的式子的generalization error。

    Bias/variance

    创建机器学习系统的过程的关键是决定好提升性能的下一步。

    判断bias和variance

            Jtrain很高,Jcv也很高,表面这个有很高的bias。

            Jtrain很低,但是新的数据上下Jcv很高远大于Jtrain,表明这个variance很高。

            在这图中,high bias和high variance不太可能出现,但是在一些机器学习的实例中,可能会出现。线性回归中,high bias和high variance不太可能出现。

    regularization bias and variance

            λ的选很重要。过低或过高可能会导致variance或bias很高。

            对于每一个λ的值,通过最小化J确定对应的参数值,然后通过validation set评估λ。

            随着λ的增大,模型会使w更小,从而更少关注对训练数据的拟合程度,导致Jtrain增大。

            随着λ的增大,Jcros validation会像个碗一样,左边variance很高,右边bias很高。 

  • 相关阅读:
    Springboot实战:redisson分布式缓存、分布式锁详细教程(附git源码)
    C++ using的使用
    C#应用程序的多语言方案 - 开源研究系列文章
    RabbitMQ的安装
    Mac中LaTex无法编译的问题
    【毕业设计】13-基于单片机的锂电池管理系统(原理图+源码+仿真工程+论文)
    视频太大怎么压缩变小?超过1G的视频这样压缩
    2021年软件测试面试题大全
    零基础入门数据挖掘——二手车交易价格预测:baseline
    【轻松搞定】Edge 或 Google 无法上网问题
  • 原文地址:https://blog.csdn.net/weixin_44846755/article/details/127068896
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号