码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 统计学习第一章


    目录

    • 统计学习
    • 1.绪论
      • 1.1 统计学习分类
      • 1.3 统计方法三要素
      • 1.4 过拟合
      • 1.5 正则化
      • 1.6 交叉验证

    统计学习

    1.绪论

    统计学习方法可以概括如下:从给定的、有限的、用于学习的训练数据集合出发,假设数据是独立同分布产生的; 当我们要处理数据时,可能会有很多的模型符合要求,这些所有符合要求的模型放在一起,称为假设空间,应用某个评价准则从假设空间中选取一个最优模型,使它对已知的训练数据及未知的测试数据在给定的评价准则下有最优的预测;最优模型的选取由算法实现。

    统计学习方法的步骤如下:
    (1) 得到一个有限的训练数据集合;
    (2)确定包含所有可能的模型假设空间,即学习模型的集合;
    (3)确定模型选择的准则,即学习的策络;
    (4)实现求解最优模型的算法,即学习的算法
    (5) 通过学习方法选择最优模型;
    (6) 利用学习的最优模型对新数据进行预测或者分析

    1.1 统计学习分类

    统计学习可以分为:监督学习(样本有标签),无监督学习(样本无标签),半监督学习(一部分有标签,一部分无标签),强化学习
    在这里插入图片描述
    在这里插入图片描述

    1.3 统计方法三要素

    方法=模型+策略+算法

    决策函数和条件概率分布函数
    决策函数类似于y=kx+b,输入x可以得到Y,
    条件概率分布函数则是通过输入多个x,判断生成y的哪个概率最大

    策略:通过损失函数判断

    1.4 过拟合

    我们把预测值和样本标签值几乎完全一致的情况叫做过拟合

    1.5 正则化

    为了解决过拟合,可以使用正则化和交叉验证.
    也可以增加样本数量.
    正则化是结构风险最小化策略的实现,是在经验风险上加一个正则化项(regularizer)或罚项(penalty term)。正则化项一般是模型复杂度的单调递增函数,模型越复杂,正则化值就越大。

    1.6 交叉验证

    应用最多的是S折交叉验证(S-fold cross validation),方法如下:首先随机地将
    已给数据切分为S个互不相交、大小相同的子集;然后利用S-1贪子集的数据训练模型,利用余下的子集测试模型;将这一过程对可能的S种选择重复进行;最后选出S 次评测中平均测试误差最小的模型。
    在这里插入图片描述

  • 相关阅读:
    Digger PRO - Voxel enhanced terrains
    谷粒商城10——搜索、商品详情、异步编排
    网络资料(忘传了)
    MySQL约束详解
    Springboot毕业设计毕设作品,微信网上图书商城购物小程序设计与实现
    在PostgreSQL中如何有效地批量导入大量数据,并确保数据加载过程中的性能和稳定性?
    接口测试常用测试点
    【手撕STL】AVL树
    微信公众号h5写一个全局调用微信分享功能
    人工智能知识全面讲解:梯度下降法
  • 原文地址:https://blog.csdn.net/ren9855/article/details/127606643
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号