码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 机器学习概述


    1. 机器学习概述

    文章目录

      • 1. 机器学习概述
        • 1.1 人工智能概述
          • 1.1.1 人工智能发展必备三要素
          • 1.1.2 人工智能、机器学习和深度学习
        • 1.2 人工智能发展历程
          • 1.2.1 人工智能的起源
          • 1.2.2 发展历程
        • 1.3 人工智能主要分支
          • 1.3.1 现代人工智能的三个关键能力
          • 1.3.2 主要分支
        • 1.4 机器学习工作流程
          • 1.4.1 什么是机器学习
          • 1.4.2 工作流程
          • 1.4.3 数据集介绍
        • 1.5 机器学习算法分类
        • 1.6 模型评估
          • 1.6.1 按照数据集的目标值不同
          • 1.6.2 评估的表现效果 → 拟合
        • 1.7 Azure机器学习模型搭建实验
          • 1.7.1 Azure机器学习实验
          • 1.7.2 体验机器学习流程
        • 1.8 深度学习简介
          • 1.8.1 卷积网络之父
          • 1.8.2 发展源头
          • 1.8.3 多层神经网络

    1.1 人工智能概述

    1.1.1 人工智能发展必备三要素

    • 数据

    • 算法

    • 计算力

      • CPU

        • 主要适合于I\O密集型的任务
      • GPU

        • 主要适合于计算密集型任务

        • 什么类型的程序适合在GPU上运行

          • 计算密集型的程序
          • 易于并行的程序
      • TPU

    1.1.2 人工智能、机器学习和深度学习

    • 在这里插入图片描述

    • 关系

      • 机器学习是人工智能的一个实现途径
      • 深度学习是机器学习的一个方法发展而来的

    1.2 人工智能发展历程

    1.2.1 人工智能的起源

    • 图灵测试
    • 达特茅斯会议
    • 1956 年 → 人工智能元年

    1.2.2 发展历程

    • 起步发展期:1956年 - 20世纪60年代初
    • 反思发展期:20世纪60年代初 - 70年代中
    • 应用发展期:20世纪70年代初 - 80年代中
    • 低迷发展期:20世纪80年代中 - 90年代中
    • 稳步发展期:20世纪90年代中 - 2010年
    • 蓬勃发展期:2011年至今

    在这里插入图片描述

    1.3 人工智能主要分支

    1.3.1 现代人工智能的三个关键能力

    • 通讯
    • 感知
    • 行动

    1.3.2 主要分支

    • 计算机视觉 CV

    • 自然语言处理 NLP

      • 语音识别
      • 文本挖掘/分类
      • 机器翻译
    • 机器人

    1.4 机器学习工作流程

    1.4.1 什么是机器学习

    • 机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测

    1.4.2 工作流程

    • 在这里插入图片描述

      1. 获取数据
      1. 数据基本处理
      • 对数据进行缺失值、去除异常值等处理
      1. 特征工程
      • 使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程

      • 会直接影响机器学习的效果

      • 为什么需要特征工程?

        • 吴恩达:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已
      • 包含内容

        • 特征提取

          • 将任意数据(如文本或图像)转换为可用于机器学习的数字特征
        • 特征预处理

          • 通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程

            • 子主题 1
        • 特征降维

          • 在某些限定条件下,降低随机变量(特征)个数,得到一组“不相关”主变量的过程
      1. 机器学习(模型训练)
      • 选择合适的算法对模型进行训练
      1. 模型评估
      • 对训练好的模型进行评估
    机器学习的三大巨头对比
    doc 0星 超过10%的资源 54KB
    下载

    1.4.3 数据集介绍

    • 一行数据 → 一个样本

    • 一列数据 → 一个特征

    • 可能有目标值(标签值)

    • 数据类型构成

      • 类型一:特征值 + 目标值(目标值是连续的和离散的)
      • 类型二:只有特征值,没有目标值
    • 数据分割

      • 训练集

        • 用于训练、构建模型
      • 测试集

        • 在模型检验时使用,用于评估模型是否有效
      • 划分比例

        • 在这里插入图片描述

    1.5 机器学习算法分类

    根据数据集组成不同

    • 监督学习

      • 输入数据是由输入特征值和目标值所组成

      • 输出

        • 回归:输出是一个连续的值
        • 分类:输出是有限个离散值
    • 无监督学习

      • 输入数据是由输入特征值组成,没有目标值
      • 需要根据样本间的相似性对样本集进行类别划分。
    • 半监督学习

      • 训练集同时包含有标记样本数据和未标记样本数据。
    • 强化学习

      • 自动进行决策,并且可以做连续决策
      • 目标:获得最多的累计奖励
    • 监督学习和强化学习的对比

      • 在这里插入图片描述
    • 小结

      • 在这里插入图片描述

    1.6 模型评估

    1.6.1 按照数据集的目标值不同

    • 分类模型评估

      • 准确率

        • 预测正确的样本数占样本总数的比例
      • 精确率、召回率、F1-score、AUC指标等

    • 回归模型评估

      • 均方根误差 RMSE

        • 在这里插入图片描述
      • 相对平方误差(Relative Squared Error,RSE)、平均绝对误差(Mean Absolute Error,MAE)、相对绝对误差(Relative Absolute Error,RAE)

    1.6.2 评估的表现效果 → 拟合

    • 过拟合

      • 学习到的东西太多
      • 学习到的特征多,不好泛化
    • 欠拟合

      • 学习到的东西太少
      • 模型学习的太过粗糙

    1.7 Azure机器学习模型搭建实验

    AML Azure Machine Learning

    深度学习概述(来自微软的65页PPT)
    pdf 0星 超过10%的资源 4.78MB
    下载
    • 微软在其公有云Azure上推出的基于Web使用的一项机器学习服务

    1.7.1 Azure机器学习实验

    • 实验目的:根据人口普查数据预测不同人员收入情况

    • 数据集:adult.data.csv

    • 在这里插入图片描述

    • 在这里插入图片描述

    1.7.2 体验机器学习流程

    1.8 深度学习简介

    深度学习(Deep Learning)(也称为深度结构学习【Deep Structured Learning】、层次学习【Hierarchical Learning】或者是深度机器学习【Deep Machine Learning】)是一类算法集合,是机器学习的一个分支。

    1.8.1 卷积网络之父

    • Yann LeCun

    1.8.2 发展源头

    • 神经网络

    1.8.3 多层神经网络

    • 在最初几层是识别简单内容,后面几层是识别一些复杂内容
  • 相关阅读:
    知识图谱数据库基本知识
    五大架构风格
    【数据结构】查找— —线性表的查找(顺序查找、折半查找、分块查找)
    官宣|Apache Flink 1.16 发布公告
    java计算机毕业设计高校宿舍管理系统MyBatis+系统+LW文档+源码+调试部署
    大唐杯题目
    ELK专栏之ES快速入门-01
    (封装)已知的一个类Student
    Flutter for App——一个简单的BMI计算APP
    一.node的文件系统;二.node的数据流(Stream接口);
  • 原文地址:https://blog.csdn.net/weixin_44226181/article/details/126133823
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号