码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 数据挖掘一些概念


    基本步骤:

    1 数据清理

    2 数据集成

    3 数据选择

    4 数据变换

    5 数据挖掘

    6 模式评估

    7 知识表示

    数据的属性有哪些:

    1 标称属性:可以说成是事物的名称 例如 头发的颜色:棕色,红色,褐色等

    2 二元属性:用 0或1 表示,又称布尔属性

    3 序数属性: 第一,第二,第三,A,B,C,D,等级之类的,序数之间没有明确的差值

    4 数值属性:有两种 (1).区间标度属性,比如温度15°和30°,差了15°,但是你不能说30°是15°的2倍 (2)比例率属性,比如100美元是1美元的100倍

    5 离散属性与连续属性

    数据的表述:

    1 中心趋势度量:可以用到 (1)均值 (2)中位数 (3) 众数

    均值:所有数据加起来求平均

    加权平均: 所有数据乘以他的权重,求和,在除以他的权重和

    中位数:递增排序后,中间的那个数,如果是偶数个,则为中间两个的平均值

    众数:数据中出现最多的数

    中列数:数据中最大数和最小数的和值得平均

    中列数可以看出数据是正倾斜还是负倾斜(在中位数的左边还是右边)左正右负

    度量数据散布:

    1 极差,四分位数,方差,标准差,和四分位极差

    极差:最大和最小数的差

    四分位数:数据中第25%(Q1) 50%(Q2)  75%(Q3),可以把数据分成四分,使得每部分是数据的四分之一。

    四分位极差:IQR=Q3-Q1

    方差:(数据的平均值减去数据中的每一个值)的平方,然后求和,再除以数据的个数

    标准差:方差开平方

                        

  • 相关阅读:
    CodeGeeX:vscode中全新的智能代码补全插件
    【网络编程】第二章 网络套接字(socket+UDP协议程序)
    数据结构-Redis(一)
    GaussDB向量数据库为盘古大模型再添助力
    【云计算网络安全】DDoS 缓解解析:DDoS 攻击缓解策略、选择最佳提供商和关键考虑因素
    PyTorch主要组成模块 | 数据读入 | 模型构建 | 模型初始化 | 损失函数 | 优化器 | 训练与评估
    Real-Time Rendering——9.7 Microfacet Theory微法理论
    e.target 原生js 没有 $event的 自定义属性值 传参
    Redis——Jedis的使用
    全志A40i android7.1 移植wifi驱动的一般流程
  • 原文地址:https://blog.csdn.net/qq_27047075/article/details/105027564
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号