码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • DBSCAN聚类算法实用案例


    目录

    • 4、DBSCAN 的参数选择
    • 5、Scikit-learn中的DBSCAN的使用
      • 核心参数:
      • 属性:

    4、DBSCAN 的参数选择

    • eps 设置得非常小,则意味着没有点是核心样本,可能会导致所有点被标记为噪声
    • eps 设置得非常大,可能会导致所有点形成单个簇。
    • 虽然不需要显示设置簇的个数,但设置 eps 可以隐式地控制找到 eps 的个数。
    • 使用 StandarScaler 或 MinMaxScaler 对数据进行缩放,有时更容易找到 eps 的较好取值。因为使用缩放技术将确保所有特征具有相似的范围。
      在这里插入图片描述
    属于簇的点是实心,噪声点则显示为空心,核心样本点显示为较大的标记,而边界点则显示为较小的标记.png
    from sklearn.cluster import DBSCAN
    from sklearn.datasets import make_blobs
    import matplotlib.pyplot as plt
    import mglearn
    
    X,y=make_blobs(random_state=0,n_samples=12)
    dbscan=DBSCAN()
    clusters=dbscan.fit_predict(X)
    # 都被标记为噪声
    print('Cluster memberships:\n{}'.format(clusters))
    mglearn.plots.plot_dbscan()
    
    plt.show()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13

    5、Scikit-learn中的DBSCAN的使用

    def __init__(self, eps=0.5, min_samples=5, metric='euclidean',
                     metric_params=None, algorithm='auto', leaf_size=30, p=None,
                     n_jobs=1):
    
    • 1
    • 2
    • 3

    核心参数:

    • eps: float,ϵ-邻域的距离阈值
    • min_samples :int,样本点要成为核心对象所需要的 ϵ-邻域的样本数阈值

    属性:

    • core_sample_indices_ : 核心点的索引,因为labels_不能区分核心点还是边界点,所以需要用这个索引确定核心点
    • components_:训练样本的核心点
    • labels_:每个点所属集群的标签,-1代表噪声点

    参考链接:
    [1] DBSCAN 算法 2019.1

  • 相关阅读:
    数据结构——栈与队列
    性能测试度量指标
    http.header.Set()与Add()区别;
    关于python的odl库的相关问题解决
    使用小程序制作一个电子木鱼,功德+1
    学会这些VRay渲染器HDRI照明技巧,轻松搞定3ds Max
    【LeetCode】3. 无重复字符的最长子串
    查题接口API
    补题2.0
    从头开始进行CUDA编程:Numba并行编程的基本概念
  • 原文地址:https://blog.csdn.net/weixin_46713695/article/details/125425151
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号