• OpenCV官方教程中文版 —— 图像梯度


    前言

    图像梯度,图像边界等

    使用到的函数有:cv2.Sobel(),cv2.Schar(),cv2.Laplacian() 等

    一、原理

    梯度简单来说就是求导
    OpenCV 提供了三种不同的梯度滤波器,或者说高通滤波器:Sobel,Scharr 和 Laplacian。我们会意义介绍他们。

    Sobel,Scharr 其实就是求一阶或二阶导数。Scharr 是对 Sobel(使用小的卷积核求解求解梯度角度时)的优化。Laplacian 是求二阶导数。

    二、 Sobel 算子和 Scharr 算子

    Sobel 算子是高斯平滑与微分操作的结合体,所以它的抗噪声能力很好。你可以设定求导的方向(xorder 或 yorder)。还可以设定使用的卷积核的大小(ksize)。如果 ksize=-1,会使用 3x3 的 Scharr 滤波器,它的的效果要比 3x3 的 Sobel 滤波器好(而且速度相同,所以在使用 3x3 滤波器时应该尽量使用 Scharr 滤波器)。3x3 的 Scharr 滤波器卷积核如下:

    在这里插入图片描述

    三、 Laplacian 算子

    拉普拉斯算子可以使用二阶导数的形式定义,可假设其离散实现类似于二阶 Sobel 导数,事实上,OpenCV 在计算拉普拉斯算子时直接调用 Sobel 算子。计算公式如下:

    在这里插入图片描述
    拉普拉斯滤波器使用的卷积核:

    在这里插入图片描述
    代码
    下面的代码分别使用以上三种滤波器对同一幅图进行操作。使用的卷积核都是 5x5 的。

    # -*- coding: utf-8 -*-
    import cv2
    from matplotlib import pyplot as plt
    img = cv2.imread('dave.png', 0)
    # cv2.CV_64F 输出图像的深度(数据类型),可以使用-1, 与原图像保持一致 np.uint8
    laplacian = cv2.Laplacian(img, cv2.CV_64F)
    laplacian = cv2.convertScaleAbs(laplacian)
    
    # 参数 1,0 为只在 x 方向求一阶导数,最大可以求 2 阶导数。
    sobelx = cv2.Sobel(img, cv2.CV_64F, 1, 0, ksize=3)
    sobelx = cv2.convertScaleAbs(sobelx) #  把求出为负数的导数取绝对值,然后转回到8位灰度图像
    # 参数 0,1 为只在 y 方向求一阶导数,最大可以求 2 阶导数。
    sobely = cv2.Sobel(img, cv2.CV_64F, 0, 1, ksize=3)
    sobely = cv2.convertScaleAbs(sobely) #  把求出为负数的导数取绝对值,然后转回到8位灰度图像
    
    plt.subplot(2, 2, 1), plt.imshow(img, cmap='gray')
    plt.title('Original'), plt.xticks([]), plt.yticks([])
    plt.subplot(2, 2, 2), plt.imshow(laplacian, cmap='gray')
    plt.title('Laplacian'), plt.xticks([]), plt.yticks([])
    plt.subplot(2, 2, 3), plt.imshow(sobelx, cmap='gray')
    plt.title('Sobel X'), plt.xticks([]), plt.yticks([])
    plt.subplot(2, 2, 4), plt.imshow(sobely, cmap='gray')
    plt.title('Sobel Y'), plt.xticks([]), plt.yticks([])
    plt.show()
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25

    在这里插入图片描述

    一个重要的事!
    在查看上面这个例子的注释时不知道你有没有注意到:当我们可以通过参数 -1 来设定输出图像的深度(数据类型)与原图像保持一致,但是我们在代码中使用的却是 cv2.CV_64F。这是为什么呢?想象一下一个从黑到白的边界的导数是整数,而一个从白到黑的边界点导数却是负数。如果原图像的深度是np.int8 时,所有的负值都会被截断变成 0,换句话说就是把把边界丢失掉。

    所以如果这两种边界你都想检测到,最好的的办法就是将输出的数据类型设置的更高,比如 cv2.CV_16S,cv2.CV_64F 等。取绝对值然后再把它转回到 cv2.CV_8U。

  • 相关阅读:
    [数据集][目标检测]睡岗检测数据集VOC+YOLO格式3290张4类别
    单例模式有几种写法?
    探索服务器的无限潜能:创意项目、在线社区与更多可能
    PyTorch深度学习原理与实现
    【无标题】
    MIPI CSI接口调试方法:时序调试
    springboot员工日志管理信息系统的设计与开发毕业设计源码201834
    介绍一个.Net远程日志组件
    创建自己的cli
    C/C++后端开发学习路线总结(附带实习学习经历分享)
  • 原文地址:https://blog.csdn.net/weixin_42207434/article/details/133911907