• yolov8-obb旋转目标检测详细流程


    一、数据标注

    由于旋转目标标注与传统的目标检测标注有一定的区别,故使用roLabelImg或者labelimg2进行标注,以下标注软件选用的是roLabelImg。
    roLabelImg下载地址:https://github.com/cgvict/roLabelImg
    直接在原有的labelimg环境中使用roLabelImg,运行python roLabelImg.py
    在这里插入图片描述
    打开标注软件后,e表示标注旋转目标,w表示标注正常目标,d表示下一张,a表示上一张,c表示小幅度顺时针旋转,x表示小幅度逆时针旋转,v表示大幅度顺时针旋转,z表示大幅度逆时针旋转。
    在这里插入图片描述

    二、数据集处理

    整体处理流程xml —> dota_xml —> dota_txt ----> txt
    文件夹
    在这里插入图片描述
    第一步:xml —> dota_xml —> dota_txt

    # 文件名称   :roxml_to_dota.py
    # 功能描述   :把rolabelimg标注的xml文件转换成dota能识别的xml文件,
    #             再转换成dota格式的txt文件
    #            把旋转框 cx,cy,w,h,angle,或者矩形框cx,cy,w,h,转换成四点坐标x1,y1,x2,y2,x3,y3,x4,y4
    import os
    import xml.etree.ElementTree as ET
    import math
     
    cls_list = ['1', '2', '3', '4']  #修改为自己的标签
     
     
    def edit_xml(xml_file, dotaxml_file):
        """
        修改xml文件
        :param xml_file:xml文件的路径
        :return:
        """
     
        # dxml_file = open(xml_file,encoding='gbk')
        # tree = ET.parse(dxml_file).getroot()
     
        tree = ET.parse(xml_file)
        objs = tree.findall('object')
        for ix, obj in enumerate(objs):
            x0 = ET.Element("x0")  # 创建节点
            y0 = ET.Element("y0")
            x1 = ET.Element("x1")
            y1 = ET.Element("y1")
            x2 = ET.Element("x2")
            y2 = ET.Element("y2")
            x3 = ET.Element("x3")
            y3 = ET.Element("y3")
            # obj_type = obj.find('bndbox')
            # type = obj_type.text
            # print(xml_file)
     
            if (obj.find('robndbox') == None):
                obj_bnd = obj.find('bndbox')
                obj_xmin = obj_bnd.find('xmin')
                obj_ymin = obj_bnd.find('ymin')
                obj_xmax = obj_bnd.find('xmax')
                obj_ymax = obj_bnd.find('ymax')
                # 以防有负值坐标
                xmin = max(float(obj_xmin.text), 0)
                ymin = max(float(obj_ymin.text), 0)
                xmax = max(float(obj_xmax.text), 0)
                ymax = max(float(obj_ymax.text), 0)
                obj_bnd.remove(obj_xmin)  # 删除节点
                obj_bnd.remove(obj_ymin)
                obj_bnd.remove(obj_xmax)
                obj_bnd.remove(obj_ymax)
                x0.text = str(xmin)
                y0.text = str(ymax)
                x1.text = str(xmax)
                y1.text = str(ymax)
                x2.text = str(xmax)
                y2.text = str(ymin)
                x3.text = str(xmin)
                y3.text = str(ymin)
            else:
                obj_bnd = obj.find('robndbox')
                obj_bnd.tag = 'bndbox'  # 修改节点名
                obj_cx = obj_bnd.find('cx')
                obj_cy = obj_bnd.find('cy')
                obj_w = obj_bnd.find('w')
                obj_h = obj_bnd.find('h')
                obj_angle = obj_bnd.find('angle')
                cx = float(obj_cx.text)
                cy = float(obj_cy.text)
                w = float(obj_w.text)
                h = float(obj_h.text)
                angle = float(obj_angle.text)
                obj_bnd.remove(obj_cx)  # 删除节点
                obj_bnd.remove(obj_cy)
                obj_bnd.remove(obj_w)
                obj_bnd.remove(obj_h)
                obj_bnd.remove(obj_angle)
     
                x0.text, y0.text = rotatePoint(cx, cy, cx - w / 2, cy - h / 2, -angle)
                x1.text, y1.text = rotatePoint(cx, cy, cx + w / 2, cy - h / 2, -angle)
                x2.text, y2.text = rotatePoint(cx, cy, cx + w / 2, cy + h / 2, -angle)
                x3.text, y3.text = rotatePoint(cx, cy, cx - w / 2, cy + h / 2, -angle)
     
            # obj.remove(obj_type)  # 删除节点
            obj_bnd.append(x0)  # 新增节点
            obj_bnd.append(y0)
            obj_bnd.append(x1)
            obj_bnd.append(y1)
            obj_bnd.append(x2)
            obj_bnd.append(y2)
            obj_bnd.append(x3)
            obj_bnd.append(y3)
     
            tree.write(dotaxml_file, method='xml', encoding='utf-8')  # 更新xml文件
     
     
    # 转换成四点坐标
    def rotatePoint(xc, yc, xp, yp, theta):
        xoff = xp - xc
        yoff = yp - yc
        cosTheta = math.cos(theta)
        sinTheta = math.sin(theta)
        pResx = cosTheta * xoff + sinTheta * yoff
        pResy = - sinTheta * xoff + cosTheta * yoff
        return str(int(xc + pResx)), str(int(yc + pResy))
     
     
    def totxt(xml_path, out_path):
        # 想要生成的txt文件保存的路径,这里可以自己修改
     
        files = os.listdir(xml_path)
        i = 0
        for file in files:
     
            tree = ET.parse(xml_path + os.sep + file)
            root = tree.getroot()
     
            name = file.split('.')[0]
     
            output = out_path + '/' + name + '.txt'
            file = open(output, 'w')
            i = i + 1
            objs = tree.findall('object')
            for obj in objs:
                cls = obj.find('name').text
                box = obj.find('bndbox')
                x0 = int(float(box.find('x0').text))
                y0 = int(float(box.find('y0').text))
                x1 = int(float(box.find('x1').text))
                y1 = int(float(box.find('y1').text))
                x2 = int(float(box.find('x2').text))
                y2 = int(float(box.find('y2').text))
                x3 = int(float(box.find('x3').text))
                y3 = int(float(box.find('y3').text))
                if x0 < 0:
                    x0 = 0
                if x1 < 0:
                    x1 = 0
                if x2 < 0:
                    x2 = 0
                if x3 < 0:
                    x3 = 0
                if y0 < 0:
                    y0 = 0
                if y1 < 0:
                    y1 = 0
                if y2 < 0:
                    y2 = 0
                if y3 < 0:
                    y3 = 0
                for cls_index, cls_name in enumerate(cls_list):
                    if cls == cls_name:
                        file.write("{} {} {} {} {} {} {} {} {} {}\n".format(x0, y0, x1, y1, x2, y2, x3, y3, cls, cls_index))
            file.close()
            # print(output)
            print(i)
     
     
    if __name__ == '__main__':
        # -----**** 第一步:把xml文件统一转换成旋转框的xml文件 ****-----
        roxml_path = '/home/y/code/yolov8/data/lase2/labels/val_xml'
        dotaxml_path = '/home/y/code/yolov8/data/lase2/labels/val_dota'
        out_path = '/home/y/code/yolov8/data/lase2/labels/val_original'
        filelist = os.listdir(roxml_path)
        for file in filelist:
            edit_xml(os.path.join(roxml_path, file), os.path.join(dotaxml_path, file))
     
        # -----**** 第二步:把旋转框xml文件转换成txt格式 ****-----
        totxt(dotaxml_path, out_path)
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52
    • 53
    • 54
    • 55
    • 56
    • 57
    • 58
    • 59
    • 60
    • 61
    • 62
    • 63
    • 64
    • 65
    • 66
    • 67
    • 68
    • 69
    • 70
    • 71
    • 72
    • 73
    • 74
    • 75
    • 76
    • 77
    • 78
    • 79
    • 80
    • 81
    • 82
    • 83
    • 84
    • 85
    • 86
    • 87
    • 88
    • 89
    • 90
    • 91
    • 92
    • 93
    • 94
    • 95
    • 96
    • 97
    • 98
    • 99
    • 100
    • 101
    • 102
    • 103
    • 104
    • 105
    • 106
    • 107
    • 108
    • 109
    • 110
    • 111
    • 112
    • 113
    • 114
    • 115
    • 116
    • 117
    • 118
    • 119
    • 120
    • 121
    • 122
    • 123
    • 124
    • 125
    • 126
    • 127
    • 128
    • 129
    • 130
    • 131
    • 132
    • 133
    • 134
    • 135
    • 136
    • 137
    • 138
    • 139
    • 140
    • 141
    • 142
    • 143
    • 144
    • 145
    • 146
    • 147
    • 148
    • 149
    • 150
    • 151
    • 152
    • 153
    • 154
    • 155
    • 156
    • 157
    • 158
    • 159
    • 160
    • 161
    • 162
    • 163
    • 164
    • 165
    • 166
    • 167
    • 168
    • 169
    • 170

    第二步:dota_txt —> txt

    import sys
    import inspect
    sys.path.insert(0, '/home/y/code/yolov8')
    print(sys.path)
     
    from ultralytics.data.converter import convert_dota_to_yolo_obb
    source_file = inspect.getsourcefile(convert_dota_to_yolo_obb)
    print("convert_dota_to_yolo_obb 函数所在文件的路径:", source_file)
    convert_dota_to_yolo_obb('/home/y/code/yolov8/data/lase2')
    #关于dataobb文件下的目录下面会详细说明
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10

    注:在进行第二步之前需要做的一些代码修改
    1、修改yolov8/ultralytics/data/converter.py
    eg:在这里插入图片描述
    将class_mapping修改为自己的标签。
    2、修改yolov8/ultralytics/cfg/models/v8/yolov8-obb.yaml
    在这里插入图片描述
    将nc修改为自己的类别数量。
    3、创建训练所需的yaml文件放置在数据集文件夹中

    # train and val data as 1) directory: path/images/, 2) file: path/images.txt, or 3) list: [path1/images/, path2/images/]
    path: /home/y/code/yolov8/data/lase2
    train: images/train  #  images
    val: images/val  #  images
    
    # number of classes
    nc: 4
    
    # class names
    names: 
      0: ture
      1: ban
      2: man
      3: di
              
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15

    三、开始训练

    1、更改/home/wangyu/code/yolov8/ultralytics/cfg/default.yaml
    在这里插入图片描述
    2、开始训练

    import argparse
    import sys
    sys.path.append('/home/y/code/yolov8/ultralytics')
    from ultralytics import YOLO
    
    
    def parse_opt(known=False):
        parser = argparse.ArgumentParser()
        parser.add_argument('--model', type=str, default='yolov8s-obb.pt', help='initial weights path')
        parser.add_argument('--epochs', type=int, default=1600, help='total training epochs')
        parser.add_argument('--imgsz', type=int, default=640, help='train, val image size (pixels)')
        parser.add_argument('--batch', type=str, default=2, help='total batch size for all GPUs, -1 for autobatch')
        parser.add_argument('--lr0', type=str, default=0.01, help=' (float) initial learning rate (i.e. SGD=1E-2, Adam=1E-3)')
        parser.add_argument('--cls', type=str, default=1.5, help=' (float) cls loss gain (scale with pixels)')
        parser.add_argument('--data', type=str, default='/home/y/code/yolov8/data/lase/my-dota8-obb.yaml', help='dataset.yaml path')    parser.add_argument('--workers', type=str, default=8)
        parser.add_argument('--device', type=str, default=0, help='cuda device, i.e. 0 or 0,1,2,3 or cpu')
        return parser.parse_known_args()[0] if known else parser.parse_args()
    
    def main(opt):
        model = YOLO(opt.model)
        model.train(data=opt.data, epochs=opt.epochs, imgsz=opt.imgsz, batch=opt.batch, device=opt.device, lr0=opt.lr0, cls=opt.cls)
        model.val(imgsz=opt.imgsz)
    
    
    if __name__ == '__main__':
        # results,metrics,success = main()
        opt = parse_opt()
        main(opt)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
  • 相关阅读:
    git-secret:在 Git 存储库中加密和存储密钥(下)
    Hive sql 行列转换(行转列,列转行)
    独立后台的查题功能题库系统
    promise用法
    python,修改数组【第十届】【省赛】【研究生组】
    Elasticsearch (ES) 学习之路(三) IK 分词器安装与使用自定义词典
    导师问我打开句柄fd和没有打开的差异在哪里?
    ffmpeg 简单教程
    PyTorch入门教学——Transforms使用
    渗透测试流程是什么?7个步骤给你讲清楚!
  • 原文地址:https://blog.csdn.net/weixin_45994963/article/details/138073879