• 深度学习快速入门----Pytorch 系列1


    注:参考B站‘小土堆’视频教程

    视频链接:【PyTorch深度学习快速入门教程(绝对通俗易懂!)【小土堆】

    系列文章:
    深度学习快速入门----Pytorch 系列1
    深度学习快速入门----Pytorch 系列2
    深度学习快速入门----Pytorch 系列3


    一、Tensorboard的使用

    tensorboard的作用:可视化神经网络的训练过程

    '''
    1、tensorboard的使用
    2、图像变换,transform的使用
    '''
    
    from torch.utils.tensorboard import SummaryWriter
    import numpy as np
    from PIL import Image
    
    writer = SummaryWriter("logs")
    # 可以观察训练过程中不同阶段的显示情况
    image_path = "dataset/train/bees_image/16838648_415acd9e3f.jpg"
    # 图片类型转换
    img_PIL = Image.open(image_path)
    img_array = np.array(img_PIL)
    writer.add_image("test",img_array,2,dataformats='HWC')
    # y=x
    for i in range(100):
        writer.add_scalar("y=2x",2*i,i)
    
    writer.close()
    # tensorboard --logdir=logs --port=6007
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22

    在teiminal中输入“tensorboard --logdir=logs --port=6007”(也可以使用默认端口6006)打开tensorboard界面
    在这里插入图片描述
    展示效果:
    在这里插入图片描述

    二、常见的Transforms

    1、ToTensor

    通过Image.open()打开的图片是PIL类型的,转换为Tensor类型:
    ToTensor()能够把灰度范围从0-255变换到0-1之间

    from torchvision import transforms
    from PIL import Image
    from torch.utils.tensorboard import SummaryWriter
    
    writer = SummaryWriter("logs")
    img = Image.open("dataset/train/ants_image/0013035.jpg")
    
    # ToTensor
    trans_totensor = transforms.ToTensor()
    img_tensor = trans_totensor(img)
    writer.add_image("Tensor_img",img_tensor)
    writer.close()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12

    在这里插入图片描述

    2、Normalize

    用均值和标准差归一化张量图像
    input[channel] = (input[channel]-mean[channel])/std[channel]
    即:(input-0.5)/0.5 = 2*input -1
    举例:2 x 0.3137 - 1 = -0.3725

    # Normalize归一化
    # input[channel] = (input[channel]-mean[channel])/std[channel]
    # (input-0.5)/0.5 = 2*input -1
    # input[0,1]  result[-1,1]
    print(img_tensor[0][0][0])  # tensor(0.3137)
    # trans_norm = transforms.Normalize([0.5,0.5,0.5],[0.5,0.5,0.5])
    # trans_norm = transforms.Normalize([1,3,5],[3,2,1])
    trans_norm = transforms.Normalize([6,3,2],[9,3,5])
    img_norm = trans_norm(img_tensor)
    print(img_norm[0][0][0])  # tensor(-0.3725)
    writer.add_image("Normalize",img_norm,2)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11

    在这里插入图片描述

    3、Resize

    更改图片尺寸,把给定的图片resize到given size;输入图像应该是PIL image类型

    # Resize
    print(img.size)
    trans_resize = transforms.Resize((512,512))
    # img PIL -> resize -> img_resize PIL
    img_resize = trans_resize(img)
    # img_resize PIL -> totensor -> img_reszie tensor
    img_resize = trans_totensor(img_resize)
    writer.add_image("Resize",img_resize,0)
    # print(img_resize)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9

    原来图片尺寸为(768, 512),压缩后变为(512,512)
    在这里插入图片描述

    4、Compose

    Compose的主要作用是串联多个图片变换,其中的参数必须是一个列表,数据需要是Transforms类型

    # Compose - resize - 2
    trans_resize_2 = transforms.Resize(512)
    # PIL -> PIL -> tensor
    trans_compose = transforms.Compose([trans_resize_2,trans_totensor])
    img_resize_2 = trans_compose(img)
    writer.add_image("Resize",img_resize_2,1)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    在这里插入图片描述
    在这里插入图片描述

    5、RandomCrop

    对图片进行随机裁剪

    # RandomCrop
    trans_random = transforms.RandomCrop(512)
    trans_compose_2 = transforms.Compose([trans_random,trans_totensor])
    for i in range(10):
        img_crop = trans_compose_2(img)
        writer.add_image("RandomCrop",img_crop,i)
    writer.close()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    在这里插入图片描述
    在这里插入图片描述

    三、torchvision中的数据集使用

    CIFAR10数据集

    import torchvision
    from torch.utils.tensorboard import SummaryWriter
    
    dataset_transform = torchvision.transforms.Compose([
        torchvision.transforms.ToTensor()
    ])
    
    train_set = torchvision.datasets.CIFAR10(root="./dataset", train=True, transform=dataset_transform, download=True)
    test_set = torchvision.datasets.CIFAR10(root="./dataset", train=False, transform=dataset_transform, download=True)
    
    # print(test_set[0])
    # print(test_set.classes)
    #
    # img, target = test_set[0]
    # print(img)
    # print(target)
    # print(test_set.classes[target])
    # img.show()
    
    print(test_set[0])
    
    writer = SummaryWriter("p10")
    for i in range(10):
        img, target = test_set[i]
        writer.add_image("test_set", img, i)
    
    writer.close()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27

    在这里插入图片描述

    四、dataloader的使用

    PyTorch 提供了两个数据集管理相关的类torch.utils.data.DataLoader/Dataset。其中,Dataset用于存储样本及其对应的标签,而DataLoader则提供了一个高效的迭代器,可以实现对Dataset的数据内容进行高效检索。

    dataset

    • root :是存储训练/测试数据的路径,
    • train :指定训练或测试数据集,
    • download=True :如果数据不可用,则从 Internet 下载数据root。
    • transform和target_transform :指定特征和标签的格式转换方法,以适配网络计算

    dataloader

    • dataset: Dataset 类,决定数据从哪里读取以及如何读取
    • batch_size: 批大小
    • shuffle: 每个 epoch 是否乱序
    • num_works: 是否多进程读取数据
    • drop_last: 当样本数不能被 batchsize 整除时,是否舍弃最后一批数据
    import torchvision
    
    # 准备的测试数据集
    from torch.utils.data import DataLoader
    from torch.utils.tensorboard import SummaryWriter
    
    test_data = torchvision.datasets.CIFAR10("./dataset", train=False, transform=torchvision.transforms.ToTensor())
    
    test_loader = DataLoader(dataset=test_data, batch_size=64, shuffle=True, num_workers=0, drop_last=True)
    
    # 测试数据集中第一张图片及target
    img, target = test_data[0]
    print(img.shape)
    print(target)
    
    writer = SummaryWriter("dataloader")
    for epoch in range(2):
        step = 0
        for data in test_loader:
            imgs, targets = data
            # print(imgs.shape)
            # print(targets)
            writer.add_images("Epoch: {}".format(epoch), imgs, step)
            step = step + 1
    
    writer.close()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26

    drop_last=True
    在这里插入图片描述
    drop_last=False
    在这里插入图片描述

    五、神经网络基本骨架-nn.Module

    import torch
    from torch import nn
    
    
    class Tudui(nn.Module):
        def __init__(self):
            super().__init__()
    
        def forward(self, input):
            output = input + 1
            return output
    
    
    tudui = Tudui()
    x = torch.tensor(1.0)
    output = tudui(x)
    print(output)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17

    运行结果:
    在这里插入图片描述

    六、神经网络–卷积层

    import torch
    import torch.nn.functional as F
    
    input = torch.tensor([[1, 2, 0, 3, 1],
                          [0, 1, 2, 3, 1],
                          [1, 2, 1, 0, 0],
                          [5, 2, 3, 1, 1],
                          [2, 1, 0, 1, 1]])
    
    kernel = torch.tensor([[1, 2, 1],
                           [0, 1, 0],
                           [2, 1, 0]])
    
    input = torch.reshape(input, (1, 1, 5, 5))
    kernel = torch.reshape(kernel, (1, 1, 3, 3))
    
    print(input.shape)
    print(kernel.shape)
    
    output = F.conv2d(input, kernel, stride=1)
    print(output)
    
    output2 = F.conv2d(input, kernel, stride=2)
    print(output2)
    
    output3 = F.conv2d(input, kernel, stride=1, padding=1)
    print(output3)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27

    运行结果:
    在这里插入图片描述
    实例:

    import torch
    import torchvision
    from torch import nn
    from torch.nn import Conv2d
    from torch.utils.data import DataLoader
    from torch.utils.tensorboard import SummaryWriter
    
    dataset = torchvision.datasets.CIFAR10("dataset", train=False, transform=torchvision.transforms.ToTensor(),
                                           download=True)
    dataloader = DataLoader(dataset, batch_size=64)
    
    class Tudui(nn.Module):
        def __init__(self):
            super(Tudui, self).__init__()
            self.conv1 = Conv2d(in_channels=3, out_channels=6, kernel_size=3, stride=1, padding=0)
    
        def forward(self, x):
            x = self.conv1(x)
            return x
    
    tudui = Tudui()
    
    writer = SummaryWriter("logs")
    
    step = 0
    for data in dataloader:
        imgs, targets = data
        output = tudui(imgs)
        # print(imgs.shape)
        # print(output.shape)
        # 输入的大小:torch.Size([64, 3, 32, 32])
        writer.add_images("input", imgs, step)
        # 经过卷积后输出的大小:torch.Size([64, 6, 30, 30])  -> [xxx, 3, 30, 30]
    
        # 刚开始xxx未知时,先用-1
        output = torch.reshape(output, (-1, 3, 30, 30))
        writer.add_images("output", output, step)
    
        step = step + 1
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39

    运行结果:
    在这里插入图片描述
    在这里插入图片描述

    七、神经网络–最大池化的使用

    Pytorch官方文档

    在这里插入图片描述
    最大池化的目的:保留输入的特征,同时把数据量减小

    import torch
    from torch import nn
    from torch.nn import MaxPool2d
    
    input = torch.tensor([[1,2,0,3,1],
                          [0,1,2,3,1],
                          [1,2,1,0,0],
                          [5,2,3,1,1],
                          [2,1,0,1,1]],dtype=torch.float32)
    input = torch.reshape(input,(-1,1,5,5))
    print(input.shape)
    
    class Tudui(nn.Module):
        def __init__(self):
            super(Tudui, self).__init__()
            self.maxpool1 = MaxPool2d(kernel_size=3, ceil_mode=True)
    
        def forward(self, input):
            output = self.maxpool1(input)
            return output
    
    tudui = Tudui()
    output = tudui(input)
    print(output)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24

    运行结果:
    在这里插入图片描述
    实例:

    import torch
    import torchvision
    from torch import nn
    from torch.nn import MaxPool2d
    from torch.utils.data import DataLoader
    from torch.utils.tensorboard import SummaryWriter
    
    dataset = torchvision.datasets.CIFAR10("dataset", train=False, download=True,
                                           transform=torchvision.transforms.ToTensor())
    
    dataloader = DataLoader(dataset, batch_size=64)
    
    class Tudui(nn.Module):
        def __init__(self):
            super(Tudui, self).__init__()
            self.maxpool1 = MaxPool2d(kernel_size=3, ceil_mode=False)
    
        def forward(self, input):
            output = self.maxpool1(input)
            return output
    
    tudui = Tudui()
    
    writer = SummaryWriter("logs_maxpool")
    step = 0
    
    for data in dataloader:
        imgs, targets = data
        writer.add_images("input", imgs, step)
        output = tudui(imgs)
        writer.add_images("output", output, step)
        step = step + 1
    
    writer.close()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34

    运行结果:
    在这里插入图片描述
    在这里插入图片描述

  • 相关阅读:
    【版本2020.03】使用idea导入maven项目
    数据可视化——根据提供的数据,将数据经过处理后以折线图的形式展现
    【记录】数据透视表
    Acwing 2944. 回家的路
    JD-H5开发
    南京财经大学计算机考研资料汇总
    方案:餐厅饭店AI智能视频监控可视化监管系统搭建方案
    【LeetCode】【剑指offer】【圆圈中最后剩下的数字】
    企业级的商用远程控制软件有哪些
    【LeetCode刷题-树】-- 572.另一棵树的子树
  • 原文地址:https://blog.csdn.net/lyz1_2_3/article/details/128004359