码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • CV | 360BEV: Panoramic Semantic Mapping for Indoor Bird‘s-Eye View理解


    本文主要是对于论文360BEV的解读和实现。

    Paper:2023.03_360BEV: Panoramic Semantic Mapping for Indoor Bird's-Eye View

    360BEV:室内鸟瞰全景语义映射

    arxiv.org/pdf/2303.11910

    Code:jamycheung/360BEV: Repository of 360BEV (github.com)

    Demo:360BEV (jamycheung.github.io)

     

    论文概述

    这篇论文提出了一种名为360BEV的专用解决方案,用于从鸟瞰图像对室内场景进行全景语义映射。主要贡献包括:

    1. 提出了一种从全景图像生成整体鸟瞰视图语义映射的方法,不依赖于窄视野图像或运动线索。
    2. 提出模型360Mapper,可以从全景图像预测语义标签和非模态语义映射。
    3. 所提出的方法在室内语义映射基准测试中取得了最佳性能,优于现有方法。

    相关工作

    基于鸟瞰图的语义分割,三种方法:

    • Early projection: Proj.→Enc.→Seg. in Fig. 2c.
    • Late projection: Enc.→Seg.→Proj. in Fig. 2d.
    • Intermediate projection: Enc.→Proj.→Seg. in Fig. 2e

    模型:360BEV

    这里根据原有的数据集,生成了新的数据集

    360Mapper框架包括四个步骤:

    1. 基于Transformer的骨干网络从全景图像中提取特征。
    2. 逆向径向投影(IRP)模块通过深度生成的参考点得到一个2D索引。
    3. 360度注意力模块通过2D索引增强前视图特征,并根据BEV查询生成偏移量,以消除失真效应。
    4. 轻量级解码器解析投影的特征图,预测语义BEV地图。

    实验

    4块A100GPU

    50epoch

    优化器:AdamW

    批次:4

    数据集:360FV-Matterport 和Stanford2D3D输入是512×1024

    项目实现

    设置环境

    1. git clone https://github.com/jamycheung/360BEV
    2. conda create -n 360BEV python=3.8
    3. conda activate 360BEV
    4. cd 360BEV
    5. # 安装mmedtection
    6. # conda create -n open-mmlab python=3.7 -y
    7. # conda activate open-mmlab
    8. # conda install pytorch torchvision -c pytorch
    9. # or conda install pytorch=1.3.1 cudatoolkit=9.2 torchvision=0.4.2 -c pytorch
    10. # 克隆项目
    11. git clone https://github.com/open-mmlab/mmdetection.git
    12. cd mmdetection
    13. pip install -r requirements/build.txt
    14. pip install "git+https://github.com/cocodataset/cocoapi.git#subdirectory=PythonAPI"
    15. pip install -v -e .
    16. cd..
    17. pip install -r requirements.txt

    数据准备

    数据集使用Stanford2D3D和Matterport3D

    作者提供了谷歌drive的下载地址:360BEV-Stanford,360BEV-Matterport ,360FV-Matterport

    这里使用最小的

    解压后如图,分为训练和测试 

     

    数据格式处理如下

    数据集全景(Scene)房间(Room)Frame种类(Category)
    train52151,04013
    val15537313
    360BEV-Stanford62701,41313
    train61--7,82920
    val7--77220
    test18--2,01420
    360BEV-Matterport862,03010,61520

    1. data/
    2. ├── Stanford2D3D
    3. │ └── area_[1|2|3|4|5a|5b|6]
    4. │ ├── rgb/*png
    5. │ └── semantic/*png
    6. │
    7. ├── 360BEV-Stanford
    8. │ ├── training
    9. │ └── valid
    10. │ ├── data_base_with_rotationz_realdepth/*h5
    11. │ └── ground_truth/*h5
    12. │
    13. ├── 360BEV-Matterport
    14. │ ├── training
    15. │ ├── testing
    16. │ └── valid
    17. │ ├── smnet_training_data_zteng/*h5
    18. │ └── topdown_gt_real_height/*h5
    19. │
    20. └── 360FV-Matterport
    21. ├── 17DRP5sb8fy
    22. │ ├── depth/*png
    23. │ ├── rgb/*png
    24. │ └── semantic/*png
    25. └── ...

    训练

    1. # 360BEV_Matterport
    2. python train_360BEV_Matterport.py --config configs/model_360BEV_mp3d.yml
    3. # 360BEV_S2d3d
    4. python train_360BEV_S2d3d.py --config configs/model_360BEV_s2d3d.yml
    5. # Stanford2D3D
    6. python train_pano_360Attention_S2d3d.py --config configs/model_fv_s2d3d.yml
    7. # 360FV-Matterport
    8. python train_pano_360Attention_Matterport.py --config configs/model_fv_mp3d.yml

    测试

    1. # 360BEV_Matterport
    2. python test_360BEV_Matterport.py --config configs/model_360BEV_mp3d.yml
    3. # 360BEV_S2d3d
    4. python test_360BEV_S2d3d.py --config configs/model_360BEV_s2d3d.yml
    5. # Stanford2D3D
    6. python test_pano_360Attention_S2d3d.py --config configs/model_fv_s2d3d.yml
    7. # 360FV-Matterport
    8. python test_pano_360Attention_Matterport.py --config configs/model_fv_mp3d.yml

    代码解析

    论文以transformer为骨干网络提取特征,transformer.py在

    1. # 初始化
    2. generate feature
    3. FPN output feature maps
    4. # 从transformer提取特征后,
    5. 更新bev的高,宽,以及位置

    疑问与解答

    Q1:在BEV中,摄像头是固定,还是固定可环视?输入的值的区别是什么?

    训练时分为俩个阶段

    Q2:语义分割中前景,中景,从上到写视角是指什么 意思?

    在语义分割中,我们常用以下几个视角来描述图像的不同部分:

    1. 前景:前景是图像中最显著的部分,通常是我们关心的目标物体。在语义分割中,前景指的是被标记为特定类别(如人、车、树等)的区域。

    2. 中景:中景是介于前景和背景之间的部分。在拍摄和视觉艺术中,中景通常是指人物的膝盖以上的取景范围。在语义分割中,中景可能包括一些次要目标或环境元素,但不如前景那么显著。

    3. 从上到下视角:这是一种拍摄或观察图像的方式。从上到下视角意味着我们以一种俯视的方式来看待场景,就像我们站在高处往下看一样。这种视角可以用于强调环境、布局或整体结构。

    参考文献

    【1】Joint 2D-3D-Semantic Data for Indoor Scene Understanding 1702.01105 (arxiv.org)

    【2】360BEV: Panoramic Semantic Mapping for Indoor Bird's-Eye View,arXiv - CS - Computer Vision and Pattern Recognition - X-MOL【3】几种流行的视觉bev算法通俗对比介绍_bev视觉缺点-CSDN博客

    【4】四. 基于环视Camera的BEV感知算法-环视背景介绍_remote camera 环视摄像头-CSDN博客

    【5】(BEV综述)Delving into the Devils of Bird’s-eye-view Perception: A Review, Evaluation and Recipe - 哈哈哈喽喽喽 - 博客园 (cnblogs.com)

    【6】arxiv-sanity (arxiv-sanity-lite.com)

    【7】vasgaowei/BEV-Perception: Bird's Eye View Perception (github.com)

    References

  • 相关阅读:
    【单片机毕业设计】【mcuclub-jj-006】基于单片机的指纹电子密码锁的设计
    devops-4:Jenkins基于k8s cloud和docker cloud动态增减节点
    Jenkins 持续集成:Linux 系统 两台机器互相免密登录
    【WebLogic】Oracle发布2022年第四季度中间件安全公告
    使用Oracle IMP导入数据
    https域名下 请求http图片链接 被自动变成https请求
    圣诞旺季来临,流量突破30亿!赛盈分销双重福利加码,助力卖家抢夺旺季流量,爆单不费力!
    Rethinking Minimal Sufficient Representation in Contrastive Learning 论文解读和感想
    【软件】Ubuntu16.04升级git最新版,升级python到3.7.
    docker 安装 RabbitMQ & 安装 rabbitmq_delayed_message_exchange插件
  • 原文地址:https://blog.csdn.net/weixin_44649780/article/details/138204428
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号