• NeuralRecon拜读:单目视频实时连贯三维重建


    CVPR2021:NeuralRecon: Real-Time Coherent 3D Reconstruction from Monocular Video

    Code:https://github.com/zju3dv/NeuralRecon

    传统基于深度图重建方法:

    • depth map转换为point clouds
    • 估计三维曲面位置并生成重建的网格
      • 在离线MVS pipline中,常使用Poisson reconstruction 和Delaunay triagulation 通常用于实现这一目的。

    基于TSDF的深度图融合方法:

    • 估计的深度图使用多视图一致性和时间平滑度等标准进行过滤
    • 融合为TSDF volumes
    • 利用MarchingCubes算法将融合后的TSDF volumes重建mesh

    存在的问题:

    • 单视图深度估计scale-factor容易变,不同视图的深度不一致,使得重建分层或者分散
    • 多帧视图重叠区域的冗余重建计算

    在这里插入图片描述

    NeuralRecon的方案:

    • 通过神经网络为每个视频片段直接生成TSDF volumes
    • 然后使用基于gated recurrent units的TSDF融合模块引导网络融合前后片段

    这种设计允许网络在顺序重建曲面时捕获3D曲面的局部平滑度先验和全局形状先验,从而实现精确、一致和实时的曲面重建
    在这里插入图片描述

    理论基础:Truncated Signed Distance Function (TSDF) volume

    使用稀疏3D卷积预测离散TSDF volume

    重建方法的前提:

    • 输入:已知图像和对应的内外参
    • 监督:
      • binary cross-entropy (BCE) loss: ground-truth occupancy values
      • SDF loss: ground-truth SDF values.

    关键帧选择:

    • 当新传入帧的相对平移大于 t m a x t_{max} tmax且相对旋转角大于 R m a x R_{max} Rmax,则选择该帧作为关键帧
    • 每N个关键帧视为local fragment
    • 基于视图中固定的最大深度范围 d m a x d_{max} dmax(文中为3m)计算包围所有关键帧视锥体的立方形fragment bounding volume (FBV)
    • 在重建每个fragment时,只考虑FBV内的区域

    边重建边融合:

    • 重建local fragment局部的TSDF volumes
    • 使用学习的方法将局部TSDF融入全局TSDF volumes

    在这里插入图片描述

    Feature volume构建:

    • ImageNet预训练的MnasNet_encoder提取feature
    • 各级feature反投影到3D feature volume
    • feature volume按体素可见性权重融合不同视图的feature:
      • 体素可见性权重为local fragment中可以观察到体素的视图数
        在这里插入图片描述

    Coarse-to-fine的TSDF重建,逐步细化各层TSDF

    • 3D sparse convolution(TorchSpase)处理3D feature volume

    • MLP sigmoid预测TSDF截断距离λ的置信度 o o o 和 SDF-value x x x

      • o o o 小于阈值视为空,稀疏化
    • 稀疏化后将TSDF volume上采样并级联下一层的feature

    • 通过GRU Fusion 模块

    在这里插入图片描述
    GRU Fusion模块:
    为了保证相邻fragment重建的一致性,以过去fragment为基础

    • 在每一层feature volume通过sparse 3D conv获得3D geometric features
    • 将该3D geometric features与全局volume对应区域融合成当前的参数volume
    • 再将当前参数volume更新回全局volume
    • 当前参数体通过MLP得到当前TSDF volume
    • 更新Global TSDF Volume在最后一层的GRU模块完成
      在这里插入图片描述

    实验用的是有ground truth的室内数据集,效果如下:在这里插入图片描述

  • 相关阅读:
    3D激光SLAM:LeGO-LOAM论文解读---硬件系统部分
    【RocketMq 系列】RocketMq 消息重试机制、死信队列
    Python 能力提升之这 9 个 Python 特性被严重低估了
    java计算机毕业设计付费自习室管理系统MyBatis+系统+LW文档+源码+调试部署
    3. Spring源码篇之ComponentScan
    欣赏绍兴的美景,感受OLED透明拼接屏带来的视觉盛宴
    【Linux】Linux的基本指令(Linux入门、用户的创建和切换)
    多个checkpoint 的参数进行平均
    以自主技术跃进的综合冲压的顶级制造商
    开源流式湖仓服务 Arctic 详解:并非另一套 Table Format
  • 原文地址:https://blog.csdn.net/weixin_44671418/article/details/125511541