精选神经辐射场（Neural Radiance Field，NeRF）的简单介绍

byzy

发布时间 2023.12.04阅读数 1213 评论数 0

1.概述

神经场是一种神经网络，其输入为坐标，输出为坐标对应点的某个属性。
神经辐射场（NeRF）模型是一种新视图合成方法，它使用体积网格渲染，通过MLP进行隐式神经场景表达，以学习3D场景的几何和照明。
应用：照片编辑、3D表明提取、人体建模、3D表达和视图合成等。
特点：模型自监督。对于一个场景，只需要多视图图像及其姿态，而无需3D或深度监督。

2.NeRF模型

NeRF模型将3D场景表达为用神经网络表示的辐射场。辐射场描述了各点在各视角下的颜色和密度。即
F(x,θ,ϕ)→(c,σ)
其中x为点的3D坐标，(θ,ϕ)为视线的水平角与俯仰角，c表示颜色，σ表示体积网格密度。该函数使用MLP（记为F Θ）进行近似。(θ,ϕ)也可表达为3维的单位方向向量d。
该表达需要满足多视图一致性，即σ（场景的内容）与视角无关，而c与坐标和视角均相关。通常来说，会设计两个MLP，第一个MLP输入x，输出σ与高维特征向量h：
σ,h=σ-MLP(x)
高维特征向量h与视线方向d拼接后输入第二个MLP得到c：
c=c-MLP([h;d])
由于密度和颜色都完全被MLP表达，因此这种方法被称为隐式场景表达。

3.新视图合成

1.对于待合成图像的每个像素，使用相机射线穿过场景并生成采样点（上图(a)）。
2.对每个采样点，使用射线方向和采样位置，输入NeRF MLP计算局部颜色与密度（上图(a)与(b)之间的连接处）。
3.使用体积网格渲染，从采样点的色彩和密度生成图像。

4. 体积网格渲染

设相机射线为r(t)=o+td，其中o为相机位置，d为射线方向。则可按下式得到色彩C(r)：

其中σ(r(t))和c(r(t)， $d)$ 为射线 $r (t)$ 处的体积网格密度和颜色。

T(t)为累积透明度，表示射线从t1到t不被拦截的概率

通过追踪待合成图像的像素对应的相机射线，可计算积分。但是通常会通过分层抽样法来计算其近似值。具体来说，射线会被分为等长的N段，然后在各段内均匀抽样一个点，并用求和近似上面的积分：

其中δi为采样点

5. 期望深度计算

期望的深度可使用积累透明度沿射线计算：

上式同样可使用求和近似：

某些深度正则化方法会使用期望深度将密度限制为类似（在场景表面取峰值的）delta函数的形式，或是保证深度的平滑性。

6.损失函数

对每个像素，考虑其平方误差光度损失，以优化MLP参数。总损失为：

其中Cgt(r)是与射线r关联像素的真实颜色，R是待合成图像的相机射线集合。

7.位置编码

NeRF模型通常会使用位置编码，因其有利于渲染图像的细节重建。原始的位置编码γ是在点x的坐标（归一化到[−1,1]）以及射线单位方向向量

其中N为用户定义的维度参数。

目标检测深度学习计算机视觉 NeRF 神经辐射场

转载原出处：https://blog.csdn.net/weixin_45657478/article/details/132583792?spm=1001.2014.3001.5502

打赏 0

上一篇：基于MMDetection3D框架编写的3D目标检测程序的一般运行流程（数据流动情况）

下一篇：MMDetection3D代码中的常见函数简单介绍（build_xxx、multi_apply）

精选神经辐射场（Neural Radiance Field，NeRF）的简单介绍

byzy

1.概述

2.NeRF模型

3.新视图合成

4. 体积网格渲染

5. 期望深度计算

6.损失函数

7.位置编码

为你推荐

Robomaster视觉组成长之路

数字图像处理（作业四）——边缘表达

[OpenCV]GOTURN目标跟踪

CVPR2020: 集成全局和局部特征的端到端一阶段停车位检测网络

如何将pkl格式转换为csv格式

Dlib初入门：实现人脸特征点检测（附CMake安装教程）

关于作者

byzy

31

0

0

2

复制粘贴数据增广/GT增广与mmdetection3d中的实现（dbsample）

以UVTR代码为例学习基于MMDetection3D库相关代码的阅读方法

BEVDepth: Acquisition of Reliable Depth for Multi-view 3D Object Detection 论文笔记

相关推荐

M²BEV: Multi-Camera Joint 3D Detection and Segmentation with Unified Bird’s-Eye View Representation

精选地平线上的Go1机器狗--第二期相机移植以及使用

ScaledYOLOv4实践：手把手教物体检测——ScaleYOLOv4-large

数字图像处理之简单 JPEG图片压缩

机器视觉实验三工件尺寸和面积测量

MATLAB学习笔记使用马氏距离的RGB图像聚类

热门泡泡

30积分失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

精选神经辐射场（Neural Radiance Field，NeRF）的简单介绍

byzy

1.概述

2.NeRF模型

3.新视图合成

4. 体积网格渲染

5. 期望深度计算

6.损失函数

7.位置编码

为你推荐

Robomaster视觉组成长之路

数字图像处理（作业四）——边缘表达

[OpenCV]GOTURN目标跟踪

CVPR2020: 集成全局和局部特征的端到端一阶段停车位检测网络

如何将pkl格式转换为csv格式

Dlib初入门：实现人脸特征点检测（附CMake安装教程）

评论（0）

关于作者

byzy

31

0

0

2

复制粘贴数据增广/GT增广与mmdetection3d中的实现（dbsample）

以UVTR代码为例学习基于MMDetection3D库相关代码的阅读方法

BEVDepth: Acquisition of Reliable Depth for Multi-view 3D Object Detection 论文笔记

相关推荐

M²BEV: Multi-Camera Joint 3D Detection and Segmentation with Unified Bird’s-Eye View Representation

精选地平线上的Go1机器狗--第二期相机移植以及使用

ScaledYOLOv4实践：手把手教物体检测——ScaleYOLOv4-large

数字图像处理之简单 JPEG图片压缩

机器视觉实验三 工件尺寸和面积测量

MATLAB学习笔记 使用马氏距离的RGB图像聚类

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

机器视觉实验三工件尺寸和面积测量

MATLAB学习笔记使用马氏距离的RGB图像聚类

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板