基于传统方法的单目深度估计

Tom Hardy

发布时间 2024.04.19阅读数 157 评论数 0

如果想要深入学习单目深度估计方面的知识，可以关注我们工坊推出的课程：

单目深度估计方法：算法梳理与代码实现

单目深度估计一直以来都是计算机视觉领域中的一项非常具有挑战的难题。随着计算机技术、数字图像处理算法和深度学习等技术的发展，常用的单目深度估计算法大概可以分为以下几类：基于线索的和机器学习的传统方法、基于有监督的深度学习方法和基于无监督的深度学习方法。

今天和大家重点介绍一下三个传统方法的基本原理，包括：马尔科夫随机场（Markov random field, MRF）、运动恢复结构（Structure from motion, SFM）、阴影恢复形状(Shape from Shading)。

1、马尔可夫随机场

在基于有监督学习的图像深度估计算法中，通常以图像中单个像素或者区域作为深度估计的基本单元，并且某一个像素或区域的深度与相邻像素或区域的深度存在关联。对这种上下文相关的约束关系, 一般使用马尔可夫随机场(Markov random field, MRF) 或条件随机场(conditional random field, CRF)来建模，描述一个像素或区域的深度与其相邻像素或区域深度间的关系。

在进行深度估计时，每个像素或区域的位置上存在随机场中的一个随机变量，它可以从深度值的集合中进行取值，所以，深度估计问题的本质就是找到最可能符合真实场景深度的一个深度值的配置。

2、运功恢复结构（SFM）

SFM，全称structure from motion，是通过相机的移动来确定目标的空间和几何关系的方法，通俗的说法就是利用视频中不同帧之间的二维特征点的对应关系同时恢复三维结构和相机的内外参，是三维重建中的一种常见方法，也是深度学习之前深度估计的经典方法。

SFM首先挑选合适的无序图片，从这些图像中提取出相机的焦距信息，然后采用SIFT等算法对图像进行特征提取，并计算两张图像特征点之间的欧氏距离进行特征点匹配，从而找到达到要求的图像对。

对于每一个图像匹配对，通过计算对极几何，估计F矩阵并通过ransac算法优化改善匹配对。如果有特征点可以在这样的匹配对中链式地传递下去，一直被检测到，就可以形成特征轨迹。

SFM关键在于Bundle Adjustment（BA）过程。首先对初始化选择的两幅图片进行第一次BA，而后循环添加新的图片进行BA，直到没有可以继续添加的图片，BA结束。得到相机估计参数和场景几何信息，即稀疏的3D点云。

3、阴影恢复形状（SFS）

Shape From Shading是一种从单幅图像中计算一个表面三维形状的方法。与大多数其他三维重建问题（例如立体和光度立体）相反，在Shape From Shading问题中，我们只使用单个图像。

SFS根据一张物体表面的黑白图像的亮度来计算该表面的三维形状，如下图所示。

众所周知Shape From Shading是病态（ill-posed）问题。下图展示了一种凹凸歧义性，这里的歧义是由于照明参数的估计发生了变化。我们可以看到两个陨石坑，一小一大，但如果我们想象光源在图片的底部而不是顶部，我们可以将这些陨石坑变成火山。

考虑到这些困难，我们因此在这里假设光源、表面反射率和相机的所有参数都是已知的。我们利用灰度图片的亮度信息和亮度生成原理，求出每个像素在3D空间中的表面法向量，再根据法向量求得深度信息。

最后的结果如下图所示，

备注：作者也是我们「3D视觉从入门到精通」特邀嘉宾：一个超干货的3D视觉学习社区

原创征稿

初衷
3D视觉工坊是基于优质原创文章的自媒体平台，创始人和合伙人致力于发布3D视觉领域最干货的文章，然而少数人的力量毕竟有限，知识盲区和领域漏洞依然存在。为了能够更好地展示领域知识，现向全体粉丝以及阅读者征稿，如果您的文章是3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、硬件选型、求职分享等方向，欢迎砸稿过来~文章内容可以为paper reading、资源总结、项目实战总结等形式，公众号将会对每一个投稿者提供相应的稿费，我们支持知识有价！

转自以下公众号

人工智能深度学习计算机视觉深度估计

转载原出处：

打赏 0

上一篇：ubuntu16.04下安装配置caffe2和detectron（亲测有效，非常简单）

下一篇：深度学习模型部署简要介绍

基于传统方法的单目深度估计

Tom Hardy

单目深度估计方法：算法梳理与代码实现

1、马尔可夫随机场

2、运功恢复结构（SFM）

3、阴影恢复形状（SFS）

为你推荐

Cesium学习笔记9——鼠标交互绘制

XG-robot四驱四转智能小车——旭日X3派系统安装及python相关环境搭建

机器人学导论—matlab练习（二）

启动gazebo时的ogre渲染引擎相关error

精选openEuler快速入门-openEuler操作系统介绍

内核双链表篇:list.h——获取链表结点数据：list_entry、list_first_entry、list_last_entry

关于作者

Tom Hardy

37

0

150

3

基于随机森林的姿态识别算法

基于2.5/3D的自主主体室内场景理解研究

3D人脸重建算法汇总

相关推荐

算法反思第一天|704.二分查找, 27.移除元素

FATFS移植 - 基于N32G4FR在SD卡(sd nand)上移植FATFS文件系统

#旭日x3派x东方红B类#（五）使用opencv基于颜色的模型识别和定位

【CUDA编程4】获取device详细信息

ROS答疑（四）——使用Kinect的功能包在18.04可以直接用吗？需要进行修改吗？

【Spring源码】SpringBoot中Spring容器bean的创建与刷新

热门泡泡

30积分失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

基于传统方法的单目深度估计

Tom Hardy

单目深度估计方法：算法梳理与代码实现

1、马尔可夫随机场

2、运功恢复结构（SFM）

3、阴影恢复形状（SFS）

为你推荐

Cesium学习笔记9——鼠标交互绘制

XG-robot四驱四转智能小车——旭日X3派系统安装及python相关环境搭建

机器人学导论—matlab练习（二）

启动gazebo时的ogre渲染引擎相关error

精选openEuler快速入门-openEuler操作系统介绍

内核双链表篇:list.h——获取链表结点数据：list_entry、list_first_entry、list_last_entry

评论（0）

关于作者

Tom Hardy

37

0

150

3

基于随机森林的姿态识别算法

基于2.5/3D的自主主体室内场景理解研究

3D人脸重建算法汇总

相关推荐

算法反思第一天|704.二分查找, 27.移除元素

FATFS移植 - 基于N32G4FR在SD卡(sd nand)上移植FATFS文件系统

#旭日x3派x东方红B类#（五）使用opencv基于颜色的模型识别和定位

【CUDA编程4】获取device详细信息

ROS答疑（四）——使用Kinect的功能包在18.04可以直接用吗？需要进行修改吗？

【Spring源码】SpringBoot中Spring容器bean的创建与刷新

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板