自动驾驶|3D目标检测：PointFusion

任乾

分类：自动驾驶

发布时间 2022.09.07阅读数 2567 评论数 0

论文题目：PointFusion: Deep Sensor Fusion for 3D Bounding Box Estimation

一、整体介绍

这篇论文所提出的网络模型都很简洁，作者的文笔也很清晰，所以我们就不废话了，都在图里了

图中A、B、C、D、E都标好了，我们逐个讲解就是了

A）使用PointNet提取点云的特征，包括全局特征和单个点的特征

B）使用ResNet提取图像特征

C）全局特征和单个点特征一起融合，预测边界框，该方法在文章中被称为“dense”

D）只融合全局特征，预测边界框，该方法在文章中被称为“global”

E）就是边界框喽

有的细心的读者会问，为啥要有C和D两个结构嘞？

其实实际使用中，作者只用了C这一个结构，D的存在只是为了和它做对比，通过对比实验效果证明在网络中加入单个点的特征会更有效。

二、细节补充

下面补充一些细节吧

对PointNet的改进

主要包括两方面：

1）去掉了batch normalization层，作者认为能够边界框的预测精度

2）把T-net改成了旋转矩阵Rc

2. 对比了两种损失函数

这两种损失函数是：

1）有监督的损失函数

2）无监督的损失函数

三、实验结果

最后看看实验结果，从论文里我们能够看出，这个作者喜欢在解决一个问题的时候提出多个方法，然后通过实验结果来对比他们的好坏，虽然最后只会选择一个，但是其他方法作为对比放在那里会更有说服力。

下面我们先看看作者都列出了哪些对比选项：

1）final：网络用dense（还记得dense和global吗，不记得就网上翻哦），损失函数用无监督

2）dense：网络用dense，损失函数用有监督

3）dense-no-im：它应该叫denso no image，谜底就在谜面上，就是dense+有监督，但是不输入图像，只用点云

4）global：就是global呀

5）global-no-im：global不加图像

6）rgb-d：这个就有意思了，它把PointNet用一个“generic CNN”替换掉，把输入改成rgb-d的彩色深度图，用来对比

下面就给出实验结果

这张表内容太多了，我们得分析一下，然后给出结论才行：

1）global和global-no-im对比，说明图像有用（只在mod和hard中，不清楚easy为啥更差）

2）global和dense对比，说明单点的特征有用

3）dense和final对比，说明无监督损失函数比有监督损失函数好

4）final(all-class)和MV3D对比，各有优劣吧，easy和mod更好，但是hard更差

机器视觉目标检测 PointFusion

打赏 0

上一篇：自动驾驶|3D目标检测：F-PointNet(一)

下一篇：自动驾驶|3D目标检测：VoxelNet(一)

自动驾驶|3D目标检测：PointFusion

任乾

一、整体介绍

二、细节补充

三、实验结果

为你推荐

史上最简SLAM零基础解读(8.1) - 旋转矩阵、旋转向量、欧拉角推导与相互转换

CUDA入门和网络加速学习(三)

自动泊车功能的车位检测——一种有效的端到端车位检测模型算法文章分析

点云地面分割算法——Fast Segmentation of 3D Point Clouds for Ground Vehicles文章分析（二）

3D目标检测之数据集

经典文献阅读之--FastFlowNet(轻量光流估计)

关于作者

任乾

65

0

6

3

多传感器融合定位理论基础（一）：开篇

ORB SLAM2源码解读(十一)：LoopClosing类

自动驾驶|车道线检测：SCNN（一）

相关推荐

Scan Context回环检测解读和使用

离线电子地图路径规划

自动驾驶中camera方案（二）MIPI-CSI2详解

精选经典文献阅读之--Vision-based Large-scale 3D Semantic Mapping...(自动驾驶的大规模三维视觉语义地图的构建)

精选ROS2学习笔记（一）-- ROS2安装

精选经典文献阅读之--RaLF(激光雷达地图中基于流的全局和度量雷达定位)

热门泡泡

30积分失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

自动驾驶|3D目标检测：PointFusion

任乾

一、整体介绍

二、细节补充

三、实验结果

为你推荐

史上最简SLAM零基础解读(8.1) - 旋转矩阵、旋转向量、欧拉角推导与相互转换

CUDA入门和网络加速学习(三)

自动泊车功能的车位检测——一种有效的端到端车位检测模型算法文章分析

点云地面分割算法——Fast Segmentation of 3D Point Clouds for Ground Vehicles文章分析（二）

3D目标检测之数据集

经典文献阅读之--FastFlowNet(轻量光流估计)

评论（0）

关于作者

任乾

65

0

6

3

多传感器融合定位理论基础（一）：开篇

ORB SLAM2源码解读(十一)：LoopClosing类

自动驾驶|车道线检测：SCNN（一）

相关推荐

Scan Context回环检测解读和使用

离线电子地图路径规划

自动驾驶中camera方案（二）MIPI-CSI2详解

精选经典文献阅读之--Vision-based Large-scale 3D Semantic Mapping...(自动驾驶的大规模三维视觉语义地图的构建)

精选ROS2学习笔记（一）-- ROS2安装

精选经典文献阅读之--RaLF(激光雷达地图中基于流的全局和度量雷达定位)

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板