第五讲 机器人感知
1.机器视觉(图像校准、图像识别等)
ROS中的图像数据(二维图像)
显示图像类型
roslaunch usb_cam usb_cam-test.launch
rostopic info /usb_cam/image_raw
查看图像消息
rosmsg show sensor_msgs/Image
![](https://pic1.zhimg.com/80/v2-054eb4dff0d9fa4c769fb113658fab24_720w.jpg)
- Header:消息头,包含消息序号,时间戳和绑定坐标系
- height:图像的纵向分辨率
- width:图像的横向分辨率
- encoding:图像的编码格式,包含RGB、YUV等常用格式,不涉及图像压缩编码
- is_bigendian:图像数据的大小端存储模式
- step:一行图像数据的字节数量,作为数据的步长参数
- data:存储图像数据的数组,大小为step*height个字节
![](https://pic1.zhimg.com/80/v2-281ad8138efd59228487b52bf8443534_720w.jpg)
1080*720分辨率的摄像头产生一帧图像的数据大小是 3*1080*720=2764800字节,即2.7648MB
压缩图像消息
rosmsg show sensor_msgs/CompressedImage
![](https://pic4.zhimg.com/80/v2-246b95a47e8ddf0c7097825492c73733_720w.jpg)
- format:图像的压缩编码格式(jpeg,png,bmp)
- data:存储图像数据数组
显示点云类型
roslaunch freenet_launch freenect.launch
rostopic info /camera/depth_registered/points
查看点云消息
rosmsg show sensor_msgs/PointCloud2
![](https://pic4.zhimg.com/80/v2-78375f5d4e828584ca93536eef196b17_720w.jpg)
- height:点云图像的纵向分辨率
- width:点云图像的横向分辨率
- fields:每个点的数据类型
- is_bigendian:数据的大小端存储模式
- point_step:单点的数据字节步长
- row_step:一列数据的字节步长
- data:点云数据的存储数组,总字节大小为row_step*height
- is_dense:是否有无效点
点云单帧数据量也很大,如果使用分布式网络传输,需要考虑能否满足数据的传输要求,或者针对数据进行压缩
摄像头标定
摄像头为什么要标定
摄像头这种精密仪器对光学器件的要求较高,由于摄像头内部与外部的一些原因,生成的物体图像往往会发生畸变,为避免数据源造成的误差,需要针对摄像头的参数进行标定
安装标定功能包
sudo apt-get install ros-kinetic-camera-calibration
![](https://pic1.zhimg.com/80/v2-97207357c866d275026e93a0c8373ef0_720w.jpg)
摄像头标定流程
1.启动摄像头
roslaunch robot_vision usb_cam.launch
2.启动标定包
rosrun camera_calibration cameracalibrator.py --size 8x6 --square 0.024 image:=/usb_cam/image_raw camera:=/usb_cam
- 1.size:标定棋盘格的内部角点个数,这里使用的棋盘一共有六行,每行有8个内部角点
- 2.square:这个参数对应每个棋盘格的边长,单位是米
- 3.image和camera:设置摄像头发布的图像话题
![](https://pic1.zhimg.com/80/v2-471010ee067690da2b48abc89dba8c38_720w.jpg)
- X:标定靶在摄像头视野中的左右移动
- Y:标定靶在摄像头视野中的上下移动
- Size:标定靶在摄像头视野中的前后移动
- Skew:标定靶在摄像头视野中的倾斜转动
终端中的标定结果
![](https://pic2.zhimg.com/80/v2-a52b627752884e58bf6ce153015804d5_720w.jpg)
![](https://pic2.zhimg.com/80/v2-e3c8c06a5a38c132fd28f94365e18d35_720w.jpg)
标定结果保存路径 /tmp/calibrationdata.tar.gz
Kinect标定流程
1).启动Kinect
roslaunch robot_vision freenect.launch
2).启动彩色摄像头
rosrun camera_calibration cameracalibrator.py image:=/camera/rgb/image_raw camera:=/camera/rgb --size 8x6 --square 0.024
3).标定红外摄像头
rosrun camera_calibration cameracalibrator.py image:=/camera/ir/image_raw camera:=/camera/ir --size 8x6 --square 0.024
摄像头如何使用标定文件
![](https://pic1.zhimg.com/80/v2-3d7a67196bf0577bcc54ee60735b0664_720w.jpg)
Kinect如何使用标定文件
![](https://pic2.zhimg.com/80/v2-7562cd0b08a6c6c47c3b84921fa1f821_720w.jpg)
使用标定文件时可能产生的错误
![](https://pic1.zhimg.com/80/v2-cab57f8725aa81fca8cd6ffa2220f80c_720w.jpg)
原因:标定文件中camera_name参数与实际传感器名称不匹配
解决方法:按照警告提示的信息进行修改即可。
ROS+OpenCV应用实例(人脸识别、物体跟踪)
OpenCV:Open Source Computer Vision Library
实现了图像处理和计算机视觉方面的很多通用算法,而且对非商业应用和商业应用都是免费的
安装OpenCV
sudo apt-get install ros-kinetic-vision-opencv libopencv-dev python-opencv
![](https://pic3.zhimg.com/80/v2-71ac2ccc79cc3266b0937221832041ee_720w.jpg)
测试例程
roslaunch robot_vision usb_cam.launch
rosrun robot_vision cv_bridge_test.py
rqt_image_view
imgmsg_to_cv2();将ROS图像消息转换成OpenCV图像数据
cv2_to_imgmsg():将OpenCV格式的图像数据转换成ROS图像消息
输入参数:1).图像消息流 2).转换的图像数据格式
人脸识别流程
图像输入 输出结果
![](https://pic4.zhimg.com/80/v2-66f6d97edbcb84fa5117f9ba393b8d2b_720w.jpg)
启动人脸识别实例
roslaunch robot_vision usb_cam.launch
roslaunch robot_vision face_detector.launch
rqt_image_view
初始化部分:完成ROS节点、图像、识别参数的设置。
ROS图像回调函数:将图像转化成OpenCV的数据格式,然后预处理之后开始调用人脸识别的功能函数,最后把识别的结果发布。
人脸识别:调用OpenCV提供的人脸识别接口,与数据库中的人脸特征进行匹配。
![](https://pic1.zhimg.com/80/v2-39f8f2276e148659660341559af28a98_720w.jpg)
启动物体跟踪实例
roslaunch robot_vision usb_cam.launch
roslaunch robot_vision motion_detector.launch
rqt_image_view
初始化部分:完成ROS节点、图像、识别参数的设置
图像处理:将图像转换成OpenCV格式;完成图像预处理之后开始针对两帧图像进行比较,基于图像差异识别到运动的物体,最后标识识别结果并发布
二维码识别
安装二维码识别功能包
sudo apt-get install ros-kinect-ar-track-alvar
创建二维码
rosrun ar_track_alvar createMarker
rosrun ar_track_alvar createMarker 0
roscd robot_vision/config
rosrun ar_track_alvar createMarker -s 5 0
rosrun ar_track_alvar createMarker -s 5 1
rosrun ar_track_alvar createMarker -s 5 2
二维码识别(摄像头)
![](https://pic4.zhimg.com/80/v2-87031802dc7801df8addbce0a6769533_720w.jpg)
启动摄像头二维码识别示例
roslaunch robot_vision usb_cam_with_calibration.launch
roslaunch robot_vision ar_track_camera.launch
启动摄像头时,需要加载标定文件,否则可能无法识别二维码
查看识别到的二维码位姿
rostopic echo /ar_pose_marker
![](https://pic2.zhimg.com/80/v2-39fd43639361ecde66b2f2cf7aafd531_720w.jpg)
二维码识别(Kinect)
![](https://pic4.zhimg.com/80/v2-c00d372fd63257f84d1fa59ecde0768b_720w.jpg)
启动Kinect二维码识别示例
roslaunch robot_vision freenect.launch
roslaunch robot_vision ar_track_kinect.launch
![](https://pic4.zhimg.com/80/v2-4e4130683b94a85bba90ba9b1157f06b_720w.jpg)
扩展内容:物体识别与机器学习
Object Recognition Kitchen(ORK)
2.机器语音
![](https://pic2.zhimg.com/80/v2-8255f58c2829188dd459ff3ad29ab549_720w.jpg)
常用语音功能包
- pocketsphinx:集成CMU Sphinx和Festival开源项目中的代码,实现语音识别的功能
- audio-common:提供了文本转语音的功能实现完成"机器人说话"的想法
- AIML:人工智能标记语音,Artificial Intelligence Markup Language是一种创建自然语音软件代理的XML语言
评论(0)
您还未登录,请登录后发表或查看评论