第五讲 机器人感知
1.机器视觉(图像校准、图像识别等)
ROS中的图像数据(二维图像)
显示图像类型
roslaunch usb_cam usb_cam-test.launch
rostopic info /usb_cam/image_raw
查看图像消息
rosmsg show sensor_msgs/Image

- Header:消息头,包含消息序号,时间戳和绑定坐标系
- height:图像的纵向分辨率
- width:图像的横向分辨率
- encoding:图像的编码格式,包含RGB、YUV等常用格式,不涉及图像压缩编码
- is_bigendian:图像数据的大小端存储模式
- step:一行图像数据的字节数量,作为数据的步长参数
- data:存储图像数据的数组,大小为step*height个字节

1080*720分辨率的摄像头产生一帧图像的数据大小是 3*1080*720=2764800字节,即2.7648MB
压缩图像消息
rosmsg show sensor_msgs/CompressedImage

- format:图像的压缩编码格式(jpeg,png,bmp)
- data:存储图像数据数组
显示点云类型
roslaunch freenet_launch freenect.launch
rostopic info /camera/depth_registered/points
查看点云消息
rosmsg show sensor_msgs/PointCloud2

- height:点云图像的纵向分辨率
- width:点云图像的横向分辨率
- fields:每个点的数据类型
- is_bigendian:数据的大小端存储模式
- point_step:单点的数据字节步长
- row_step:一列数据的字节步长
- data:点云数据的存储数组,总字节大小为row_step*height
- is_dense:是否有无效点
点云单帧数据量也很大,如果使用分布式网络传输,需要考虑能否满足数据的传输要求,或者针对数据进行压缩
摄像头标定
摄像头为什么要标定
摄像头这种精密仪器对光学器件的要求较高,由于摄像头内部与外部的一些原因,生成的物体图像往往会发生畸变,为避免数据源造成的误差,需要针对摄像头的参数进行标定
安装标定功能包
sudo apt-get install ros-kinetic-camera-calibration

摄像头标定流程
1.启动摄像头
roslaunch robot_vision usb_cam.launch
2.启动标定包
rosrun camera_calibration cameracalibrator.py --size 8x6 --square 0.024 image:=/usb_cam/image_raw camera:=/usb_cam
- 1.size:标定棋盘格的内部角点个数,这里使用的棋盘一共有六行,每行有8个内部角点
- 2.square:这个参数对应每个棋盘格的边长,单位是米
- 3.image和camera:设置摄像头发布的图像话题

- X:标定靶在摄像头视野中的左右移动
- Y:标定靶在摄像头视野中的上下移动
- Size:标定靶在摄像头视野中的前后移动
- Skew:标定靶在摄像头视野中的倾斜转动
终端中的标定结果


标定结果保存路径 /tmp/calibrationdata.tar.gz
Kinect标定流程
1).启动Kinect
roslaunch robot_vision freenect.launch
2).启动彩色摄像头
rosrun camera_calibration cameracalibrator.py image:=/camera/rgb/image_raw camera:=/camera/rgb --size 8x6 --square 0.024
3).标定红外摄像头
rosrun camera_calibration cameracalibrator.py image:=/camera/ir/image_raw camera:=/camera/ir --size 8x6 --square 0.024
摄像头如何使用标定文件

Kinect如何使用标定文件

使用标定文件时可能产生的错误

原因:标定文件中camera_name参数与实际传感器名称不匹配
解决方法:按照警告提示的信息进行修改即可。
ROS+OpenCV应用实例(人脸识别、物体跟踪)
OpenCV:Open Source Computer Vision Library
实现了图像处理和计算机视觉方面的很多通用算法,而且对非商业应用和商业应用都是免费的
安装OpenCV
sudo apt-get install ros-kinetic-vision-opencv libopencv-dev python-opencv

测试例程
roslaunch robot_vision usb_cam.launch
rosrun robot_vision cv_bridge_test.py
rqt_image_view
imgmsg_to_cv2();将ROS图像消息转换成OpenCV图像数据
cv2_to_imgmsg():将OpenCV格式的图像数据转换成ROS图像消息
输入参数:1).图像消息流 2).转换的图像数据格式
人脸识别流程
图像输入 输出结果

启动人脸识别实例
roslaunch robot_vision usb_cam.launch
roslaunch robot_vision face_detector.launch
rqt_image_view
初始化部分:完成ROS节点、图像、识别参数的设置。
ROS图像回调函数:将图像转化成OpenCV的数据格式,然后预处理之后开始调用人脸识别的功能函数,最后把识别的结果发布。
人脸识别:调用OpenCV提供的人脸识别接口,与数据库中的人脸特征进行匹配。

启动物体跟踪实例
roslaunch robot_vision usb_cam.launch
roslaunch robot_vision motion_detector.launch
rqt_image_view
初始化部分:完成ROS节点、图像、识别参数的设置
图像处理:将图像转换成OpenCV格式;完成图像预处理之后开始针对两帧图像进行比较,基于图像差异识别到运动的物体,最后标识识别结果并发布
二维码识别
安装二维码识别功能包
sudo apt-get install ros-kinect-ar-track-alvar
创建二维码
rosrun ar_track_alvar createMarker
rosrun ar_track_alvar createMarker 0
roscd robot_vision/config
rosrun ar_track_alvar createMarker -s 5 0
rosrun ar_track_alvar createMarker -s 5 1
rosrun ar_track_alvar createMarker -s 5 2
二维码识别(摄像头)

启动摄像头二维码识别示例
roslaunch robot_vision usb_cam_with_calibration.launch
roslaunch robot_vision ar_track_camera.launch
启动摄像头时,需要加载标定文件,否则可能无法识别二维码
查看识别到的二维码位姿
rostopic echo /ar_pose_marker

二维码识别(Kinect)

启动Kinect二维码识别示例
roslaunch robot_vision freenect.launch
roslaunch robot_vision ar_track_kinect.launch

扩展内容:物体识别与机器学习
Object Recognition Kitchen(ORK)
2.机器语音

常用语音功能包
- pocketsphinx:集成CMU Sphinx和Festival开源项目中的代码,实现语音识别的功能
- audio-common:提供了文本转语音的功能实现完成"机器人说话"的想法
- AIML:人工智能标记语音,Artificial Intelligence Markup Language是一种创建自然语音软件代理的XML语言
评论(0)
您还未登录,请登录后发表或查看评论