一、HOG是啥
1、基本定义
HOG特征(方向梯度直方图特征)是一种在计算机视觉领域广泛用于物体检测的技术。局部图像区域特征可以通过图像局部区域的梯度方向表达,即特征可以由梯度方向表达。HOG特征技术将图像分为小的区域,然后采集区域中各像素点的梯度方向直方图,把这些直方图组合起来就可以构成特征的描述。

为了解决不同区域光照与阴影对特征的影响,可以对区间(区间比区域大,一个区间有若干区域)进行对比度归一化。先计算各直方图在这个区间中的密度然后根据密度对区间中的各个区域进行归一化。

与其他的特征描述方法相比,HOG是在图像的局部方格单元上操作,所以它对图像几何的和光学的形变都能保持很好的不变性,因为这两种形变只会出现在更大的空间领域上。其次,只要行人大体上能够保持直立的姿势,可以容许行人有一些细微的肢体动作,这些细微的动作可以被忽略而不影响检测效果。因此HOG特征是特别适合于做图像中的人体检测的。

2、计算过程
(1)将线性颜色空间经过Gamma校正转化为非线性空间
线性颜色空间中,人眼对亮部变化感受较弱,对暗部感受较强,所以线性空间中亮部部分会有部分冗余像素信息无法获得,而暗部在线性空间相对占比较少。为了均衡暗部亮部,尽可能地保留图像特征信息,故将原图灰度图的线性颜色空间进行伽马校正将其转化为非线性空间。一般,gamma取0.5,使灰度图亮度变低,暗部区域变大。关于Gamma的详细解释看这里Gamma校正文章


(2)计算图像梯度
分别计算该像素X轴方向与Y轴方向的梯度,然后这两个梯度经过arctan函数计算即可得到该像素梯度方向。
计算公式如下:

为了便于计算,编程中一般使用梯度算子[-1,0,1]和[-1,0,1]T分别对图像进行卷积运算,得到两方向的梯度,并用arctan函数计算梯度方向。

(3)为每个区域构建梯度方向直方图
因为梯度方向是0-360°,所以在构建梯度方向直方图的时候需要指定这360°的区域划分为多少块(一般为9块,即40°为一块)。在计算完毕每个像素的梯度方向后,将该方向对应直方图中的bin加上该梯度的大小(或某些经过计算的函数值)。

如果,计算出该像素梯度方向为35°,梯度大小为3的话,就在0-40这个bin上加上3(或某些经过计算的函数值,但研究证明加上梯度大小对于描述行人特征最有效)。

(4)把区域合并成大的区间,区间内归一化梯度直方图
局部光照的变化以及前景-背景对比度的变化使得梯度强度的变化范围非常大。这就需要对梯度进行归一化。归一化能够进一步地对光照、阴影和边缘进行压缩。把各个区域组合成大的、空间上连通的区间。一个区间内所有区域的特征向量首尾相连便得到该block的HOG特征。

区间是互有重叠的,每一个区域的特征会以不同的结果多次出现在最后的特征向量中。我们将归一化之后的区间描述向量称之为HOG描述符。

(5)合并HOG特征
将所有区间的HOG描述向量组合(首尾相连)在一起,形成最终的特征向量,该向量描述图像的特征。

3、HOG特征向量维度计算问题

有一张64*128像素的图片,梯度方向平均划分为9个区间(bin)
每个区域为8*8像素,每个区间为2*2区域(即16*16像素)
设8像素为扫描步长,则水平方向共有7((64-8)/8=7)个扫描窗口,垂直方向15((128-8)/8=16)个扫描窗口。
对于64*128的图片,特征维度为2*2*9*7*15=3780。


二、SVM是啥


1、支持向量机分类

线性可分支持向量机:当训练数据线性可分时,可通过硬间隔最大化,学习一个线性的分类器,该分类器就是线性可分支持向量机
线性支持向量机:当训练数据近似线性可分时,可通过软间隔最大化,学习一个线性的分类器,该分类器就是线性支持向量机
非线性支持向量机:当训练数据线性不可分时,通过使用核函数并使软间隔最大化,学习一个非线性的支持向量机
PS:硬间隔就是当数据能被超平面百分之百分类正确时,训练数据到该超平面的最小距离就是硬间隔;软间隔就是当数据无法完全被超平面分类正确时,训练数据到该超平面的最小距离就是软间隔。

2、支持向量机简单理论推导
下面的过程是用word写的,然后是以图片形式放到博客上,word版在CSDN资源(0积分下载)

具体关于拉格朗日乘子法,对偶使用条件及证明(KKT条件)等过程在博主现阶段还不需要详细掌握,详细的解析可以看这里支持向量机原理详细推导SVM三境界

3、核函数
简单总结:对于线性不可分的数据,SVM需要运用核函数将数据映射到更高维度空间,在更高维度空间中,数据就可能会线性可分。
详细的解释需要结合上述推导过程中拉格朗日乘子法里面的某些公式理解,详细的解析可以看这里SVM三境界

三、参考文献
[1] 目标检测的图像特征提取之(一)HOG特征
[2] 支持向量机(SVM)详细推导及理解(1)
[3] SVM三境界

————————————————