CV学习笔记-数字图像概述

Moresweet猫甜

分类：机器视觉

发布时间 2023.04.30阅读数 1584 评论数 0

数字图像

1. 图像

像素： 像素是分辨率的单位。像素是构成位图图像的基本单元，每个像素都有自己的颜色。

分辨率： 又称“解析度”，图像的分辨率就是单位英寸内的像素点数。单位是PPI（Pixels Per Inch）

PPI表示的是每英寸对角线上所拥有的像素数目（w：宽度像素数，h：高度像素数，di：屏幕尺寸），屏幕尺寸指的是对角线长度

在生活中经常混淆分辨率与清晰度的关系以及分辨率与屏幕尺寸的关系。

灰度： 表示图像像素明暗程度的数值，也就是黑白图像中点的颜色深度。范围一般为0-255.白色为255，黑色为0.

通道： 把图像分解成一个或多个颜色成分：

单通道：一个像素点只需一个数值表示，只能表示灰度，0为黑色；（二值图&灰度图）
三通道：RGB模式，把图像分为红绿蓝三个通道，可以表示彩色，全0表示黑色；
四通道：RGBA模式，把RGB基础上加上alpha通道，表示透明度，alpha=0表示全透明；

对比度： 指不同颜色之间的差别。对比度=最大灰度值/最小灰度值

RGB转换为Gray（降维、保留梯度信息）： 常见以下几种算法

浮点算法：Gray = 0.3R + 0.59G + 0.11B
整数方法：Gray = ( 30R + 59G + 11B ) / 100
移位方法：Gray = ( 76R + 151G + 28B ) >> 8
平均值法：Gray = ( R + G + B ) / 3
保留绿色：Gray = G

RGB值化为浮点数：

浮点数运算结果更精确，整数运算中会因丢弃小数部分可能导致颜色值严重失真，计算过程越多越失真
将RGB值转化为[0,1]浮点数（除以255）
二值化：先转浮点数

if(img_gray[i,j]<=0.5):
	img_gray[i,j] = 0
else
	img_gray[i,j] = 1

opencv大坑之BGR：opencv对于读进来的图片的通道排列是BGR，而不是主流的RGB！谨记！

#opencv读入的矩阵是BGR，如果想转为RGB，可以这么转
img4 = cv2.imread('1.jpg')
img4 = cv2.cvtColor(img4,cv2.COLOR_BGR2RGB)

频率： 灰度值变化剧烈程度的指标，是灰度在平面空间上的梯度。

幅值： 幅值是在一个周期内，交流电瞬时出现的最大绝对值，也就是一个正弦波，波峰到波谷的距离的一半。

2. 图像的取样与量化

数字图像： 计算机保存的图像都是一个一个的像素点，称为数字图像

取样（数字化坐标值）： 就是要用多少点来描述一幅图像，取样结果质量的高低就是用分辨率来衡量的

量化（数字化幅度值）： 是指要使用多大范围的数值来表示图像采样之后的一个点。

3.上采样与下采样

下采样： 缩小图像（或称为下采样(subsampled)或者降采样(downsampled)）

降采样的主要目的有两种：

使得图像符合显示区域的大小
生成对应的略缩图

下采样原理：( M / s ) * ( N / s )

上采样： 放大图像

上采样原理：内插值

常用的插值方法

最邻近插值（The nearest interpolation）
双线性插值

横竖两次单线性插值

图像相邻四个点，故而分母都是1

存在的问题：

坐标系的选择解决办法（找几何中心：+0.5）

要通过双线性插值的方法算出

双线性插值的计算灰度是连续的，更光滑

由单线性插值引入：

引出双线性插值：实质上是x方向做了两次单线性插值，y方向上做了一次单线性插值。

按照原理可以得出

srcX = ( dstX ) * ( srcWidth / dstWidth )

srcY = ( dstY ) * ( srcHeight / dstHeight )

这样会有问题，如果源图像和目的图像的映射均选择映射的左上角的原点，那么会导致插值的结果取值偏左上，若都选择右下角，则又会偏右下。

为了保证取值的效果，需要取图像中心，经过数学计算证明，原坐标和目的坐标均+0.5，即可保证取值在图像中心，插值效果被优化。双线性插值与最邻近插值比计算量要大很多，但不会存在灰度不连续的缺点，故而图像看起来更光滑。