哈工大数字图像处理知识点总结

2021-08-30 来源：爱问旅游网

1. 引言

1.1 图像的概念

图像：是对客观存在的物体的一种相似性的、生动性的模仿或描述，是一种不完全的、不精确的，但在某种意义上是适当的表示。也是对客观存在的物体的某种属性的描述。（非所见即所得，对事物不能完全描述）

1.2 数字图像的起源与应用 1.3 数字图像处理的概念  图像的类型：

从图像生成角度：物理图像（可见图像（光学图像）、不可见图像（红外）、数学图像等）从照明角度：多光谱图像（特指不可见光谱）和单光谱图像（激光）；

从人眼视觉特点上：可见图像、不可见图像。从波段多少分为：单波段（每点只有一亮度值）、多波段（每点不只一特性如红绿蓝光谱图像）和超波段图像。从图像空间坐标和明暗程度的连续性：模拟图像、数字图像（空间坐标和灰度均不连续，用离散的数字表示）。

 图像的表现形式

 图像的属性：构成数字图像的要素，灰度坐标

图像的属性：1.对比度：灰度差别 0~255（256个灰度级） 2. 灰度分辨力：适于人眼

3．空间分辨力：越高越好 4．放大率

对比度与灰度的关系：量化？灰度量化最高、最暗差值尽可能大。减少灰度级一般会提高图像的对比度。构成数字图像的要素：地址（坐标）和灰度值

 数字图像的处理概念及三种分类：处理\\分析\\理解

操作对象：狭义数字图像处理：图像——图像

图像分析：图像——数据（特征值）图像理解：数据——概念

狭义图像处理强调图像之间进行变换，指对图像进行各种操作以改善图像的视觉效果，或对图像进行压缩编码以减少所需存储空间或传输时间、传输通路的要求。

图像分析是对图像中感兴趣的目标进行检测的测量，从而建立对图像的描述，是从图像到数值或符号的过程。经分割和特征提取，把原来以像素构成的图像转变成比较简洁的非图像形式的描述。

图像理解研究图像中各目标的性质和它们之前的相互联系，并得出对图像容含义的理解以及对原来客观场景的解译，人而指导和规划行动

 数字图像的运算形式：全局、局部、点，串行、并行

全局：快速傅立叶变换局部：

点运算：对于一幅输入图像，经过点运算产生一幅输出图像，后者的每个像素的灰度值仅由相应输入像素的值决定（对比度增强，对比度拉伸，灰度变换）

串行：后一像素输出结果依赖于前面像素处理的结果，并且只能依次处理各像素而不能同时对各像素进行相同处理的一种处理形式。

并行：对图像的各同时进行相同形式运算的一种处理形式。

 图像工程中的层次及与相关学科的关系

计算机图形学研究是如何利用计算机技术来产生图形、图表、绘图，以来表达数据信息。与图像分析相比，处理对象和输出结果正好相反。计算机图形学试图从非图像形式的数据描述来生成图像；模式识别把图像抽象成用符号描述的类别。模式识别与图像分析有相同的输入，而不同的输出结果之间可以较方便的进行转换；计算机视觉用计算机去实现人的视觉功能。

 数字图像的获取

扫描，采样（空间分辨力），量化（灰度分辨力）

采样：将空间上连续的图像变换成点的操作。采样间隔分为均匀采样量化及非均匀采样量化；采样孔径的形状

和大小与采样方式有关。

量化：将像素灰度转换成的整数值的过程，最亮最暗差值尽可能大采样量化的原则：1.细节丰富的图像（观众）：高的采样分辨力细采样，粗量化 2. 细节少，缓变的图像（人脸）：高的灰度分辨力细量化，粗采样

2.数字图像处理的基本概念

2.1 BMP文件结构及文件操作程序 2.2 人眼形成的图像

 物体的色，减色效应与加色效应

消色物体：加色效应黑白灰对照明光线有非选择性吸收的特性，即光线照射到消色物体上时，被吸收的各种波长的入射光是等量的；被反射或透射的光线，其光谱成分也与入射光的光谱成分相同。

有色物体：减色效应。对照明光线具有选择性吸收的特性，光线照射到有色物体上，入射光中各种波长的色光是不等量被吸收。白光照射到有色物体上，反射或透射光线不仅亮度有所减弱，光谱成分也改变，呈现各种颜色。

绿物反射绿光，减去绿光，如在暗场对其用蓝光照射，吸收蓝光，黑色

当有色光照射到消色物体，物体反射光与入射光颜色相同。两种以上有色光同时照射消色物体，物体颜色呈加色法效应。当有色光照射到有色物体上，物体的颜色呈减色法效应。如黄色物体在品红光照射下呈红色，在青色光照射下呈绿色，在蓝色光照射下呈现灰色或黑色。

黄红红绿黄品白黑绿青蓝品蓝青

加色效应减色效应

 马赫效应与错觉

从每一竖条反射出来的光强是均匀的，相信竖条之间强度差是常数，而看起来每一竖条右边要比右边稍亮一点。

亮度过冲是眼睛对不同空间频率产生不同视觉响应的结果。视觉系统对空间高频和空间低频的敏感性较差，对空间中频有较高的敏感性，这冲过问对人眼所见的景物有其轮廓的作用。

 连续图像的描述

灰度=照度*反射系数

用f(x,y) 表示静止图像，因为光是能量的一种形式，故0f(x,y)

人眼看到的图像都是由物体反射的光组成。f(x,y)可被看成是两个分量组成：一分量是所见场景的入射光量，另一分量是场景中被物体反射的光量。i(x,y)表示照射分量，性质由光源确定；r(x,y)表示反射分量，由景物中物体的特性而定。有f(x,y)i(x,y)r(x,y)式中0i(x,y)，0r(x,y)1，反射分量在全吸收和全反射之间。

2.3 图像数字化

 图像的数字化过程：扫描、采样、量化  数字化与图像质量的关系

采样间隔越大，所得图像像素数越少，图像空间分辨率低，质量差，严重时出现像素呈块状的国际棋盘效应；采样间隔越小，所得图像像素数越多，图像空间分辨率高，质量好，但数据量大。

量化等级越多，所得图像层次越丰富，灰度分辨率越高，质量越好，但数据量大；量化等级越少，图像层次欠

丰富，灰度分辨率低，质量变差，会出现假轮廓现象，但数据量小。极少情况下图像大小固定时，减少灰度级能改善质量，由于会提高图像对比度，如对细节比较丰富的复杂图像。

采样量化的原则：1.细节丰富的图像（观众）：高的采样分辨力细采样，粗量化 2. 细节少，缓变的图像（人脸）：高的灰度分辨力细量化，粗采样

 数字化采样量化方法

统一的采样和量化：随着采样分辨率和灰度级提高，主观质量也提高。对有大量细节的图像，质量对灰度级

需求相应降低。（一般采用均匀采样和均匀量化）

非统一的图像采样和量化：在灰度级变化尖锐的区域，用细采样（细量化），在灰度级比较平滑的区域，用粗

采样（粗量化）。避免或减少由于量化的太粗糙，在灰度级变化比较平滑的区域出现假轮廓。

 图像的表示：灰度表面、矩阵  图像的显示 2.4 数字化设备

 数字化过程：采样，量化  数字化器的主要参数

像素大小：采样孔的大小和相邻两像素的距离是两个重要的性能参数；

图像大小：图像的大小由像素数决定。

物理参数：数字化器采集和量化的物理参数；

线性度：对光强进行数字化时，应当知道灰度正比于图像亮度的实际精确程度。噪声：系统中固有噪声会使图像的灰度发生变化。

 光传感器

1） CCD CID CMOS特点

2）CCD相机参数：感光元件大小、放大倍率、解析度、像素数、F数、景深； 2.5 光源的种类及照明形式

光源的种类：卤素灯；高周波荧光灯；LED灯源；金属灯泡或氖灯；激光光源；氙素灯。照明形式：前照式（正向光源）（表面反射光）；背照式（背向光源）（工件遮光处不透光），侧照式（侧向光源）（轮廓边缘光反射最大）。

2.6 灰度直方图（定义、性质、作用）

定义：是灰度级的函数，描述的是具有该灰度级的像素个数（或出现的频次）图像各灰度级在图像中出现的频次（统计角度）

性质：1灰度直方图只与像素灰度有关，与位置无关(没有位置信息) 2 灰度直方图与图对应关系：一对多的关系

3.灰度图像具有相加性（两区域灰度直方图之和等于图像灰度直方图）作用：1. 判断图像量化是否可理

2. 利用阈值实现图像分割（用于确定图像二值化阈值）

3.计算图像对像（目标）大小（当物体部分的灰度值比其他部分灰度值大时，可统计图像中物体的面积）

4. 计算图像的熵 HPlogiioL12Pi 熵：图像信息量的反映，反映了图像信息丰富的程度。

2.7 图像处理算法形式

基本功能形式：按图像处理输出形式

1. 单幅图像—单幅图像 2. 多幅图像—单幅图像 3. 单（或多）幅图像—数字或符号等（图像—统计量或特征量的测量、编码表示特征提取图像—描述图像）基本运算形式：

点运算（点处理）：输出值仅与输入像素灰度有关的处理，如图像对比度增强、图像二值化。（点对点）

局部运算：计算某一输出像素值由输入图像像素小领域中的像素值确定，如移动平均平滑法，空间域锐化。全局运算：输出像素的值取决于输入图像较大围或整幅图像像素的值。如傅立叶变换

2.8 图像的数据结构（组合式、比特面、分层、树）

1.组合方式：最常用的方式，一个像素的灰度按固定的字长表示，数据排列按像素位置排列。

2.比特面方式：图像像素（M*N）灰度以固定字长（nbit）,建立n个bit面，每个面有M*N个位，对于同一个像素，其n位数据分别占据n个比特面该像素的位置。优点：节省存储空间。缺点：使数据处理复杂化。位面：最高位信息最重要，为图像轮廓，低位图包含信息细节。

3.分层方式：由原始图像依次构成像素数越来越少的系列图像，就能使图像数据表示具有分层性，其代表就是锥形（金字塔）结构。

4.树结构：对一幅二值图像的行、列都接连不断二等分，如果被分割部分的图像中全体都变成具有相同的特征时，这一部分不再分割。可用在特征提取和信息压缩方面。(多分辨分析，由粗到精)

题目：

1. 选用1/2英寸的CCD，若以光学放大倍率为1倍时，其真实视野围是多少？

实际视场=CCD（垂直水平）

光学放大倍率2. 7mm*7mm的CCD芯片，有1024*1024个像元，将0.5m 远的物体成像其上，摄像机的物体解析度？（配置35mm焦距镜头）

主要放大倍率： 35/500

摄像机解析度：512/7 线对/每单位长度

物体解析度：主要放大倍率*摄像机解析度 35/500 * 512/7= 512 ep/mm

3. 有一幅在灰度背景下的黑白足球图像，直方图数据如下：

【0 520 920 490 30 40 5910 24040 6050 80 20 80 440 960 420 0】足球直径为230mm，像素间距代表多少mm?

A3880r2r35.14d

2303.27mm35.14*2.

3. 图像空域增强

3.4 点运算的应用

 直方图均衡化：点运算形式及均衡化计算方法

f(D)DmF(D)

特点：1. 不利于灰度渐变（平滑）图像。

2 .第二次均衡化的结果与第一次相同。

直方图均衡的实质是减少图像的灰度等级换取对比度的扩大。

 直方图匹配：点运算形式及匹配计算方法

DcFc1[FA(DA)]

 代数和与灰度直方图的关系H(Dc)HAB(DA,DB)dDBHAB(DA,DB)dDAHAB联合灰度直方图

A,B互不相关时，HC(Dc)HA(Dc)*HB(Dc)  局部增强在局部区域完成均衡化、规定化

串行增强算法 1、设定邻域大小，（如7*7）；

2、计算该邻域直方图，利用均衡化或规定化，获得映射关系； 3、利用映射关系，将该邻域中心点进行处理，更新原图数据 4、中心位置移动到下一像素，重复上述过程。新值被利用

 概念：模板（掩模）和窗口

窗口：矩形区域

模板：任意形状的区域

算术加减运算与逻辑运算？

加法：或运算减法：异或运算

3.5 代数运算

 代数和的应用——均值去噪

多幅图像平均法是对获取的同一景物的多幅图像相加取平均来消除噪声。设理想图像 f(x,y)所受到的噪声n(x,y)为加性噪声，而产生的有噪图像g(x,y)可表示为：g(x,y)f(x,y)n(x,y)

若图像噪声是互不相关的加性噪声且均值为0，则f(x,y)E{g(x,y)}其中E{g(x,y)}是g(x,y)的期望值。

ˆ(x,y)g(x,y)1对M幅有噪声的图像经平均后得到fM其估值误差为：2g(x,y)g(x,y)

ii1Mˆ(x,y)f(x,y)]2}E{[1E{[fMf(x,y)f(x,y)]}Mii1M12n(x,y)

2g(x,y)和

2n(x,y)是g在n在点（x,y）处的方差。可见对M幅图像取平均可把噪声方差减小到1/M.当M增大

时g(x,y)将更加接近f(x,y)。在各个位置上像素值的噪声变化率将减小。

均值：反映图像的噪声的减小

方差（标准差）减小，对比度减小，整个差值图像的差别减小，原图像与去噪后图像差别趋于一致（噪声减小）

 代数差与代数和的关系  代数差的应用

1. 利用差图像可以获得运动目标，同时可利用差图像获得导数图像的灰度直方图； 2. 利用差图像可增强图像

3. 利用代数差可由含噪图像估计去噪图像的目标综合光密度（IOD）

 代数和降噪的理由（采用功率信噪比） 3.6 空间滤波器  二维离散卷积

H(i,j)f(m,n)g(im,jn)

mn若ｆ大小为m1×n1, g为m2×n2,扩展f和g, M>=m1+m2+1, N>=n1+n2+1 边缘的处理方法：

1）通过重复图像边缘上行和列，对图像扩充； 2）卷绕图像，即假设第一列紧接着最后一列 3）在输入图像外部填充常数；

４）去掉不能计算的行和列，仅对可计算的像素卷积

 均值滤波模板（窗口长度小于信号周期）

大于等于信号会滤掉信号

必须保证全部权系数之和为1，这样可保证输出图像灰度值在许可围，不会产生灰度“溢出”现象。

 中值滤波模板（2n+1长度窗口单调，可保留；若窗口趋势变化，则至少保持n+1个才可不被滤掉）

非线性滤波器，长度必须是奇数，属于并行算法，不必保证全部权系数之和为1

窗口长度，若一维情况下，窗口长度为2n+1，且输入序列在窗口单调增或减，则信号可保持。如果序列中趋势改变，则至少需要在n+1个样本上连续保持同一值的过渡。中值滤波后，信号频谱基本不变。

注意：均值与中值处理噪声类型不同

均值：均值为0的随机噪声

中值：去掉脉冲（椒盐）噪声，并能很好的保持边缘特征。

 彩色图像处理

概念：色度图？亮度

用以区别颜色的特性是亮度、色调和饱和度。亮度和色调一起称为彩色。亮度包含无色的强度的概念。

色调是光波混合中与主波长有关的属性，色调表示观察者接收的主要颜色。饱和度与所加白光数量成反比。

 彩色模型

意义、应用

RGB模型显示模型，表面颜色是安全色

CMY（青、深红、黄）模型，主要用于打印设备、印刷 HIS（色调、饱和度、亮度）模型，用于图像处理

以黑到白为轴，表示彩色的亮度I，I轴与颜色点组成的面就是色调，交线长度为饱和度。

RGB模型、CMY模型、HIS模型相互转换

HIS强度分量I1(RGB) 3 彩色图像增强

伪彩色增强：人眼对色彩的分辨能力强

对于灰度图像增强

真彩色增强：对彩色图像增强  全彩色图像增强的要求

1）保持色调不变

2）更宽松的条件：保持图像结构不变。

注：1）处理必须对向量和标量都可用；如对数映射，对向量取对数和分别对各分量取对数是一样的效果；若满足该条件可以使用RGB模型

2）若对向量的某一分量操作，该分量对于其他分量必须是独立的。

题目：

1. 对下图进行直方图均衡化。

2.中值滤波

1 2 1 4 3 1 2 2 3 4 5 7 6 8 4 5 6 7 8 3 5 6 7 8 1

4. 数字图像变换

 数字图像成像系统是一线性系统，因此可从这个角度对图像进行分析和处理。

线性位移不变系统：齐次，叠加，移不变性，自相关。系统的输出仅和输入函数形态有关，而和作用起点无关。

1. 线性移不变系统，对于调谐信号响应等于输入信号乘以一个依赖于频率的复数 2. 实值函数输入产生实值输出。

3. 输入调谐信号总产生同频率的调谐信号 4. 传函对输入的影响是只改变幅值和相位。

 卷积运算（两种计算方法）

1211 FH 3422

 图像傅立叶变换的性质

乘以(-1)x+y的原因？

(1)u0xyej(xy)(ej2(u0)xM•ej2(v0)yN)

MN; v022xyF[f(x,y)(1)MNj2[(uxx)(vyy)]1M1N1MN22]f(x,y)edxdyF(u,v) MNx0y022x+y

还原图像先反变换，再乘以(-1)

线性系统只改变信号的幅值和相位，不改变频率

相位：位置信息

幅值：能量

 谱的概念、自相关计算与能量谱的关系

图像中自卷积、自相关的区别

能量谱、幅值谱、相位谱的概念

 快速傅立叶变换

 正交变换

酉阵定义：T-1=(T*)t

性质：可分离性、去相关性

由于二维离散傅里叶变换具有可分离性，即它可由两次一维离散傅里叶变换计算得到，二维DFT变换利用分离性，用两次一维变换来实现，即先对f(x,y)的每一行进行一维变换得到F(x,v),再沿F(x,v)每一列取一维变换得到变换结果F(u,v)。可将图像的能量重新分配。

沃尔什/哈达玛变换及逆变换

沃尔什变换：

G(1)bi(x)bn1i(u) Wi0n11GfG N哈达玛变换是对称的、可分离的酉变换，它的核矩阵中只有+1和-1元素，它要求N=2n,其中n是整数对于2×2的情况，核矩阵为：

1、构造难易不同； 2、均是正交的方波型； 3、均是可逆运算。

快速哈达玛变换、沃尔什变换  频域增强

滤波器在空域与频域的对应关系

1.滤波在频域更直观，对于小模板在空间域穿成滤波

2.频域相当于一个实验室，一旦通过频域试验选择，可用空间哉进行滤波

高频增强

高频提升过滤：高通滤波器除去了傅里叶变换的低频成分和零频成分，图像平均强度减小，采用拉普拉斯算子

处理后的图像与原图像相加可以达到增强的作用。这种作用称作高频提升过滤。

钝化模板：从一幅图像中减去自身模糊图像，即减去低通滤波后的图像而生成的锐化图像。

fhpAf(x,y)flp(x,y) A1

高频提升：fhb(x,y)(A1)f(x,y)f(x,y)flp(x,y)

相当于加强边缘，相应地，在频域中可表示为：Fhp(u,v)F(u,v)Hhp(u,v) 高通滤波器高频提升滤波器Hhb(u,v)(A1)Hhp(u,v)

高频加强：高频成分强调图像。在这种情况下，高通滤波函数前乘以一个常数，再加上一个偏移，使零频率不被滤除掉。HhfeabHhp(u,v)a0,ba a=A-1 且 b=1,即为高频提升， b>1称作高频加强

同态滤波

同态滤波：（是一种将图像亮度围压缩和对比度增强的频域方法）图像灰度由照射分量和反射分量合成，反射分量反映图像的容，随图像细节的不同在空间上坐快速的变化，在不同物体交为界处急剧变化。照射分量在空间上通常均具有缓慢变化的性质。所以图像对数的傅立叶变换中的低频部分主要对应照度分量，而高频主要对应反射分量。找到一种滤波器，减少照射分量的贡献，增加反射分量的贡献，那么图像会得到增强。

低频区减弱，高频区加强，减少低频的贡献，加强高频的贡献，亦即达到频域动态围压缩，空域对比度加强的效果。

图像f(x,y)可表示为照度分量i(x,y)和反射分量r(x,y)的乘积. 1) 两边同时取对数得lnf(x,y)lni(x,y)lnr(x,y) 2) 两边进行傅立叶变换F(u,v)I(u,v)R(u,v)

3) 用一个频域函数H(u,v)处理F(u,v) H(u,v)F(u,v)H(u,v)I(u,v)H(u,v)R(u,v)

4) 傅立叶逆变换到空间域得：hf(x,y)hi(x,y)hr(x,y) 增强后图像是由对应照度分量与反射分量两部分

叠加而成。

5) 进行指数运算g(x,y)e[hf(x,y)]e[hi(x,y)]•e[hr(x,y)]

H(u,v)为同态滤波函数，分别作用于照度分量和反射分量上。

5. 图像复原

 图像复原与图像增强的区别

图像增强：不考虑图像是如何退化的，只通过试探各种技术来增强图像的视觉效果，所以图像增强可以不顾增强后的图像是否失真，只要看的舒服就行。（是主观的过程，为主观认知而进行的）

图像复原：需要知道图像退化的机制和过程的先验知识，据此找到一种相应的逆过程的方法，从而得到复原的图像。如果图像已退化，应先作复原处理，再作增强处理。（是相对客观的过程，把退化模型化，并按照相反的进程进行）

1. 需要了解图像的退化过程。 2. 以保真度为原则进行复原。

 图像复原的评价保真度

主观保真度及客观保真度准则

ˆ(x,y)看作是原图像f(x,y)和噪声信号e(x,y)的和，原图像和解码图象之间的如果将f均方根误差：erms1MNM1N1x0y0[f(x,y)f(x,y)]M1N12 2均方根信噪比：SNRmsx0y02f(x,y)/f(x,y)f(x,y) x0y0M1N12fmax峰值信噪比：PSNR10lg 2M1N1f(x,y)f(x,y)x0y0 几何复原：平移、倒置、旋转

显示（文件）坐标系，旋转坐标系

灰度插值双线性变换

最邻近插值（零阶插值）

令输出像素灰度值等于离它所映射到位置最近的输入像素的灰度值，如果有微细结构变化时，会产生锯齿边双线性插值（一阶插值）

一阶插值更准确，但运行时间比零阶长。若利用平面方程是过约束方法。

f(i,jv)[f(i,j1)f(i,j)]vf(i,j)

f(i1,jv)[f(i1,j1)f(i1,j)]vf(i1,j)

f(iu,jv)(1u)(1v)f(i,j)(1u)vf(i,j1)u(1v)f(i1,j)uvf(i1,j1) 坐标插值  代数复原

无约束复原

假设退化过程无噪声干扰。

退化模型中的噪声为n=g-sf,对n不知时，寻找一个s使fs在最小二乘意义上近似g, 使噪声项的数尽可能小，也就是n2s(x,y) f(x,y) n(x,y) s(x,y)1/f(x,y) g(x,y) gfs最小。

22求准则函数J(s)gfs关于s最小问题。

令

J(s)s2f'(gfs)0 可得s(f'f)1f'gf1g

若H(u,v)有零值，则H为奇异的，矩阵不存在，会导致恢复问题的病态性和奇异性。

有约束复原

为消除病态，准则改为：J(s)QsgFsn

Q为拉格朗日系数，J为目标函数，r为λ倒数。求偏导得s(F'FrQ'Q)F'g

复原后能量接近，但不完全一样。 1.当Q=I时。恢复后的信号中含噪声能量最小，在复原同时起到抑制噪声的作用。滤波前后信号能量保持不变。 2. 平滑约束，图像是最平滑图像，Q为拉普拉斯算子。

3.均方误差最小滤波（最小均方差——维纳滤波）统计平均意义上，复原方法适于一族图像。

1222MSEsˆ2s2  维纳滤波器的构造原则及维纳去卷积

Hw(u,v)H*(u,v)H(u,v)2Pn(u,v) Pf(u,v)以均方差作为平均误差的度量，选取最小均方误差作为最优准则维纳滤波更强调噪声的抑制，而不是重构信号。

在信号与噪声无关时的形式

 匹配监测器及与维纳滤波器的关系

 噪声的估计

；构造时，没有考虑优化；然后进行逆滤波。.

 退化模型的估计

观察估计

实验估计

模型估计运动图像的建模

题目

1. 图像围绕(120,210)反时针旋转60度，求其几何变换式

围绕（x0,y0）进行旋转的复合方法：

a(x,y)10 b(x,y)01100

x0cossiny010sincos0010x0x01yy 00100112. 令F(109,775)=113,F(109,776)=109, F(110,775)=105,F(110,776)=103。问F(109.27,775.44)=? 1)用最临近插值法，

2）双线性插值法，各系数的值

3. 假设当前图像只在x方向以给定位置x0(t)=at/T，当t=T时，图像总距离为aH(u,v)e0Tj2ux0(t)dtej2at/Tdt0TTsin(ua)ejua ua

6. 图像压缩与编码

 图像压缩的可能性及冗余种类

图像冗余：像素间冗余（自相关系数）、视觉冗余、时序冗余、编码冗余。（心理冗余）编码冗余：以8比特数据来存储黑白图像。

像素冗余：动态图像中，背景不变。背景为时序冗余。视觉冗余：

 图像保真度

保真度：解码图像相对原始图像偏离程度的测度，分为客观保真度准则和主观保真度准则。

ˆ(x,y)看作是原图像f(x,y)和噪声信号e(x,y)的和，原图像和解码图象之间的如果将f均方根误差：erms1MNM1N1x0y0[f(x,y)f(x,y)]M1N12 2均方根信噪比：SNRmsx0y0f(x,y)/f(x,y)f(x,y) x0y02M1N12fmax峰值信噪比：PSNR10lg 2M1N1f(x,y)f(x,y)x0y0 图像冗余度、编码效率和熵

平均码长：B编码效率：L1i0ipi 冗余度rioL1B1 HH1B1r

i2熵：HPlogPi可用作描述某事件不确定度。信息量越大，体系规则越完备，功能越完善。某个

事件的信息量，信息量Iron概率平均值叫熵。熵是信息量的度量，它表示某一事件出现的消息越多，事件发生的可能性越小，数学上就是概率小，越混乱，包含信息量越大。图像信息越丰富，熵越大。

若对原始图像数据的信息进行信源的无失真图像编码，压缩后平均码率B，其下限是信息熵H。高效编码是尽量使码长接近于H。

信源熵：是平稳信源的无损压缩效率极限

 霍夫曼编码（无损压缩）

思想：在源数据中出现概率越大的信号，分配的码字越短；反之，其码字越长步骤：

1、把输入元素按其出现概率由大到小排列起来，然后把最末两位最小概率的元素之概率加起来； 2、把概率之和同其余概率由大到小排列，然后再把两个最小概率加起来，再重新排队；

3、重复2，直到最后只剩下两个概率为止 Hufman 编码的特点：

1、霍夫曼编码构造出来的编码值不是唯一的，由于0和1分配是人为的 2、当图像灰度值分布很不均匀时，霍夫曼编码的效率就高 3、缺点：

1）缺乏构造性，不能在信源符号与编码之间建立对应关系； 2）对图像扫描二次，压缩与解码速度慢；

3）这种编码与计算机常用数据结构不匹配，造成编码冗余。

 费诺—香农编码（无损压缩）

目的：产生具有最小冗余的码词，其基本思想是产生编码长度可辨的码字与霍夫曼相比不需要多次排序。

 算术编码（无损压缩）

把要压缩处理的整段数据映射到一段实数半开区间（0，1）的某一区段，构造出小于1且或等于0的数值。这个数值是输入数据流的惟一可译代码。

算术编码用到两个基本的参数：符号概率和它的编码间隔。编码间隔决定符号压缩后的输出

 行程编码（无损压缩）

在给定图像中寻找连续重复的数值，然后用两个字符值取代这些连续值。例：输入信源为：

aaabbbbccccdddedddaa” ，经过行程编码为：3a4b4c3d1e3d2a一种简单且应用广泛的压缩编码，其压缩效率与图像数据的分布情况密切相关，适用于像素冗余的情况。

 预测编码

最佳预测编码

直方图的峰值\\标准差\\熵\\的物理意义

标准差小有利于压缩，熵小可接近熵，效率高

 Karhumen-Loeve变换

在获取、传输得到的一幅图象中，总混杂有许多随机干扰因素，称为随机图象。K-L变换是针对这类广泛的随机图象提出来的，当对图象施加了K-L变换以后，由变换结果而恢复的图像将是原图象在统计意义上的最佳逼近。协方差阵\\均值向量。

与其余正交变换不同的是，基于统计特性的变换。能量集中度最高，信息集中能力最优，运算量最大。

协方差的物理意义

均方差表示原图像与压缩复原后的图像之间的，指失真情况

变换阵由协方差的特征向量阵组成，代表主轴各特征值代表Y阵各维的能量题目：

1. 统计下面的灰度直方图，并计算熵

0 0 1 1 1 0 0 0 0 0 1 1 1 0 0 0 .

0 0 1 1 1 0 0 0 0 0 1 1 1 5 5 5 0 0 1 1 1 5 5 5 0 0 1 1 1 5 5 5 0 0 1 1 1 7 7 7 0 0 1 1 1 7 7 7

02. x1110 x20 x31000

1x401. 求K-L均值矢量及协方差矩阵 .

7. 图像分割

 图像分割是利用图像（亮度）的不连续性和相似性  边缘分割

梯度算子（梯度的方向）

fx'f(x1,y)f(x,y) fy'f(x,y1)f(x,y)

梯度的大小代表边缘的强度，梯度方向与边缘走向垂直。

Roberts梯度算子

fx'f(x1,y1)f(x,y) fy'f(x1,y)f(x,y1)

检测边缘效果略好于梯度算子

Prewitt和Sobel算子

不仅检测边缘点，还能抑制噪声，但检测边缘较宽

方向算子

利用一组模板对同一像素进行卷积，然后取最大值作为边缘强度，对应方向作为梯度方向

Laplacian算子（特点）

特点：1.各向同性（各向同性、线性和位移不变的） 2.可以检测斜坡（渐变）边缘。（对细线和孤立点检测效果好） 3. 检测边缘的同时，噪声被放大 4.产生双边缘现象。（由于边缘方向信息丢失）

Marr算子（平滑+拉普拉斯）

正态分布，高斯函数

在存在较大噪声的场合，由于微分运算会引起噪声的放大。

Canny算子（梯度+平滑） Canny如何认定边缘点

对边缘检测质量进行分析，提出三个准则：

1）低误判率准则 2）定位精度准则 3）虚假边缘准则边缘点的认定：

1）像素（i，j）的边缘强度大于沿梯度方向的两个相邻像素的边缘强度； 2）像素（i，j）与像素梯度方向的两个相邻像素的梯度方向差小于45度； 3）以该像素为中心的3*3邻域中的边缘强度极大值小于某个阈值。

 边缘连接

Hough变换

x-y空间的任意一条直线，对应于参数空间a-b上唯一一个点；x-y空间的点(x0,y0)，过该点的直线族，对应参数空间a-b上唯一一条直线。那么，再x-y空间上共线的点，它们对应参数空间的直线一定相交于同一点。

原理：直角坐标系上的一条直线对应于极坐标系的一点。设平面上有若干点，过每点的直线系分别对应于极坐标上的一条正弦曲线，若这些正弦曲线有共同的交点(',')，是这些点在直角坐标系中共线，对应方程为：

'xcos'ysin'

采用直线参数的变换为什么不行

当直线垂直时，直接斜率无限大，无法在空间中表示对应关系。当a趋于无穷时，将无法映射到参数空间。

光栅扫描

图论技术

 区域分割

区域的概念

区域是指相互连通的、有一致属性的像素的集合

直方图法

利用图像灰度直方图来确定分割阈值的方法

适用于图像容比较简单的情况（目标和背景的灰度差较大），峰谷比较明显。（呈双峰，有明显的谷）

判断分析法

利用类间方差最大，类方差最小来获取阈值计算图像灰度均值 m=(m1w1+m2w2)/(w1+w2)

222w1w2(m1m2)2 组方差ww112w22组间方差B

2B组方差小，组像素越相似；组间方差越大，两组差别越大。组间方差与组方差比2越大，分割效果越好。

w最佳熵自动阈值法

选取阈值t，使图像熵最大。目标区域O和背景区域B的熵可由下式计算

Ho(t)(pi/pt)Ln(pi/pt) HB(t)[(pi/(1pt)]Ln[pi/(1pt)]

oBH(t)HoHB取最大值

最小误差分割

是使图像中目标和背景分割错误最小。

局部门限法

当照明和透射不均匀时，整幅图像的分割将没有合适的单一门限，这时1)可把图像分块，对每块选一局部门限进行分割，如果某块有目标和背景，则直方图可呈现双峰，可定出局部门限值；2)如果一块只有目标或只有背景，则直方图不呈双峰，找不到合适的门限，但可以通过邻域的门限，通过插得到该块图像的门限值

分水岭方法—区域增长

种子像素的选取：利用迭代方法从大到小逐步收缩是一种种子选取的典型方法，如在军用红外图像中检测目标

时，可选用图中最亮的像素作为种子像素。如果对具体问题没有先验知识，则常可借助生长所用的准则对每个像素进行相应的计算。如果图像中呈现聚类的情况，则接近聚类重心的像素可取为种子像素

生长准则的选取：如当图像是彩色图像，仅用单色准则效果就会受影响；此外还需考虑像素间连通性和邻近性，否则会出现无意义的分割结果

停止条件的选择：一般生长过程在进行到没有满足生长准则需要的像素时停止，这是由于常用的基于灰度、纹理、彩色的准则大多为局部性质，没有考虑生长的历史。为增加区域生长的能力常需要考虑一些与尺寸、形状等图像和目标的全局性质有关的准则。在这种情况下需要对分割目标建立模型或输入一定的先验知识。

分水岭方法：

图像最初在一个低灰度值上被二值化。该灰度值将图像分割成正确数目的物体，它们的边界偏向物体部。随后阈值增加，每一次增加一个灰度级，物体的边界也随阈值的增加而扩展，当边界相互接触时，这些接触点变成相邻物体的最终边界。这个过程在阈值达到背景的灰度级之前停止。

这个方法可以解决那些由于物体靠得太近而不能用全局阈值解决的问题

分裂合并

分裂合并法基本思想

从整幅图像开始，通过不断分裂，得到各个区域，常用四叉树和金字塔式分割技术；将图像分成互不重叠的小区域，如16*16的块

1）对任一个区域Ri，不满足条件时，将其分裂成不重叠的4等分 2）如果相邻两个区域满足合并条件，就将它们合并起来； 3）进一步分裂或合并，直到像素级

这是一个递归算法，同样存在分裂合并准则的选取，和停止问题。

题目：

1.区域分割与区域增长有何区别？

区域分割没有考虑到图像像素空间的连通性。区域增长是把图像分割成若干小区域，比较相邻小区域特征的相似性，若它们足够相似，则作为同一区域合并，以此方式将特征相似的小区域不断合并，直到不能合并为止，最后形成特征不同的各区域。

特征相似性是构成与合并区域的基本，相邻性是指所取的领域方式。

8. 二值图像处理与形状分析

 二值图像与灰度图像

二值图像处理通常是由图像分割操作产生的二值图像的特点：

1）是由0和1两个值组成的图像；

2）二值图像处理算法快速简单，易于实现； 3）二值图像数据量小，对硬件要求低。

 二值图像的连接性和距离

邻接

0和1必须采用互反的连接方式

连接成份数与连接数

连接成份（连通成份）：把互相连接的像素的集合汇集为一组，称为连接成份，也称连通成份

单连接成份：不包含孔的的1像素连接成分多连接成份：含有孔的1像素连接成分

连接数：

Nc4(p)[B(pk)B(pk)B(pk1)B(pk2)]

kSNc8(p)[B(pk)B(pk)B(pk1)B(pk2)]

kSS={0,2,4,6}

欧拉数

在二值图像中，1像素连接成份数C减去孔数H的值，叫做这幅图像的欧拉数或示性数 E=C-H 对于1像素连接成份：E=1-H, 则图像的欧拉数等于所有1像素连接成份欧拉数之和

距离

距离是描述边界长度走向以及分割出区域图像像素之间关系的重要几何参数，也是相似性的重要测度。 1）当且仅当x=y时，d(x,y)=0; 2) d(x,y)=d(y,x);

3) d(x,y）+d(y,z)>=d(x,z).

欧式距离、4-邻域距离、8-邻域距离、八角形距离

 连接成份的变形处理

膨胀和收缩、开运算和闭运算

膨胀：把结构元素B平移z后得到的Bz，使Bz与X交集不为空集的所有点z构成的集合

膨胀可填充图像中的小孔（比结构元素小的孔洞）及图像的边缘处的小凹陷部分，

收缩：A用B腐蚀的结果是所有使B平移后，B仍在A中的z的集合。用B来腐蚀A得到的集合是B完全包含在A中时B的原点位置集合。

腐蚀可以消除图像边缘小突起的成分，并将图像缩小，从而使其补集扩大

开运算：腐蚀运算后再进行膨胀运算的组合运算AoS(AS)S

效果：1）删除小物体 2）将物体拆分为小物体 3）平滑大物体边界而不明显改变它们的面积闭运算：膨胀运算后再进行腐蚀运算的组合运算A•S(AS)S

效果：1）填充物体的小洞 2）连接相近的物体 3）平滑物体边界而不明显改变它们的面积

击中变换

目的是找到3种形状之一的位置，如X 的位置

 二值运算的应用

边缘提取，区域填充，连通分量的提取

边缘提取：β(A)=A-(AΘB) 区域填充：

连通分量的提取：Xk(Xk1B)IA

凸化

利用收敛后的击中变换的结果与图像做并集，四个结构元的结果再做并集，其结果为凸化的结果

细化、粗化

细化：不破坏连通性的前提下细化图像，保持物体不被分开。首先进行有条件的常规腐蚀过程，只将要删除的像素打上标记而不真正删除；然后逐步访问打上标记的像素，若删除该标记像素不会分开物体，就删除，否则保留

粗化：不把相近物体合并的膨胀过程称为粗化。1）做膨胀操作，但不立刻添加像素，只是打上标记。2）将不产生对象合并的标记点添加进来；3）重复执行，将产生粗化结果。

骨骼化（中轴变换）

中轴是和边界上至少两点相切的圆的圆心的轨迹；可以用火烧草场来说明，假设物体区域上铺满了干草，火从物体边界同时均匀地烧起，最后草全部烧光，火熄灭的地方就是骨骼。

修剪

在很多情况下，细化或骨骼化过程会留下很多短刺，这些是有两三个像素点的分支。这些短刺是由于边界上的单个像素的摆动引起的。短刺可以用3*3的算子来移去端点。

 形状特征提取与分析区域部形状特征提取；

原点矩和中心距、投影和截口、主轴

原点矩：mpqii1j1nmpjqf(i,j) 0阶矩m00 是图像灰度f(i,j) 的总和，二值图像中表示对象物的面积。

中心矩：中心/重心坐标iGnmm10,m00jGm01 m00 中心矩Mpq(iii1j1pq)(jj)f(i,j) GG作用：反映区域中灰度相对于灰度重心是如何分布的

例如：二阶矩M20和M02分别表示垂直和水平方向的惯性矩，M20>M02，则区域可能为一个水平方向的延

伸区域当M30=0时，区域关于i轴对称。同样，当M03=0时，区域关于j对称。

投影和截口：对于区域为N*N的二值图像，它在 i 轴（或j轴上的）的投影为：

p(i)f(i,j) p(j)f(i,j)

j1i1nn固定i0,得二值图像过i0而平行于j轴的截口及截口长度

f(i0,j) s(i0)f(i0,j)

j1n2M11主轴：tan(2)

M20M023 4 5 2 1 0 7

区域外部形状特征提取；方向链码描述

采用曲线起始点的坐标和线的斜率（方向）来表示曲线。边界方向链码表示既便于有关形状特征的提取，又节省存储空间。从链码可以提取一系列的几何形状特征，如周长、面积某方向的宽度、矩、形心，两点间的距离等。

链码存在的问题：1）链码相当长；2）由于起点和编码方法不同，编码不为一；3）链码不具备旋转不变性。

区域边界的周长

Lline(nne)2 ne偶码的个数

i1n链码的逆

11(a1a2Lan)1anan1La11 ai1(ai4)mod8

链码的逆描述了相同的曲线，但方向相反。

傅立叶描绘子

对于一个连通域，设法构造描述区域边界变化的周期性函数，通过傅立叶变换，使用低频系数描述区域大致轮廓，高频系数描述细节变化。

优点：使用级数展开的形式，对于平移、缩放和旋转等操作，不影响形状特征；此外，起始点选取对形状特征不敏感。

图像层次性数据结构，提取形状特征

 关系描述

字符串描述法

用字符串描述关系的概念和方法。

树文法

两种重要信息：节点的信息，可用一组字符来记录；另一类是关于一个节点与其相连通节点的信息，可用一组指向这些节点的指针来记录

题目：

1. 有一被处理的二值图像X，其中蓝点为要处理对象，而白点为背景，结构元素为B，标有’+’的点为中心点，试用结构元对图像进行腐蚀和膨胀处理。

2.开运算。

9. 图像纹理分析

 纹理

纹理是图像中的一个重要的又难于描述的特性，某些图像在局部区域呈现不规则性，而在整体上表现为某种规律性

 统计分析方法

统计矩

使用一幅图像或区域灰度级直方图的统计矩

n(z)(zim)p(zi)mzip(zi)

ni0i0L1L1μ0=1，μ1=0

二阶矩是表示灰度级对比度的量度，可以用于建立有关平滑度的描绘子2(z)2(z) 三阶矩是表示直方图倾斜度的量。直方图的对称性，向右倾斜（正值），向左倾斜（负值）四阶矩是表示相关平直度的量。一致性Upi0L1i0L12(zi)

平均熵ep(z)logi2p(zi)

灰度共生矩阵分析法（如何获得）

灰度共生矩阵反映了图像灰度关于方向，相邻间隔，变化幅度的综合信息，它可作为分析图像基元和排列结构的信息。

熵：是图像所具有的信息量的度量。若图像没有任何纹理，则熵值几乎为零，若细纹理多，则熵值较大

Hp'(i,j)log2p'(i,j) 纹理复杂，则H值大，反之则小

ij灰度-梯度共生矩阵分析法

自相关函数分析法行程长度统计法主分量描述法

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文

全部栏目

哈工大数字图像处理知识点总结