摘要:本文介绍基于信息量最佳波段选择中的单波段信息特征量、相关性系数、熵和联合熵、最佳指数、协方差矩阵特征值、波段指数的计算方法及特点,以石家庄市的TM影像为例,分析单波段信息特征量,相关性,最佳指数法,找出了最佳波段组合为1、4、5。 关键词:信息量,最佳指数,波段指数,最佳波段组合。
1 引言 随着空间技术,数字图像处理技术和计算机技术的不断发展,遥感技术
得到突飞猛进的发展----多光谱和高光谱技术的出现,是21世纪遥感技术的发展前沿和当今世界遥感关注的焦点之一,多光谱遥感数据的最佳波段选取是遥感图像增强处理的关键部分,直接影响到目视解译和研究对象的信息提取。目前遥感图像解译在相当的程度上仍依赖于目视解译.由于人眼对彩色比较敏感且分辨能力强,故应充分利用信息丰富的彩色合成图像进行目标判读.一般的数字图像处理系统都采用三色合成原理形成彩色图像,即在3个通道上安置3个波段图像,然后分别赋以红、绿、蓝色,叠合在一起形成彩色图像
[1]
。因此,如何从遥感提供
的多光谱数据中快速、准确选取最佳波段,以便于图像的目视解译和信息的有效提取,是遥感数字图像处理的关键问题之一。本文是基于TM图像信息量的最佳波段选择。
通常选择最佳波段的原则有3点
[2]
:(1)所选的波段信息量要大;(2)波段间
的相关性要小;(3)波段组合对所研究地物类型的光谱差异要大。那些信息含量多、相关性小、地物光谱差异大、可分性好的波段组合就是最佳组合,据此,可以认为相关性较强的波段组合在一起不会是最佳组合,高光谱遥感数据波段间的存在着不同程度的信息量重复和冗余。
一般选择波段的主要依据是:波段辐射量的方差应尽可能大,因为方差的大小体现了所含信息的多少,但由于地物在各波段的辐射特性之间存在相关性,用3个方差最大的波段合成的效果并不一定能获得更多的信息。当三者相关性很强时,各波段所包含的信息之间有可能出现大量的重复和冗余。因此,选择三个波段进行组合时,必须同时考虑方差要大而相关性要小这样两个条件2 最佳波段选择的理论模型
[4]
[3]
。
目前应用比较广泛的选取方法有各波段信息量
的比较、波段间相关性比较、最佳指数法(OIF)、各波段数据的信息熵和联合熵、协方差矩阵特征值法、波段指数法。
2.1单波段信息量的比较 根据遥感图像各波段包含的信息量进行数值评价来选择波段是进行波段组合的第一步
[5]
。通过分析,可以确定哪几部分或哪几个波段
(即波段子集)包含信息量的多少。各波段的标准差反映了图像各像元灰度值与平
均值总的离散度,一定程度上反映了各波段的信息量,其值越大,所包含的信息量越大。TM 图像各波段所包含的地物信息量,一般采用该波段图像覆盖的辐射量化级, 即亮度值范围或称亮度差(最大亮度值-最小亮度值)来衡量 标准差公式为 S=
1MN[6]
。
(Amnij-A0) 某幅图像为Aij,(i =1,2,3„„ ;
j=l,2,3……),其图像矩阵大小为MxN,Ao代表整幅图像的平均灰度值。亮度差反映灰度值的变化程度,其大小等于最大亮度值减去最小亮度值,公式:frange(i,j)=fmax(i,j)-fmin (i,j)。均值向量则表征图像中地物的平均反射
M1N1强度,f=
i0j0f(i,j)MN。
2.2波段间相关性比较 信息量最大的三个波段组合的图像,不一定信息量最大,因为在多光谱影像间存在着谱间冗余和空间冗余,所以我们在基于信息量的最佳波段选择时,应该考虑到波段间的相关性。相关系数描述了波段图像间的相关程度,反映了波段图像所包含信息的重叠程度.反映了的是各通道之间的相关性。因为图像数据的标准差越大,所包含的信息量也越大,而波段间的相关系数越小,表明各波段图像数据的独立性越高,信息的冗余度越小。多光谱影像各波段包含的地物信息量固然多寡不一,但基本上有一定的顺序。各波段之问信息的重迭与分异程度也表现出明显的规律。相关系数的大小反映的是各通道之间的相关性。波段间的相关系数反映了两个波段间的信息重叠度,如果两个波段间的相关系数大,则说明它们的信息重叠度高,因此可将相关性大的两个通道合二为一或者取其中一个
2
[7]
。波段问的相关系数公式如下:
1NnR=Sij /SijSjj 式中:Sij=COV(i,j)=
(XikXi)(Yjk-Yj)
k1其中i、j为1,2,3,4,5,7为波段数,Sij为第i波段与第j 波段的协方差;Xi 为第i波段的光谱灰度均值,Xi 为第i波段的第k个像元灰度值,Yjk 为第j 波段的第k个像元灰度值,Yj 为第j 波段的光谱灰度均值;k=l,2,3……,n为实验样区的像元数。R越大,说明波段问信息重叠越大。波段相关系数矩阵计算相对比较简单,一般的图像处理软件都有该功能。相关系数分析成了波段选择的基础,相关系数的计算也是最佳指数法的法所必需的。
2.3 最佳指数法(OIF) 因为图像数据的标准差越大所包含的信息量也越大,波段间的相关系数越小,表明各波段图像数据的独立性越高,信息的冗余度越小。故也可采用美国查维茨提出的最佳指数(OIF)的概念。
33OIF=Si/Rij
i1r1其中:Si为第i个波段的标准差,Sij为i、j两波段的相关系数。OIF越大,则相应组合图像的信息量越大. 对OIF值进行由大到小排列,最大OIF值对应的波段为最佳波段组合。此方法是目前最常用的波段选择方法。计算方法简单,易于操作,且更接近于波段选择的原则
[8]
.
2.4 各波段数据的信息熵和联合熵 一种既全面、效果又较好且较简便的方法。
信息熵定义来源于信息论和信号处理,它是对信息内容的客观评估遥感数据融合
[7][10]
[9]
。近年来在
处理研究中,信息熵常作为对融合图像信息质量的客观评价
指标。
联合熵表征了多个波段组合的信息量,联合熵最大的组合波段即“信息量最大”这个意义上的最佳波段。但联合熵方法计算量相当大,一般不易操作。计算时需要编写程序实现。 根据仙农信息论的原理
255[11]
,一幅8bit表示的图像X的熵为:
H(x)=-pilogpi(比特)
i0式中 为图像像素灰度值为i的概率。 同理, 2-3幅图像的联合熵分别为:
255H(x1,x2)=-
i1,i20pi1pi2logpi1i2255
H(x1,x2,x3)=-
pi1i2i3.logpi1i2i3
i1,i2,i30式中Pi1i2i3表示图像X1中像素灰度值为i1 ;图像X2中同名像素灰度值为i2 与图像X3中同名像素灰度值为i3的联合概率。一般来说,H (x)和H (x1 ,x2 ,x3)越大,图像(或图像组)所含信息越丰富。用熵和联合熵可以得出信息量大的波段及波段组合。 2.5 协方差矩阵特征值法 在多波段遥感图像的波段组合选择中, 章孝灿等、Charles
N2[3,12]
引提出了用计算Ⅳ维数据熵值原理进行优选最佳波段组合的方法,
N2N212最后选出了包含信息量丰富的波段组合。其公式为:H=
Ln(Ki)Ln(2n)Ln(Ms)
S112C12S222C13C23S332由于要选取的是三个波段,所以式中Ms=C21C31为
C32角线上的元素分别为各波段的方差,非对角线上的元素为两个不同波段的协方差。因为图像的熵(信息量)H随着变量协方差矩阵行列式的值变化,所以计算任意三波段组合的协方差矩阵行列式的值并进行由大到小排序,就可选出包含信息量丰富的三波段组合。由协方差矩阵进一步可计算波段间的相关系数矩阵,波段间相关系数由下式计算:Rij=
Sij2SiiSjj式中.Sij为波段间的协方差。利用协方差矩阵
特征值法可得到包含信息量丰富的波段,但是它是在完全服从正态分布的情况下得出的模型,选出的波段组合并非完全按照信息量大小排列。另外这种模型的缺
点是计算数据量大,处理速度慢。 2.6 波段指数法 波段指数
[7]
的定义:设 Rij为通道i与j 之间的相关系数,高光谱数据被分为k
n1,n2…….nk 。定义波段指数Pt=
StRt组,每组的波段Rw =
1nknk,其中Rt =Rw +Ra,
Rij(i≠j)。式中Si为第i波段的标准差, Rw为第i波段与所在组内其
i1他波段相关系数的绝对值之和的平均值,Ra 为第i波段与所在组外的其他波段之
间的相关系数的绝对值之和。从公式可以看出,它综合考虑了波段的信息量和相关性两个因素。标准差越大,表明波段的离散程度越大,所含的信息量越丰富,而波段的总体相关系数的绝对值越小,表明通道数据的独立性越强,信息冗余度越小。波段指数是从高光谱数据具有的特点出发,综合考虑了图像的信息量和相关性两个因素,并且是在分组成块的情况下设计的模型,而且还发现选出的最佳波段组合与由最佳指数法(考虑光谱特性后)得出的基本一致。波段指数能综合地反映波段的信息含量和相关性两个因素,可作为波段选择的依据
[13]
。因此,波
段指数法对高光谱数据来说是一种较理想的最佳波段选择方法。从波段指数公式可以看出,分子是关于标准差的,分母是关于相关系数的,这与最佳指数很相似,最佳指数的计算简单于波段指数,所以在波段选择时,最佳指数法用的更多。
3 基于信息量的最佳波段选择实验研究
3.1 试验背景 选择一景轨道号12434的TM影像,时间为1993年10月19日。ERDAS IMAGINE中的AOI工具切出石家庄市影像。所有实验在微机上进行, 所用软件为ERDAS IMAGINE8.6。由于TM6是与热有关的波段,所以在波段组合时不考虑,但一起计算了出来。从信息量和信息冗余这两方面来考虑,最佳指数为最优方法。各波段组合的最佳指数值同各波段的均方差之和成正比、与各波段间相关系数之和成反比。满足最佳波段组合选择的基本原则。又由于其简单的计算方法,所以本文以最佳指数法为例。
3.2 单波段信息量比较 从ERDAS中LAYER INFOR 可以得到各波段的统计信息,表1。
表1 TM各波段光谱信息统计表 项目 MAX MIN 亮度差 均值向量 标准差 4.783 3.445 6.026 7.676 13.912 3.743 9.638 TM1 140 48 92 64.810 TM2 74 17 57 29.659 TM3 96 16 80 35.328 TM4 103 9 94 41.287 TM5 250 6 244 60.613 TM6 145 115 30 128.805 TM7 254 4 250 34.436 从表中可以看出(1)标准差大小顺序为TM6> TM1〉TM5>TM4>TM3>TM7> TM2(2)亮度差TM7> TM5〉TM4〉TM1>TM3>TM2> TM6(3) 标准差与亮度差大小顺序不一样(4)如果仅仅考虑单波段,TM1信息量最丰富,TM5波段相对也较丰富。TM1、TM5是理想的波段子集,用此方法仅仅只能判断出单波段所包含的信息量的大小,仅供最佳波段选择时候作参考用。三个信息量都比较大的波段组合,往往组合后的信息量不一定大。因为波段间包含有信息量重复。
3.3 相关性分析 波段间的相关性用相关系数大小来表示,其计算是用ERDAS IMAGINE8.6中MODEL模块进行。通过计算可得出波段间相关性矩阵表。从相关性矩阵可以看出:(1)1、2、3波段相关性比较好, 1、2波段相关系数为0.8539,2.3波段相关系数为0.9426,1、3波段相关系数相对较小,为0.7565。(2)TM4和所有波段相关性比较小,与1、2、3、4、5、7波段的相关系数分别为0.0588、0.2993、0.25956、0.5387、-0.0104、0.3301。所以TM4是比较孤立的波段(3)5、7波段相关性较好,达0.9371,而7波段与2、3波段相关性也较好,所以在波段选择时应用5波段代替7波段。(4)波段选择时,应从1、2、3波段中选择一个,5、7波段选择一个(以5代7),加上4波段,就组成了最佳波段。 表2 波段间相关系数矩阵表 波段 TM1 TM2 TM3 TM4 TM5 TM6 TM7 TM1 1 0.8539 0.7565 0.0588 0.3741 0.2555 0.5009 TM2 1 0.9426 0.2993 0.6754 0.2791 0.7565 TM3 1 0.25956 0.7793 0.3371 0.8611 TM4 1 0.5387 -0.0104 0.3301 TM5 1 0.3842 0.9371 TM6 1 0.4717 TM7 1
3.4最佳指数分析法 最佳指数是通过各波段的标准差和波段间相关系数来计算的。根据OIF计算公式,计算出组合波段的OIF值,见表3。
表3 波段组合最佳指数表
项目 标准差和 相关系数和 OIF 27.1418 16.540 项目 标准差和 相关系数和 134 9 357 17.5038 235 24.8337 124 15.6355 457 12.9436 234 11.6318 137 12.7733 127 237 123 14.9787 16.0877 0.9716 1.5134 1.5776 0.8898 1.8121 1.9099 1.9034 2.1134 1.3859 1.4508 26.371 25.033 27.614 22.097 28.333 24.721 22.140 26.995 20.759 145 245 345 147 157 135 125 257 247 347 23.34 18.485 29.576 23.383 15.904 31.226 17.147 20.447 17.866 19.109 14.254 1.0749 2.5775 2.3973 1.212 1.8059 1.5015 2.1185 2.1113 2.5602 2.553 OIF 17.1970 11.4747 9.7539 13.1221 17.2911 11.4199 9.6516 8.4621 7.4639 5.5832
3.5 选择结果 OIF值最大前5位的波段组合大小顺序是:1、4、5 〉1、4、7 〉3、4、5 〉4、5、7 〉1、3、4。单波段也是1、5、4、7的信息量较大,所以最后最佳的波段组合为1、4、5组合。
4 讨论:
(1)从信息量和信息冗余这两方面来考虑,最佳指数为最优方法。各波段组合的最佳指数值同各波段的均方差之和成正比、与各波段问相关系数之和成反比。满足最佳波段组合选择的基本原则。然而在实际应用中,用这些方法选择出的最佳波段也存在一定的局限性。这些波段选择方法只考虑了信息量和相关性这两个方面,而没有充分考虑研究对象的光谱特征和卫星传感器的用途等方面。本问只
就基于信息量波段选择方法的论述。
(2)其实每个波段有其自身的特点,在实际应用中应该根据这些特点加实际情况进行波段的选择,基于信息量的最佳波段选择只是参考。如[TM1,4,5为解译居民点和水域的最佳波段组合,TM3,4,5为耕地、林地、草地的最佳波段组合。在地物解译时,应该根据单波段特点和地物特点来选择波段组合。
(3)根据高光谱数据各波段包含的信息量、波段间的相关性以及影像中各地物DN值光谱曲线的差异性,再结合联合熵、协方差矩阵特征值法、最佳指数法、波段指数法来进行最佳波段选择,可以弥补以往波段选择的不足之处。
14]
[参考文献]:
[1] 刘建平,赵英时,孙淑玲.高光谱遥感数据最佳波段选择方法试验研究[J].遥感技术与应用,2001,16(1):7—13
[2] 姜小光,王长耀,王成.成像光谱数据的光谱信息特点及最佳波段选择-----以北京顺义区为例[J].干旱区地理,2OOO,23 (3):215—220
[3] 章孝灿,黄智才,赵元洪。遥感数字图像处理[M].杭州:浙江大学出版社,2003:174-175 [4] 罗音 舒宁。基于信息量确定遥感图像主要波段的方法[J]。城市勘测,2002,(4):28-32. [5] 杜华强,赵宪文,范文义.分形维数作为高光谱遥感数据波段选择的一个指标[J].遥感技术与应用,2004,19(1):5-9.
[6] 戴昌达, 雷莉萍。 TM 图像的光谱信息特征与最佳波段组[J] 环境遥感,1989,4(4):282-291。
[7] 杨金红,尹球,顾松山 等。城区高光谱遥感数据假彩色波段组合研究[J]。南京气象学院学报,2005,28(3): 289-295.
[8] 李石华,王金亮,陈姚 等。多光谱遥感数据最佳波段选择方法试验研究。云南地理环境研究。2005,11(6):17
[9] 曹雪虹.信息论与编码[M].清华大学出版社,2004.
[10] Shannon C E.A Mathematical Theory of Communi—cation[J].Bell System Technical Journal。1948,27:379-423;623-656
[11] 贾永红.四种HIS变换用于SAR与TM影像复合的比较[J].遥感学报,1998,2(2):103—106.
[12] Charles.Selecting band combination from multispectral
data[J].Photogrammetric Engineering and Remote Sensing,1985,51(6):681-687 [13] 姜小光,唐伶俐,于长耀等.高光谱数据的光谱信息特点及面向对象的特征参数选择—— 以北京顺义区为例[J].遥感技术与应用,2002,17(2):59—64.
[14] 卢玉东,尹黎明,何丙辉等。利用TM影像在土地利用/覆被遥感解译中波段选取研究。西南农业大学学报(自然科学版),2005,27(4): 479-486.
study on optimal bands slection of Remote Sensing Data based on
information quantity
Abstract: The calculate methods and characteristics of band information quantity, correlation matrix, entropy and combined entropy, the optimum Index, cocariance matrix eigenvalue, band index ,which are based on information quantity, are introduced. Take the TM image of Shijizhuang city as example, anlysising the information index, covariance matrix, the optimum Index, we conclude that the result of optimum bands combination is band1,band4 and band5.
Key words: information quantity, the optimum Index, band index, optimum bands combination.
因篇幅问题不能全部显示,请点此查看更多更全内容