陈爽文
(中国传媒大学信息工程学院,北京100024)
摘 要:随着网络的发展和无线视频的应用,分布式视频编码(DVC)理论越来越受到大家的重视。本文主要介绍了分布式视频编码的理论基础及其应用方法,并简要介绍了目前该领域的研究方向和成果。关键词:分布式信源编码;分布式视频编码;有损压缩;联合编码;码率控制;运动补偿中图分类号:TP393.03 文献标识码:A 文章编号:1673-4793(2007)02-0063-05
OverviewoftheStreamMediaTechnologyCHENShuang2wen(InformationEngineeringSchool,CommunicationUniversityofChina,Beijing100024,China)
Abstract:Alongwiththedevelopmentofthenetworkandtheextensiveusewirelessvideo,thetheoryofdistributedvideocoding(DVC)isvaluedbyeveryonemoreandmore.Thispapermainlyintroducesthefoundationofthetheory,theresearchdirectionandresultsofthatrealmcurrently.
Keywords:distributedsourcecoding;distributedvideocoding;lossycompression;jointdecode;ratecontrol;motionestimation
1 引言
分布式编码在信息论方面有非常悠久的历史,时间可追溯到Slepian-Wolf(1973)的无损分布式编码的信息论原理和Wyner-Ziv(1976)的使用解码端辅助信息实现的有损分布式编码。也许是因为缺乏应用,这些概念停滞了二十多年。然而,直到近几年,诸如无线视频、移动摄像电话和无线视频监控摄像机系统等应用开始提高了人们对于分布式视频编码的兴趣,并且强调只有找到建设性的和实用的算法才能使分布式视频编码有实际意义。
目前的视频压缩标准采用的是帧间预测编码,它利用了相邻帧之间的相似性。因为预测编码利用
了运动估计,所以使视频编码器的复杂度在解码端的5至10倍以上。这种复杂度不对称的编码方式对于广播或流媒体的点播等服务是非常合适的,因为这些领域的工作方式是一次压缩多次解压缩。然而,有些系统可能需要双向设置。例如,对于移动无线摄像机来说,当它将视频上传到一个固定基站时,压缩需要在摄像机端完成,而此处的存储和计算都很小。对于我们所说的这种系统往往编码器复杂度较低,而解码器的复杂度较高,不过仍然可以进行有效压缩。Slepian-Wolf和Wyner-Ziv的理论表明将一部分的计算量移到解码端很容易实现。分布式视频编码的目标就是利用这些理论来构造低复杂度的编码器,这是因为这些编码器的存储、计算和电力资源均有限。
收稿日期:2007-02-28
作者简介:陈爽文(1971-),男(汉族),浙江诸暨人,中国传媒大学信息工程学院讲师.
64
中国传媒大学学报自然科学版第14卷
2 分布式视频编码的理论基础
2.1 无损分布式编码的Slepian-Wolf理论
分布式编码是指对相关的两个或者多个随机序列进行编码,每一个序列使用一个单独的编码器,如图1所示,每一个编码器发送一个单独的比特流到一个解码器,该解码器对所有输入的比特流进行联合操作,因此利用了信号间的统计相关特性
图2 实际的Slepian-Wolf编码原理框图
码,可以采用系统通道编码,只传输奇偶校验位。在
解码端,用奇偶校验位与辅助信息Y合成纠错码。如果X和Y确实非常相似,那么只需要传输极少的奇偶校验位,则压缩效果显著。这种方法不采用前向纠错来防止传输通道产生的误差,而是采用一个相关通道来捕捉X和辅助信息Y的统计相关性。目前大多数的分布式信源编码技术都源自通道编码的思想,最早的研究是对统计相关的二值高斯信源使用标量和和trellis集构造的方法来研究解码端辅助信息的信源编码的非对称情况,随后又研究了对相同码率信源X和Y的对称编码方式。其后又使用嵌入式trellis集编码结构对高斯信源的非对称编码进行了研究,并获得了比之前的方法更好的实验结果。之后有更复杂的通道编码技术应用于分布式信源编码,如使用贝叶斯网络、维特比解码器、turbo码、LDPC(Low-DensityParity-Check)码等。2.3 有损分布式编码的Wyner-Ziv理论
图1 Slepian-Wolf编码原理框图考虑两个统计相关的独立同分布随机过程X和Y分别使用传统的熵编码器和解码器,可以得到
以下关系:RxH(X),RyH(Y),其中RX、RY和H(X)、H(Y)分别是X和Y的码率和信息熵。在编
码长序列信号时,如果有一个能够恢复X和Y的残差概率函数(数值较小但通常不为0),那么使用联合解码可以获得更好的效果。在这种情况下Slepian-Wolf定理表明,即使编码器是独立的,仍然
存在如下关系:RXH(X|Y),RY(Y|X)和RX+RYH(X,Y),其中H(X,Y)是X和Y的联合信息熵。这与对X和Y进行联合编码的情况是相同的。2.2 实际的Slepian-Wolf编码
基于Slepian和Wolf的理论,Wyner和Ziv建立
了使用解码端辅助信息的有损分布式编码理论。为了便于说明,用X和Y表示两个独立同分布随即序列的样本,两个序列可能有无限的符号集9和β,分别构造信源和辅助信息。信源X在编码时无法使
虽然Slepian和Wolf的理论可以追溯到上个世纪70年代,但是只是在最近几年才出现了实际的应用,从
而促进了其应用技术的快速发展。Slepian-Wolf编码类似于通道编码,为了便于理解,假设X和Y为二进制序列,如图2所示。其中采用与随即序列X统计相关的Y序列作为辅助信息(sideinformation),但是只应用在解码端,而不应用在编码端。
如果X和Y相似,那么会有一个误差序列φ=XY,它由大多数“0”和少数“1”构成,其中的“1”表明了X和Y不一致的地方。为了防止序列X产生误
图3 Wyner-Ziv编码原理框图
用辅助信息Y(如图3所示),而在解码端可以利用辅助信息得到重构值,则失真度为D=E[d(x,x)]。
wz
Wyner-Ziv率失真函数Rx|y(D)表示了在失真度D的约束条件下,分布式编码的码率下限。如果编码端同样可以利用辅助信息Y,则率失真函数为Rx|y(D)。Wyner和Ziv证明了如果编码端不能利用辅
∧
第2期陈爽文:分布式视频编码
65
wz
助信息,则Rx|y(D)-Rx|y(D)≥0。在高斯无记忆wz
信源、均方误差失真的条件下,Rx|y(D)-Rx|y(D)=
-Wolf编码器构成(如图4所示)。目前在量化器的
0,经实验证明码率损失小于0.5比特/样本。如果
信源序列X是任意分布辅助信息Y和独立高斯噪声的和,该等式同样成立。2.4 实际的Wyner-Ziv编码
设计上已经做了大量的工作,如有的用量化器把输入
信号空间分解成许多单元,但是这些单元由不连续的子单元组成,而这些子单元可以映射到相同的量化下标。首次利用这种方法,用Lloyd算法实现了固定码率下局部最优的Wyner-Ziv矢量量化器的设计。还有的通过实验证明如果码率较高,那么在一定条件下,最优的量化器为格型量化器,它无需将不连续的量化单元映射到相同的坐标下,而且既使编码端不利用辅助信息,性能也几乎不降低。与Slepian和Wolf编码一样,直到最近几年,人们才开始将Wyner-Ziv编码理论用于实际。总之,可以将Wyner-Ziv编码器想象成由量化器和Slepian
图4 一种实际的Wyner-Ziv编码器
3 分布式视频编码的实现方法
目前的视频压缩标准在编码端的计算量远远大
于解码端,然而,在某些应用场合则需要编码端简单,而解码端可以复杂。例如,作监测用的无线视频传感器、无线摄像机、移动可视电话和网络便携式摄像机等。以上应用中必须在摄像端进行编码,而此处的内存和计算量都很少。由Wyner-Ziv编码理论可知,在这些非传统的视频编码系统中,各帧独立
进行编码,而解码时进行条件解码。这样在编码时只需采用帧内编码,使编码器的复杂度大大降低,而运动估计和运动补偿则转移到解码端进行。事实上,这样的系统有可能得到的性能接近于传统的帧间编码方式(如MPEGx),而优于传统的帧内编码方式(如M-JPEG)。如果解码端的复杂度受限,也可以通过以下方式解决,结构如图5,即在网络中可以开辟一个固定的节点,由该节点依照Wyner-Ziv解码方式进行解码,然后重新按照MPEG和H.26x标准进行编码,再发送到解码端。
图5 无线视频应用的编码转换结构
3.1 基于像素的编码方法
这种编码方法将基于像素的帧内编码器与帧间
解码器结合起来进行视频压缩。首先从源图像序列
中等间隔地提取一组帧,也被成为关键帧K。这些关键帧的编解码均采用传统的帧内8×8DCT(离散
66
中国传媒大学学报自然科学版第14卷
余弦变换)编码方法,而这些关键帧之间的其它帧称为“Wyner-Ziv帧”,它们的编码器端采用帧内编码方法,而解码器端采用帧间编码方式。Wyner-Ziv帧在编码时以2M个间隔均匀量化,之后将量化坐标送入图4中的Slepian-Wolf编码器。而Slepian-Wolf编码器采用一种码率可调节的Turbo码进行编码,它的码率可随着编码帧与辅助信息之间的相关性而改变。首先,对于每一个帧,解码器都通过对以前已经解码的关键帧或Wyner-Ziv帧进行内插或外推来产生辅助信息。然后,解码器再利用辅助信息和收到的校验位进行重构。与传统的运动补偿预测编码方法相比,基于像素的Wyner-Ziv编码器的复杂度大大降低,虽然性能略有下降。3.2 基于变换的编码方法
每一个解码帧的校验码与传输的校验码进行比较,
由此决定采用哪一帧。另一种方法是发送hash码来帮助解码器进行运动估计,该hash码由对DCT量化系数的一个小子集构成,此外在重构时也可利用hash码对量化系数进行精简。
4 结论
以上只是对分布式视频编码具体应用的一些初步研究,若想使这项技术能够广泛应用,必须对各种应用领域的特点进行细致深入的分析,结合应用环境采用适合的编码方法。将量化、变换、熵编码及运动补偿等传统编码方法的各个环节重新设计。尤其要关注网络和无线应用的特点,非常典型的特点如有干扰,存在通道劣化,有衰减和多径效应引起的比特误码和突发误码等。当经压缩的视频经过这样的通道时,会使传输质量大大下降,对压缩视频的影响会很严重。此外,经过网络传输无疑会产生误码,因此非常有必要研究分布式视频编码的错误恢复机制和抗干扰能力。此外,还有码率控制问题。因为Wyner-Ziv帧的码率由解码帧和辅助信息之间的统计相关性决定。如果编码算法不变,相关性发生变化时,码率也会发生变化。参考文献:
[1] D.Varodayan,A.Aaron,B.Girod.Rate-adaptivedistributedsourcecodingusingLow-DensityParity-Checkcodes[J].AsilomarConferenceonSignalsandSystems,Grove,CA,2005.
[2] D.Rebollo-Monedero,B.Girod.Designof
optimalquantizersfordistributedcodingofnoisysources[C].In:Proc.IEEEInternationalConferenceonAcoustics,SpeechandSignalProcessing,ICASSP-2005,Philadelphia,PA,2005.
[3] A.Aaron,S.Rane,R.Zhang,B.Girod.Wyner
-Ziv
coding
for
video
applications
to
compressionanderrorresilience[C].Proc.IEEEDataCompressionConference,DCC-2003,
(下转第53页)
Pacific
在传统的、非分布式视频编码方法中,广泛采用正交变换编码,它将信源矢量进行分解得到谱系数,
再分别进行标量量化和熵编码。目前已经开始研究如何将变换编码用于Wyner-Ziv编码器。有文献提出采用DCT变换的方法,一种方法是对Wyner-Ziv帧首先进行DCT变换,再将变换系数进行量化。另一种方法是对Wyner-Ziv帧和辅助信息都进行DCT变换。此外,还有文献研究,对于无线视频传感器网络来说,不仅可以利用各视频序列之间固有的空间和时间冗余,而且可以利用不同传感器图像之间的相关性进行分布式视频编码,并提出了一种新的算法-分布式动态估计(DME)算法,这种算法可用于多目视频的编码。最近有人开始研究基于小波的分布式视频编码方法,该方法采用嵌入式基于小波的图像编码器进行帧内编码,而解码器寻找基于小波的像素块来匹配来自编码器的校正子,这样可以使运动估计的计算量由编码器移到解码器。3.3 联合解码和运动估计
传统的视频编码技术中,运动补偿用在编码端,方法是将编码帧直接与一个或多个参考帧进行比较,得到最优的运动矢量。而在分布式视频编码中,为了提高Wyner-Ziv编码器的压缩效率,在解码端采用运动补偿,并且需要联合解码。最早的方法是对Wyner-Ziv帧DCT变换后的量化系数计算校验码(CRC),并将其传输到接收端。解码端采用动态补偿,每一个预测块都有一个不同的动态矢量。将
第2期金立标等:MIMO-OFDM中自适应比特功率分配的研究
53
配比特和功率,在信道状况比较差的地方,就分配较
少的比特,在信道状况比较好的地方分配较多的比特。并且它的误码性能远远好于单输入单输出OFDM系统,对提高系统的频谱效率具有很重要的作用。参考文献:
[1] L.J.Cimini.Analysisandsimulationofadigital
mobilechannelusingorthogonalfrequencydivisionmultiplexing[J].IEEETrans.Commun.,33:665-675.[2] Y.(G.)Li,J.H.Winters,N.R.Sollenberger.
MIMO-OFDMforwirelesscommunications:Signaldetectionwithenhancedchannelestimation[J].IEEETrans.Commun.,50:1471-1477.[3] Thomas
Hunziker,
DirkDahlhaus.
Adaptive
OFDMtransmissionforbroadbandFixedwirelessaccesssystems[R].6thInternationalOFDM-Workshop(InOWo)2001,Hamburg.
[4] 尹长川,罗涛,乐光新.多载波宽带无线通信
技术[M].北京:北京邮电大学出版社,2002.
[5] 王文博,郑侃.宽带无线通信OFDM技术
[M].北京:人民邮电出版社,2000.
(责任编辑:王谦)
(上接第66页)
Snowbird,UT,2003.
[4] A.Aaron,E.Setton,B.Girod.Towardspractical
Wyner-Zivcodingofviedo[C].In:Proc.IEEEInternationalConferenceonImageProcessing,
Barcelona,Spain,2003-09.
[5] A.Aaron,S.Rane,B.Girod.Wyner-Zivvideo
codingwithhash-basedmotioncompensationatthereceiver[C].Proc.IEEEInt.Conf.onImageProcessing,Singapore,October24-27,2004.
[6] D.Rebollo-Monedero,B.Girod.Designof
optimalquantizersfordistributedcodingofnoisysources[C].
In:Proc.
IEEE
International
ConferenceonAcoustics,SpeechandSignalProcessing,ICASSP-2005,Philadelphia,PA,2005.
[7] H.Park,H.Kim.Motionestimationusinglow
band-shiftmethodforwavelet-basedmoving-picturecoding[C].
IEEETrans.
Image
Processing,vol.9,no.4,2000.
(责任编辑:宋金宝)
因篇幅问题不能全部显示,请点此查看更多更全内容