数字图像区域复制粘贴篡改操作的盲取证的研究(可编辑)
数字图像区域复制粘贴篡改操作的盲取证的研究
零
产
瓣摘要
论文题目:数字图像区域复制粘贴篡改操作的盲取证研究
学科专业:控制理论与控制工程
研究生:韩莎莎
签名:立阻
涵教授
指导教师:刘
签名:毒牛
摘要
随着科技的发展,数字图像能够被轻易地篡改并且很难发现其改动痕迹,导致图像篡
改的事件屡见不鲜,因此,数字图像的真实性认证技术成为研究的热点之一。数字图像真
实性认证技术分为以数字签名和数字水印为代表的主动认证技术和被动认证技术盲取证
技术。主动认证技术必须事先对图像进行预处理,通过在图像中嵌入附加信息来进行的
真实性和完整性认证。盲取证技术只需取证方的参与就可以直接依据图像信息如图像来
源、合成信号以及隐秘媒体来进行鉴别取证,不需要事先对图像做任何预处理,并且对拍
摄数字图像的数码相机没有特殊的要求,因此其实用性更强,应用范围更广。
数字图像的篡改操作主要包括合成、复制一粘贴、变形、修饰、增强、计算机软件生
成以及绘画等。本论文主要针对复制一粘贴篡改操作进行了数字图像盲取证问题的研究。
首先研究了图像区域复制一粘贴篡改检测算法的原理及过程,然后针对现有取证算法计算
量大、鲁棒性较差的问题,依据复制.粘贴篡改图像的复制区域和粘贴区域间的相似性特
点,采用了基于小波变换和主成分分析的检测算法、基于高斯金字塔分解和矩的检测
算法分别对数字图像区域复制一粘贴篡改操作的盲取证技术进行了研究和实验。
实验结果表明本论文算法能较好地检测并定位出大部分篡改区域,并对经过后续处理
的篡改图像,如添加不同程度的高斯噪声、用不同的质量因子对其进行压缩、用不
同等级的模糊因子对其进行高斯模糊处理以及多种混合处理,仍具有较好的
鲁棒性。
关键词:盲取证技术;复制粘贴篡改;小波变换;高斯金字塔变换;矩,
、
吣
:
:
:
:。啦血趟 :
:.
, ., .,
. ,
,
.,
.
,。,
.
,,, . ,
.,
,
.
.
.
,,,
。
。
,
.
;;
???一’? :攀。;
:
口
、
锄;目录
目 录
摘 要?.. 绪论?.
.弓言?.. .数字图像篡改方式?.
.数字图像盲取证技术研究现状??..
.数字图像盲取证技术存在的问题?..
.本文主要研究内容?.
区域复制粘贴篡改的检测算法
.最基本的检测方法?.
.图像区域复制篡改及检测的数学描述??.. .图像区域复制篡改检测的算法框架.. ..图像变换??..
..特征提取..图像匹配..篡改区域定位 基于小波变换和主成分分析的图像区域篡改检测. .
变换一
.检测方法..算法描述..检测步骤.实验研究..选取不同分块大小进行篡改
检测..
..篡改检测的鲁棒性实验??..
.结论?
基于高斯金字塔分解和矩的图像区域篡改检测??. .
特征的提取??..
.检测步骤.实验研究.结仑?
与展望.?
.本文完成的主要研究工作?
.进一步的研究工作?
致谢??.
参考文献.绪论
绪论
.引言
近年来网络技术的普及和多媒体数据的广泛应用,使得数字图像成为最普遍的多媒体
信息之一,同时图像编辑技术和处理工具的迅速发展,使得人们很容易进行篡改图像而人
眼难以辨识。虽然许多人只是想得到更好的视觉效果而对数字图像进行某些篡改,但是也
存在着别有用心的人为了达到其某些目的,恶意地传播一些经过精心篡改的数字图像,使
得网络中越来越多的、可以以假乱真的高品质的篡改图像广泛传播着。伪造和篡改的图像
如果被大量地用于媒体、科学发现和法庭证物等,无疑会对社会稳定和人们生活产生严重
的影响,人们不禁问:发布的新闻照片是否真实提交的照片能否作为法庭证据诸如此
类的问题促使数字图像取证技术研究需要深入发展。
数字图像取证技术是指分析、鉴别和认证数字图像的篡改、伪造及隐密,主要可分为
主动取证和盲取证。目前,主动取证技术是以嵌入附加信息为
来对数字图像进行真实
性鉴别,主要包括防伪技术以鲁棒数字水印为代表,防篡改技术以脆弱数字水印为
代表和认证技术以数字签名、数字指纹为代表。但实际上,绝大多数的数码相片中
并不含有数字水印,并且数字水印的安全性也很难得到可靠的保障,同时用户还需要接受
因嵌入数字水印而引起的图像质量下降的代价。另外,主动取证需要发行商、取证方以及
可能存在的第三方可信赖机构,在共享算法和密钥的前提下进行口?。因此,随着数字图
像篡改技术的迅速发展,由于受到应用场合的限制,以数字水印为代表的主动取证技术已
经无法满足图像发展需要。然而,数字图像盲取证技术不必事先对图像做任何预处理,通
过图像本身的统计特征等自然属性的变化,再来判断图像的真实性,同时它对数字图像的
拍摄来源没有特定的规定,只需取证方自己就可以进行图像的分析,因此实用性更强,应
用前景更广阔。
.数字图像篡改方式
最初的图像篡改操作需要专业的技术和相关设备,超出普通用户的能力。而如今,高
分辨率数码相机日益普及,功能强大的个人电脑、各种的图像编辑和处理软件推广,普通
的用户都可以很容易的对图像进行复杂的图像处理,不仅可以针对数码相机的处理缺陷进
行的补偿,从而达到更好的视觉效果,而且可以通过复制一粘贴等合成技术进行的伪造篡
改。图像篡改方式有很多,其中常用的包括:
.合成。即将两幅或多幅数字图像的某一部分拼接在一起最终形成一张合成的图像。
.复制.粘贴。它是数字图像中最常用的篡改操作。可分为两大类,一是不同图像间
的复制.粘贴篡改,另一类是同幅图像中的复制一粘贴篡改。其中同幅图的复制.粘贴篡改是
指将一幅图像的某部分复制并粘贴到该图不相交的另一部分。由于同一幅图的亮度、色彩
度等一般不会有很明显的变化、比较相似,如果在同一幅图中进行复制一粘贴操作,其篡
改拼接痕迹不明显,不会引起明显的视觉变化,不易于被人眼直接识别而引起怀疑。通常西安理工大学硕士学位论文
篡改中就使用同幅图的复制一粘贴来掩盖或产生该图中重要的人或物。在实际应用中,为
了篡改的更加不被视觉发现,往往还结合使用图像的模糊、缩放、旋转等操
作。
.变形。指将一幅数字图像以一种自然流畅的方式变成另一幅图像,进而将原始图
像通过逐渐变形而形成目标图像的过程。先要分别找出原始图像和目标图像上所对应点的
特征点,再以不同的权重叠加两幅图像,就得到包含两幅图像特征的变形图像。
.修饰。主要是在同幅图像中将局部细微区域进行复制一粘贴等方法而采用的一种图
像修补操作,如把没有斑点’皱纹的皮肤粘贴到有斑点皱纹的地方从而消除斑点皱
纹等,还常常用于图像篡改后的消痕,如用模糊润饰来消除拼接边缘的痕迹。
’
.增强。该操作通过改变数字图像中特定区域的颜色、对比度、背景等来强调突出
图像某部分内容,它虽然不能明显改变图像内容,但可以模糊或突出某些细节,或改变图
像的明暗程度,包括色彩和对比度调整,模糊和锐化,因此是一类更加通用的图像处理技
术。
.计算机软件生成。即由计算机生成软件来构造现实中不存在的场景图像,。其方
法是首先构建一个合适的三维模型,然后为模型加上纹理和颜色,并用一盏或多盏虚拟光
源去照射,最后通过一些虚拟的照相机进行截图,从而产生一张合成的相片。复杂的计算
机图形处理技术不仅可以对自然图像进行修改,而且还能制作出足够以假乱真的计算机图
形。
.绘画。指利用图像编辑处理软件进行图像的绘制。该类图像往往跟自然的图像有
一
较大差别,但技艺精湛的专业人员或艺术家绘制出来的作品经过高精度的扫描也能很逼
真。
在上述数字图像篡改的操作中,最常用的是合成、复制一粘贴、润饰和增强操作,在
实际图像篡改时,’常常将以上操作同时使用。当然篡改的定义并非是绝对的,常常与具体
的应用场合有关,同是一幅经过处理的图像也许在一些情况下是合法的,而在另一些情况
下却是非法的。因此,对于那些看起来似乎是真实的、毫无疑问的图像,我们也还是有必
要去使用一种简单而有效的方法去检测它的真实性。
.数字图像盲取证技术研究现状
数字图像盲取证技术是一项前沿的研究领域,近几年国内外研究才刚刚兴起,目前仍
然处于起步阶段,相关的研究队伍也很少,以美国的大学和研究机构较多【】。
教授为代表的美国大学研究团队,以自然拍摄的图像、
以
扫描图像以及计算机生成图像为对象,通过对数字图像进行多尺度小波分解和高阶统计建
模【订】的方法来进行盲来源鉴别和认证。来源不同的图像会在各个方向上具有不同的高阶
统计特性,该方法通过计算机的学习,找到这些特征的不同表现形式并以此进行分类,建
立了图像来源分类器。
以.为代表的美国大学研究团队,为了便于将隐蔽通信绪论
存在的判别作为证据,将分析隐蔽通信存在的隐密分析技术和盲取证技术研究结合起来,
主要发展研究数字图像完整性的隐密分析取证技术。
以.
为代表的美国大学研究团队,建立了在线的图像来
源认证测试系统以及对拼接图像取证进行了某些研究。此外,还有美国大学的
。
以及大学的
.教授、大学的
而国内在该领域的研究比国外起步较晚,虽然计算机取证技术的概念在国内早已提
出,也己举行了数次的计算机取证技术会议,但是数字图像研究机构还是相对较少,并且
仍处于起步阶段。
目前国内外研究学者已经提出了一些取证方法及其取得了某些研究成果,但与性能日
益提高的图像编辑处理软件和篡改者的技术日益专业相比,已经取得的取证方法和研究成
果力量还较弱,并不能满足实际应用的需要,因此更全面更实用的盲取证技术的研究仍很
急迫。
.数字图像盲取证技术存在的问题
综合国内外研究学者在数字图像盲取证技术方面取得的主要研究成果,从这些研究技
术现状可看出,现有的数字图像盲取证技术研究仍然面临如下主要问题:
.图像盲取证方法的针对性太强。所有的单一取证技术都不能对待检图像给出全面
的、确定的、精确的结论,而目前已提出的一些取证方法都是针对某些特定的数字图像篡
改方式以及它所使用的特定场合,却不能够普遍适用多种应用的图像背景。但在实际情况
下,对一幅图像的篡改往往综合了多种篡改手段,因此单一的篡改操作取证算法对图像的
检测效果可能受到制约,如何将各种篡改检测算法进行很好的融合,或根据图像的自然属
性寻求更为综合的、区分性更强的鉴别特征向量,是解决图像有效鉴别的关键问题或思路。
应用场合更加广泛的数字图像盲取证技术在分析图像时不具备任何先验知识,难以选取用
来检测图像篡改的特征向量,因此在图像篡改的盲取证技术研究中必须首先从各种确定
的、基本的图像篡改方式进行分析研究,然后将这些基本的图像篡改检测算法进行全方位
结合,最终的将很多的图像盲取证技术合适的结合起来,从而对待测图像给出一个全面的、
有效的鉴别结果。
.图像盲取证方法鲁棒性较差。已有的大多数的图像盲取证方法对篡改图像经过有
损压缩、添加随机噪声等后处理操作的鲁棒性较差。但在图像篡改中时常伴随着各种后处
理操作,如果取证算法鲁棒性较差则该算法的实用性就不好,不具有很好的
实用性。如就
图像压缩来说,多数的算法只能检测无压缩的原始图像,或者对压缩图像真伪鉴别的误差
较大。但事实上通常使用的图像是经过压缩的,如常用的图像。因此在盲取证研究
中应提高图像盲取证算法对于常用后处理操作的鲁棒性。
.公用的图像检测数据库缺乏。目前公用的图像测试数据库比较缺乏,致使图像盲
取证系统性能评价方法不统一,很难对各种篡改图像取证技术的性能只能定性的,却不能西安理工大学硕士学位论文
进行准确的定量比较,从而研究学者对该技术研究也造成一定的影响。因此,为了定量、
客观的比较各种篡改图像算法描述以及检测技术,公用图像检测数据库,统一的系统性能
评测方法的建立是迫切需要的。
.
.本文主要研究内容
本文针对图像篡改方式中最常用的复制.粘贴篡改操作提取较好的、较有效的检测方
法。这些方法都是采用块取证的盲取证技术,直接依据图像本身,并不需事先在图像中嵌
入数字水印或签名。依据在同一幅图中进行复制,粘贴篡改操作后图像中的
复制.粘贴区域
有很大的特征相似性,首先对篡改图像的特征进行研究,然后设计方法及所需相关阈值进
行检测并定位,为了进一步研究所提方法的有效性,对篡改图像进行一些如压缩、
高斯噪声、模糊处理及其混合处理等的后处理操作,并检测此算法的鲁棒性。
第一章:绪论。首先介绍了数字图像取证技术的发展及盲取证技术出现的必要性,以
及国内外对图像盲取证技术的研究现状和研究方向。
第二章:针对基于图像伪造过程遗留痕迹盲取证技术中的一种,即区域复制.粘贴篡
改检测,首先介绍了最基本的检测方法并讨论了各种方法的优缺点,然后介绍了综合检测
算法的数学描述,并提出了检测算法实现的关键步骤。
第三章:针对现有的复制粘贴检测方法特征维数较大和字典排序较大的缺点,提出了
基于小波变换和主成分分析检测算法。
第四章:针对计算量较大及现有的检测算法鲁棒性较差的缺点,提出了高斯金字塔分
解和矩的检测算法。’
第五章:针对本文研究的方向提出了下一步工作思路和对图像盲取证技术的展望。
区域复制粘贴篡改的检测算法
区域复制粘贴篡改的检测算法
为了掩饰图像中某些重要目标或制造出不存在的场景,数字图像篡改中一个最常用也
是最基本的操作就是复制.粘贴同幅图像中的某一部分来覆盖或制造图像中的需要篡改的
目标区域,由于该操作不会引起图像在亮度、色彩度等方面比较明显的变化,同时如果复
制粘贴的拼接区域不明显,不易引起人们视觉上的怀疑,图像篡改将会很难被察觉,如下
图所示,就是通过复制一块背景区域的重要目标来生成另一只。
图同幅图中进行复制粘贴操作,上图为原图,下图为篡改图
., ,
因为在同一幅图中进行复制.粘贴操作不会引起图像在亮度、色彩等人眼观察方面比
较明显的变化进而引起人们视觉上的怀疑,所以该篡改方法是应用最广泛的一种篡改方
法。如果复制.粘贴的连接区域不明显,原始图像的篡改将很难被觉察出来,虽然在实际
篡改中可能会对篡改后的图像进行一定的边缘处理过程,但是图像中的复制区域和相对应
的粘贴区域的自然属性还是基本上相似的。西安理工大学硕士学位论文
.最基本的检测方法
对同幅图像复制粘贴篡改操作取证的主要依据是检测图像中存在两个完全相同的区
域,通过寻找图像中存在的相似区域来检测图像的篡改痕迹,其检测方法主要有以下几种
【】【】】:
.穷尽搜索法
该方法先对待检图像进行分块,将每一子块与剩余的所有图像部分进行比较,判断有
没有与该子块完全相同的图像块,若有,则将该子块的尺度增大,并重新寻找判断,一直
当找不到与之完全相同的图像块为止停止搜索。
假设稚是×?大小灰度图在位置,的像素值,可表示:
.
扩一啪川?
其中:,?,,,,?,,,,?,一,,,?,?一。
该方法虽然理论简单、准确度高;但其运算量很大,对常见的图像噪声等的鲁棒性很
不好,并且当图像的尺寸较大时,显然该方法是不适合使用的。
.图像块自相关检测法
该方法依据由于复制和粘贴的图像块完全相同则它们就会具有很强的自相关性进行
匹配,首先应设定一个合适的自相关判别阈值,将选取的图像块与待测图像的所有的图像
块部分进行比较,若寻找到与该图像块的阈值超过事先设定的判别阈值,则认为这两个图
像块是相对应的复制一粘贴块。该方法的计算量比方法较小,但是它却只能检测出待测
图像中大于原图的/大小的、较大的复制粘贴图像块。
假设图像的大小为×,则它的自相关
为:
.
,??,,,?,,,,?,
扛
.
再由:
.
术曼‖,,,?一,
其中,?,一,,?,一,
可得:
.
,。舻?
其中,是傅里叶变换。
由于图像的大部分能量一般集中在低频部分,自相关检测是计算原始块和篡改块之间
的自相关函数厂的峰值,当直接计算整幅图像的自相关时,很大的峰值将会落在图像的角
落周围,因此在计算自相关函数峰值之前,先需要用高通滤波对待测图像进行处理。
.图像块匹配法
该方法的运算量比前两种都小,先对图像进行分块并将各个图像块写成向量的形式;
并用各图像块左上角的像素坐标来
该图像块的在整幅图像中的位置,则所有的图像块
就组成了一个图像向量矩阵,然后比较所有图像块矩阵来寻找相同的图像块,搜索中通常
采用字典排序法。为了避免图像中有可能存在少量相同的微小块或相邻的相同微小块的干
区域复制粘贴篡改的检测算法
扰造成误检,还要设定一个阈值,在一定范围内相同的行列出现的次数大于该设定阈值
时才可判断为其为相对应的复制一粘贴块。
图像块匹配方法依据图像块向量匹配的判断
是完全相同还是基本相同,可分为精
确匹配和模糊匹配,其中由于精确匹配只能找出完全相同的复制~粘贴块,在应用时受到
局限,并且其对自然图像噪声等的鲁棒性能不是很好,因此相对最实用的复
制一粘贴检测
方法还是模糊块匹配的方法。,该方法的主要
】提出基于主成分分析法
思想是在搜寻基本相同的行列之前,把所有图像块组成的图像矩阵进行先一定的主成分
分解,用每一行列的主成分来代表每一个图像块,然后再进行模糊匹配,该方法是将得
。
到的降维特征作为该图像块的特征描述,来减少特征空间的维数。而
提出的基于量化系数的模糊匹配法 ,其主要思想是把对
图像像素的点操作转化为块操作,先把图像进行分块并对每个图像块进行变换得到各
块的系数,然后用规定的量化矩阵对系数量化,并表示为向量的形式,就得到整
幅图像的向量矩阵,再对该矩阵进行模糊匹配,寻找待测图像的篡改区域。
但是以上算法显然都是直接对待测图像进行分块,然后选取一定的方法进行降维特征
提取,但重复分块得到的图像子块的数量相当大,特别当图像的尺寸较大时,计算机计算
时会所需较长的时间。因此为了进一步减少运算量、改进检测算法,产提出了一种基
于小波变换和奇异值分解的检测算法。该算法对待测图像进行小波变换而得
至』图像的低频
部分,再通过奇异值分解对低频部分进行处理,降低其数据维数得到了奇异值特征矩阵,
并对其进行字典排序,遍历排序后得到的矩阵,并根据图像块的偏移频率信息,就可检测
出复制篡改区域,该算法优点是同时考虑到了缩小图像尺寸和降低特征空间维数。文献
一提出的算法都用到了字典排序,显然相似图像块的特征向量也相近,则进行排序
后它们在排序矩阵中会相邻,所以它可以减少搜索范围,从而提高算法效率。排序矩阵的
规模是影响计算复杂度的主要因素,它的行数代表图像块数目,列数表示图像块特征维数。
从上面描述可以看出,复制一粘贴检测算法设计时需要从以下方面考虑:计算量;
判别图像。图像大小、篡改区域情况等应用背景会影响到模糊匹配法中的一些参数阈
值的设定,实现时需要人为选取,并且需要在准确度和计算量之间找到一个很好的选择。
因此,在进行模糊匹配新算法设计研究时,实质上主要从图像块特征向量的降维和判别阈
值的设定标准来进行考虑。
.图像区域复制篡改及检测的数学描述
一般来说,对数字图像内容的篡改都是针对图像中某块重要的连通区域,为了使篡改
的更加逼真、更难于察觉,往往该连通区域与篡改区域要不相交并保持一定的位移,且对
应的篡改的区域与目标区域都不能太小。骆伟祺等唧提出了区域复制篡改模型并进行了
一些合理的假设,但该模型只能针对篡改图中只有一处的篡改检测,并且还无法抵抗旋转西安理工大学硕士学位论文
篡改操作,因此王俊文【。对此进行进一步的优化修改,得到一个更实际的篡改模型。其
区域复制篡改的假设如下:
复制的是一个连通的且内部无空洞的区域;
可以同时有多处复制粘贴,但每个复制的区域只能进行~次粘贴,且粘贴的区域
可以根据需要进行几何旋转;
复制区域与对应的粘贴区域在空间上有一定的位移,且两者不能有重合的区域;
复制的区域应不会太小。
因此,基于上述假设可以将区域复制篡改数学描述为:
’首先假设面积阈值&,位移阈值?肪?栅,?腩,,在一幅篡改图像厂’中篡
,.,?,,为复制粘贴块
改区域,存在着相对应的区域对,,,其中,
数。
..咂,?尸,,】,,工::,?。,,::,?,,,:,:?只,???埔,只:’?氏
因为彩色图像也可通过简单的处理转化为灰度图像来进行分析研究,所以用,
表示自然图像的灰度值, ’是复制的区域,只是粘贴的区域,则篡改后的图像厂’,
以表示为:
。
.,
。厂’,少,;荽’支曼’歹三么:,,,?
那么图像区域复制粘贴篡改取证实质就是判断篡改图像中是否存在上述模型中的区
域对鼻,只.,.,?,为复制粘贴块对数并定位出相应区域。一般来说,伪造者对一
幅图像经过复制粘贴篡改后,还会对进行一些常见的后续处理操作,如加入噪声、进行
压缩、模糊处理等,减弱篡改拼接的痕迹,达到以假乱真的效果。因此复制的区域与
粘贴的区域只的值就不会完全相等,如果仅仅从像素值上进行比较,取证算法将会失败,
因此我们需要寻求对后处理操作鲁棒性很好的特征来进行检测。
.图像区域复制篡改检测的算法框架
经过上述对图像区域复制篡改检测理论的分析,结合模糊匹配法的研究,可以将整个
检测算法的思路分为以下几个方面分别进行考虑和研究:
..图像变换
基本的复制篡改检测方法虽然理论简单,但计算量太大,实际检测时算法检测效率较
低。虽然可以通过对图像像素的点操作转化为块操作,对图像进行分块的模糊匹配法来减
少计算量,但是我们还可考虑只需提取能进行区别检测的图像的主要特征。因此,可以在区域复制粘贴篡改的检测算法
检测图像时首先进行图像变换来进行减少计算的数据量以及去除噪声。
.小波分解
年,提出了多分辨率理论,小波开始成为重要的分析工具。小波变换是
一种基于变换而来的时频分析方法,在高频部分具有较高的时间分辨率和较低的
频率分辨率,而在低频部分具有较高的频率分辨率和较低的时间分辨率,具有多分辨分析
的特点,符合低频信号变化缓慢而高频信号变化迅速可以有效地从信号中提取信息‘?。
假设函数为/,则定义其连续小波变换五为:
亿,
啪搠南 脚等产
其中,是缩放因子,是平移因子,分别对应频率信息和时域信息, 是小波
函数,且它的复共轭是 。
将上式进行变换,使;,。,即离散化连续小波变换的缩放因子口和平移
因子,就得到了使用最广泛的离散小波函数为:
亿,
嗽赤半卜‰剐
一
在上式基础上得到它所相应的离散小波变换为:
.
吩,尼 几厕
离散小波变换是通过低通滤波器和高通滤波器实现,得到图像近似信息和细节信息。
不同尺度上对图像的分解过程可简述为:经过层小波分解可得到个近似分量、个
水平细节分量、个垂直细节分量以及一个对角细节分量,多层分解就是对该层上层的近
似分量继续进行小波分解,依次类推。如实验中的层小波分解过程可用如图.所示,小
波分解能够提供良好的细节信息且分解后图像的分辨率减小很多,从而降低计算的复杂
度。
爿.
三 ,
、 、
三日】
层小波分解 层小波分解
图分解过程
.?西安理工大学硕士学位论文
波函数是最简单的正交函数【】,它构造起来简单、计算方便、快捷,所以本
文采用、波函数对图像进行变换。离散波变换可在不同尺度下将图像逐层分解
得到个低频近似分量矛个高频细节分量,即水平细节分量、垂直细节分量和对
角细节分量,并且每个分量大小都是被分解图像的四分之一。如果对图像进行了层
小波分解,则第层可分解为低频近似分量比一水平细节分量。、垂直细节分量
三日。和对角细节分量。,而后低频近似分量三上。还可以按这种方式继续分解成皿洲、
斛、埘洲以及州。
把图?的原图进行了层波分解得到各层分量图,如图所示。从图
?我们可以看出,经过多层小波分解后的图像,在各个不同尺度下的分量图中,大部分
能量都集中在低频分量中,且其统计特性与原图基本相似,但通过小波变换
去掉了图像的
高频成分保留了低频成分,且可表示出原图的特性。另外,图像低频近似分量的尺寸大小
随着分解层数的增加而减小,且每增加层分解,尺寸会减小为原来的/。
小波分解得到的低频近似分量可以更少的数据量抓住图像的主要特征,且不易受细节
变化的影响,只对小波变换后的低频分量进行图像处理可以大大减少计算量。因此,本文
先对图像分成各个子块,然后对各子块进行多层小波分解,取最大尺度下的低频近似
分量作为图像各子块特征描述。由于图像子块尺寸大小和所需要的图像信息对小波分解层
数的取值都有影响。子块越大,分解的层数越多。而同一子块大小,分解的层数越多,低
频近似分量尺寸越小,所需的计算时间就会越少,但相对的低频近似分量所含图像的信息
量越小,造成的误检率就越高。因此,合理选取分解层数对以后的算法检测的误检率有很
大的影响。
原图
二层分解各分量图
图?
层小波变换各分量图 ?
.?.高斯金字塔分解【
数字图像经过金字塔算法可以分解成多个在不同空间尺寸的子图像,分解后尺寸较小
的子图像在上层、具有较低分辨率,尺寸较大的子图像在下层、具有较高分辨率,构成一区域复制粘贴篡改的检测算法
个金字塔形状,而由此得名。
设初始图像为,作为高斯金字塔的底层层,则高斯金字塔的第聊层图像是将
第聊一层图像和一个低通函数,进行卷积并将结果进行降采样,降采样所采用的是
隔行隔列,即.
??,?,,?,??。其中,。为第朋层图像的行数,上。为第聊层图像的列数,?为分解层数,权函数,
常取大小为×。如图所示,高斯金字塔是由多次低通滤波形成,因此分解层数越大,
尺寸越小,分辨率越低。
图?高斯金字塔层分解示意图 ?
.?..特征提取
特征向量选取是整个方法的关键,因为提取的特征向量一方面要可以极大的降低计算
复杂度,另一方面,要选择好的特征向量可以消除噪声、重压缩及各种篡改处理对检测效
率的影响。
.矩
矩【】特征又称为几何矩主要可表现数字图像的几何特征,而且它具有平移、 比例、旋转等不变的特性,又被称之为不变矩。
假设图像函数为,,则定义它的阶几何矩和中心矩分别为: .
州伽几,
.
朋??一萝厂,,,,,?,门
对于离散状态而言,计算,少的阶普通矩和中心矩为:
『
, .
聊朋??~西安理工大学硕士学位论文
.
甜朋??。,
其中,,,?,图像质心坐标用。,。来表示,从以上计算公式可看出,如 果图像有稍微变化时,普通矩聊也会随之发生变化,而中心矩“阳虽然对于旋
转变化仍
然明显,但对平移变化具有不变性。如果图像的特征直接选用普通矩或中心
矩来表示,则
该特征不会同时具有比例、平移和旋转等不变性。
因此,我们更进一步定义归一化中心矩为:
.
肿“朋/“品,其中,厂/,垡,,?
由该公式可看出,如果利用归一化中心距来表示特征,则此特征不仅具有平
移、旋转
不变性,更具有比例不变性。因此,利用阶和阶中心矩表示了个不变矩 日,,日:,?,日,。在实际应用时,为了便于比较,所使用的不变矩为: .
日女女,,,?,
经过变换后所采用的不变矩特征具有平移、旋转和比例不变性,并把它们作
为对象的
不变性特征。
.矩
提出了一组正交多项式?。,多项式,图像的矩实质
是该图像在这些正交基函数上的投影。多项式是立::?上的一系列正 假设这些多项式。,定义为:
.
圪。,,。,。
其中,玎是非负整数,是整数且满足:/一聊是非负偶数。是点,的极坐标, 是的函数,且满足:
九
注意有:.一删。这些多项式互相正交,因此满足下式:
蹦即警一
.
脓/,施方竽印叼
其中,础括区域复制粘贴篡改的检测算法
对于数字图像,少而言,它的门阶脚重矩定义为:
?。
彳。一一 。,肌。,?
坐标原点选取图像的中心,并将各像素点的坐标映射到单位圆内,忽略落在
单位圆外
的点,并有钙.。。。,然后计算图像的矩。因为矩具有旋转不变性,所 以可以将。。作为对象的不变性特征。
若已知数字图像,少所有的矩,依据矩的正交完备性,就可制造出,少。 重构公式为:
?一
.
夕,??。。圪。,
脚
其中,?一是矩的最大阶次,,是重构后的图像。显然,当?。。专?时, ,寸,。
由上式分析,使用吃,可提取图像的特征,低频特征由,值小的吃,来提取, 高频特征由珂值大的吃,来提取。而提出的个不变矩仅由低阶矩阶和三阶构
成,
矩可以任意构造高阶矩。
由上可以看出:图像的轮廓信息主要由低阶矩反映,而图像的高频细节部分由高阶矩
则反映。所以从理论上分析,矩的识别能力应该高于矩】。
..图像匹配
经过上述过程可提取各个图像块的特征向量,并将其按顺序进行存储,从而得到特征
向量矩阵,根据复制粘贴篡改图像中复制区域与相对应的粘贴区域基本上相似的特点,如
果图像中存在着区域复粘贴篡改操作,则粘贴部分与复制部分所对应的各子块的特征
向量应该比较接近,因此在进行相似块图像匹配之前,为了减少计算量、缩小搜索范围,
首先应将得到的特征向量矩阵按照一定方式进行排序,然后再选择某种相似度检测方法进
行检测,这样在进行图像块匹配时,每个向量只需与它相邻的一定空间范围内寻找符合的
相似块对。
..篡改区域定位
通常来说,一幅自然图像中并不存在很大范围的相似区域,如果检测到一幅图像中存
在大面积的相似区域,则它很有可能被复制篡改过,但是图像可能存在着局部的小面积的
相似区域,因此为了防止出现误检,我们可以通过数学形态学方法先对待测图形进行初步
结果处理,设定合理的面积阈值来消除一些小的孤立区域。西安理工大学硕士学位论文
在进行图像检测时,为了能定位出篡改区域,我们定义了以下阈值【:
相关性阈值‖用来衡量特征向量之间的相似度。
位移阈值?‖在进行块对之间的相似度匹配时,由于重合区域的存在,它们所对
则我
应向量的相似度必然很高,易造成高虚警现象。因此若选取的图像块大小为聊玎,
船。
们选取位移闽值?旃?朋
面积阂值‖由于拍摄、制作或经过后处理等方面原因,一般在自然图像中,不
小于整幅图像大小的.%的大面积区域存在着相似性的可能性是很小的,因此如果在检
测过程中,出现一幅图像中存在大面积的相似区域,则它极有可能是经过复制篡改过。因
此若原图像大小为×?,则我们选取面积阈值埔×?×.%,叩为受损系数。
基于小波变换和主成分分析的图像区域篡改检测
基于小波变换和主成分分析的图像区域篡改检测
.
变换
主成分分析【】是一种使用很广泛的正交变换,是将彼此相关的个变量 ,,:,?,。所具有的信息用个综合特征值,,:,?,。聊来表示,从而将数据从高
维
空间映射到低维空间的数据降维方法,来不仅能对图像特征降维,而且还能
提取图像的特
征。
设灰度图像矩阵,,:,?,,其中,,,?‰,则求图像的主成分的步 ,
骤如下:
.计算原图像的协方差矩阵;
.
.计算特征方程:一可
就可求出其个特征值九,,?垅以及各个特征值所对应的特征向量 。,,?。,?,聊,而且必须满足:特征值允?。,对应的
特征向量两两正交;
.基于得到的聊个特征向量,,求能够表示图像的个主成分;?”” . ?月”
胛所
其中,,:,?,。就是图像的第,,?,个主成分。
.通常用主成分贡献率来衡量各主成分占有原图像多少的信息量。
如果前几个主成分的信息量已经足够大,可完整描述图像信息,可舍去其余主成分,
从而达到去除掉原始图像的冗余信息、保留有用信息,降低特征空间维数,减少噪声和光
照变化影响的目的。
其中,定义主成分贡献率为九。/罗九,“,,?,,则在个主成分中,前个主成
分的累积贡献率为: 一.
.
仅。?九,/?九,,?,
通常根据需要我们选取多弘。。
.检测方法
通过离散小波分解的原理可知:小波分解得到的低频逼近子带可表示小波分解在最大
尺度、最小分辨率下对原始图像的最佳逼近,他的统计特征和原图像相似,且分解后低频
自带的尺寸为原始图像块的/,因此,利用小波低频分量作为图像块的近似分量,使运
算速率提高。西安理工大学硕士学位论文
..算法描述
本文首先基于区域复制篡改检测的模糊块匹配法,将待测图像分成各重叠小块,然后
对每个小块进行变换,得到各图像块的低频逼近分量并结合主成分分析作为
各图像
块的特征向量,然后对各特征向量进行匹配计算,得到初始的匹配结果,并按照规定标定
相似的图像块对,再利用数学形态学进行处理,输出最终的检测结果。
重叠块的划分
设待测图像大小为
,选择块的大小为门,它必须要小于篡改块,但选取的
块的大小也不能太小,将待测图像以该大小的像素按只有行或列不相同,从左到右、从
上到下的顺序进行多个重叠快的划分,则共得到?一”个图像块。进行图
像块的划分,随着分块的增大,检测的速度增快,但同一阈值条件下,漏检的可能性也增
大;相反,若分块太小,虽然检测的准确性有所提高,但检测的计算量增大、检测的速度
降低,并且还可能会出现大量的误检现象,因此必须根据待测图像的大小、人工估计的可
疑篡改区域以及进行反复的实验来最终确定合适的分块大小。
重叠块的特征提取
将待测图像经过重叠分块后,对各图像块分别进行波变换,得到其低频逼近分
量,虽然将小波低频近似系数作为子块特征已比原图像块数据进行了压缩,但特征维数还
是比较高,数据存在着冗余,如果直接利用它们进行计算,耗时会比较多、效果并非很好,
而主成分分析法可以以较少的维数特征来代替原来数据,且基本保留原原始数据的信息。
因此,为了进一步数据压缩,可以利用它对各图像子块的小波低频分量进行二次特征提取,
同时为保留尽量多的图像信息,取积累贡献率为口%。
综上所述:本文将小波变换和主成分分析方法结合起来,对区域复制篡改图像进行快
模糊匹配检测。先将待测图像分解成只有一行或一列不相同的重叠小块,然后对各图像小
块进行小波变换,将得到的各小块的低频特征进行主成分分析,最终作为各图像块的特征
向量并按顺序进行存储,从而得到特征向量矩阵。
图像块匹配
得到特征向量矩阵后需要进行匹配相似块,如果图像中存在区域复制一粘贴篡改,则
粘贴与复制部分相对应的特征向量会比较接近,为了缩小块匹配搜寻范围、提高计算速度,
我们先将向量矩阵中的所有向量,按照其第。个特征值进行字典排序,并记录各个特征向
量所表示图像块的位置,这样每个特征向量只需要在与它相邻的一定空间范
围内寻找其符
合阈值的相似块,从而能够减少不必要的计算,缩短计算时间、提高算法的效率。
本文在进行相似块匹配中,使用的是应用最广泛的相关性准则,即计算图像各子块间
特征向量的才关系数,如果块对间特征相关性系数越大,则它们相似度越大。
布关系数计算公式为:
基于小波变换和主成分分析的图像区域篡改检测
.
职咖褊
其中,,为和之间的互切、方差,,、,是和】,的自协方差,
和】,是检测图像各子块的特征。
篡改区域定位
在进行块匹配时利用匹配阈值得到相似块对,并结合位移阈值、面积阈值来定位篡改
区域,然后利用数学形态学对初步结果进行处理,设定一定的面积阈值来消除一些小的孤
立区域,最终实现篡改图像的准确定位。
..检测步骤
综上所述,本文具体检测算法步骤如下:
判断待检测图是否为灰度图,若不是,将其转换为灰度图;
设待测图像大小为×,将待测图像按行从左到右,从上到下的顺序进行只有
一行或歹不相同的,大小为×/的重叠分块,并用每块左上角坐标来表示该图像块的
位置,共得到? .×?一胛个图像块,如图?所示为易于观察和理解,这里
分别用白色和黑色矩形框标记第一和第二子块。由于分块的大小影响着检测的速度和效
果,我们需要根据实验具体情况确定最佳的分块大小;
图?图像分块不蕙图
.?
将分块得到的共?×?一”个,大小为×的图像小块进行一次
小波变换,并提取低频部分三厶,其大小变为形×形;
对以上得到的低频部分进行变换选取累积贡献率为%,提取各小块的
特征向量,,?,?×?一门,并转换为行特征向量矩阵,即每一行表示
一个小块的特征;
对上面得到的特征向量矩阵按行进行字典排序,并用各特征向量所代表的图像块
的左上角元素的坐标,,,来记录该图像块的空间位置。
将,与其相邻范围内的所有,,?一,,,】,?,进行相关系数西安理工大学硕士学位论文
计算,搜寻.是否满足:
盯.脯
‘?’
?:瓜习丽?晰
若满足,则将其标记为,否则,则标记为;
使用数学形态学方法对上述步骤得到的初步检测结果进行处理来填充一些
空洞以
及消除一些小的孤立区域。
.实验研究
按照以上方法,本文实验选取大小为
的灰度图像?,图像转化
为灰度图像,进行复制粘贴篡改操作得到篡改图图?,实验的环境计算机的配
置为:
主频为.
,.
.。
存,软件环境为
的
。
图?
原图
图?篡改图..?
..选取不同分块大小进行篡改检测
选取的分块大小为,玎,运行时间为.,检测结果如图?所示; 选取的分块大小为,胛,运行时间为.,检测结果如图?所示。 图?分块大小
图?分块大小.
.?
结合图?并根据实验结果可以看出:由于特征选取图像的低频成分和主成分,因此
分块越小,检测所需时间越长,出现误检的地方也越多。
’
叁?::壅奎垫塑圭盛坌坌堑箜璺堡垦垫叁塾丝型
????????????????????????????????????????????????????????????
一一。
一
..篡改检测的鲁棒性实验
为了验证算法的鲁棒性,我们分别对篡改后的图像进行后续处理,添加不同程度的高
斯噪声,用不同的质量因子对其进行压缩,用不同等级的模糊因子进行高斯模糊和
混合处理,并分别进行检测。
.
选取的分块大小为,/。
用不同的质量因子对其进行压缩,检测结果如图?所示:
压缩图像
压缩图像
压缩图像
图?不同质量因子压缩后的检测结果.?
加入具有不同性噪比的高斯白噪声,检测结果如图?所示: 含噪声图像
含噪声图像
含噪声图像
图?不同噪声强度下的检测结果.?
??????????????????燮三查堂堡主堂堡垒查
用不同等级的模糊因子进行高斯模糊处理,检测结果如图~所示: 模糊处理图像,,
模糊处理图像:,:
图?高斯模糊处理的检测结果
.?
篡改图像经过混合处理,其中压缩因子;信噪比.傻:;模糊处理刀:, 标准差,检测结果如图?所示:
图?混合处理.
在实验中,定义检测率和错误率?来衡量检测算法的鲁棒性,;: ?《 , ;
.
卜?乏砑矿
?鼻,
??二?一
.
?四,』基于小波变换和主成分分析的图像区域篡改检测
其中,;:复制区域,;:检测出的复制区域,只:粘贴区域,只:检测出的粘贴
区域。
把大小为×的图像进行实验测试,在原图中先随机选取一个区域,把它
进行复制,然后将复制的这块区域粘贴到本图中任意的区域中,但粘贴的区域必须与复制
区域不相交,即得到的篡改图就是后续实验的对象,测试中所选取的复制区域大小分别为
整幅图像大小的%×,%×,%×,同时为了验证本算法的鲁棒
性,在实验时我们要对这个篡改后的图像分别进行不同的常用的后处理操作,如进行
压缩、添加高斯白噪声以及进行高斯模糊处理,并计算在各种操作下检测率的均值及错误
率的均值。
其中图?和图?所示为选用不同大小区域的篡改图像经过不同质量因子
压缩下的检测率和错误率均值。图和图?给出选用不同大小区域的篡改图像经过
不同强度的噪声干扰后的检测率和错误率均值。表?给出了选用不同大小区域的篡改图
像经过高斯模糊,后检测率和错误率的均值。
料
郦
翅
压缩因子
图一 压缩下图像的检测率 .?
姆
、
账
姆
压缩因子
图
压缩下图像的错误率.? 斟
’
郦
翅
,
图?添加高斯白噪声后图像的检测率
.
基于小波变换和主成分分析的图像区域篡改检测
.
一??一
.
一一?一一
??.
:??卜.
.?
槲
蝼.一
审皿
蜉
.
.
.
刚
图.添加高斯白噪声后图像的错误率.
表?高斯模糊检测结果
篡改区域 检测率 错误率 . . 。 . . .
从上述实验可看出,在相同的篡改区域大小下,篡改块经过的后处理修改越
小,检测
率越高、错误率越低;在相同的后处理操作下,篡改块尺寸的越大,检测率越
高,错误率
越低。并且本算法对在不同的分块大小和进行图像后处理操作,如压缩、高
斯噪声
和高斯模糊都具有很好的鲁棒性,还可以直接对大于一定阈值的相关系数的
复制一粘贴篡
改块对进行检测确认,而不用做错误块对剔除。从实验结果可以看出,本算法对篡改图像
有很好的检测性能,具有很好的鲁棒性并可准确定位篡改区域。西安理工大学硕士学位论文
.结论
区域复制粘贴图像篡改是一种最简单最基本也是使用很广泛的图像篡改技术,本文将
小波分解以及主成分分析方法结合起来,减少了计算量、降低了时间复杂度,提取图像块
特征得到图像块的特征向量矩阵,并对特征向量矩阵进行按照一定规则进行排序,从而缩
小了块匹配所需搜索的空间,利用定义的判别阈值实现对篡改区域的准确定位。最后本算
法还进行抗高斯模糊、有损压缩和高斯噪声干扰的实验。实验结果表明:本算法对
高斯模糊、有损压缩、高斯噪声以及它们的混合干扰都有很好的鲁棒性。当然,本
算法也有进一步改进的地方,例如,在篡改区域很小时,如何进一步提高算法的检测率、
降低错误率。另外,随着图像篡改的手段发展迅速,篡改者的篡改技术的曰益提高,单一
的盲取证技术将无法满足实际的取证和鉴定的需要,因此未来可靠的取证技
术需要依靠多
角度、全方位的对多种取证算法的综合运用。
基于高斯金字塔分解和矩的图像区域篡改检测
基于高斯金字塔分解和矩的图像区域篡改检测
.
特征的提取
通过矩特征的原理可知,利用二阶和三阶中心矩构造了已修正的个不变矩,
它
们在连续图像条件下具有平移、旋转以及比例不变性。 我们选取大小为×的灰度图像进行矩实验。在实验过程中,随机选取 图中大小为×的区域:::,将其分别旋转、取镜像块、压 缩、添加高斯噪声和进行高斯模糊等图像的后处理操作,取其只有一行或一
列不相同的重
叠相邻块::,:,然后分别计算它们的个矩如表?所示。
表图像块进行不同处理的个不变矩 ,原图
一. . . . . ?. .
像块
相邻
. ?. ?. ?. . . .
块
旋转
. ?. ?. . . . .
块
镜像
一. ?. ?. . . . .
块
?. ?. .
一. ?. ?. ?.
压缩块
添加
. . . . . . .
噪声块
高斯
. .
. ?. ?. ?. .
模糊块
实验结果表明,提出的已修正的个不变矩具有较好的不变性,可较好的抵抗
干扰,
且高阶矩对于图像几何形变、噪声等后处理比低阶矩更为敏感。而本算法中
为了抵抗高频
噪声的干扰,加强所选特征的鲁棒性,同时又避免由于计算高阶矩会花费很
长时间,只选
用维特征向量矿。,:,,,。来描述图像各子块得特征。
.检测步骤
本文依据区域复制篡改图像模糊块匹配,从时间复杂度和特征的提取上进行分析,将
待测图像先进行高斯金字塔分解,把低频的/图像部分作为分析对象,不仅降低了图像
子块的个数,大大减少了计算量,而且对噪声等低频较不敏感,提高了提取的特征的鲁棒
性。
西安理工大学硕士学位论文
综上所述,本文具体检测算法步骤如下:
判断待检测图是否为灰度图,若不是,将其转换为灰度图;
若待测图像大小为,将待测图像进行高斯金字塔分解分解层数选?
提取低频部分,大小为呖×%:
将得到低频部分按行从左到右,从上到下的顺序进行只有一行或一列不相同的,
大小为//
刀的重叠分块,共得到嘭一班%一船个图像块;
计算各小块的特征向量,,,,。,扛,?,%一聊%一即,
并按顺序进行存储就得到待测图形的特征向量矩阵,然后对其按行进行字典排序,并用各
特征向量所代表的图像块的左上角元素的坐标,,,来记录该图像块的空间位置。’
将,与其相邻,范围内所有,?一,,,】,?进行相似度计算,搜寻 是否满足:
.
、
.、
、’
??,一,?,一?曲
若满足,则将其标记为,否则,则标记为;
使用数学形态学方法对上述步骤得到的初步检测结果进行处理来填充一些
空洞以
及消除一些小的孤立区域。
将上述得到的结果进行上采样,并结合相关阈值,最终定位出的检测出的篡
改区
域。
.实验研究
在实验中,定义检测率、错误率?和误判率,来衡量检测算法的鲁棒性,如下:
;
?只 ,
’
卜?可不
,
?《
.
一?艺呵矿叫
;,
舢
?‘
.
驴?