!电子技术应用" !""!年第 !期 本刊邮箱 #!"#$%&’!(&)*(&%
一般认为 #特征越多 #描述图像越充分 #越能反映事
物的内涵 $ 然而 #获取特征数据不仅需要大量的测量设
备和时间 #样本存储占用的空间和数据处理的计算量也
急剧增长 #而且 #还有一些对分类来说是冗余的甚至不
相关的特征会影响分类速度和分类器的泛化能力 $在低
维特征空间描述图像 #是特征提取需要解决的问题 $
主成分分析 "#$ %"&’()’*+, -./*.(0(1 $(+,23’3 4是一
种常用的特征提取方法 $ 它依据特征值的大小选择特征
向量 #消除了特征向量间的相关性 #从一定意义上体现
了特征向量中不同维对识别结果贡献大小的不同 $ 但是
至今还没有理论证明特征值大的特征向量对分类结果
的贡献大 # 而且这仅仅是体现在特征向量的代数特征
上 # 不能够充分利用特征向量的几何与结构分布的特
点 $ 为了更有效地选择特征 #人们已经提出了多种改进
方法 $ 文献 56 7提出了一种基于粗糙集理论的主成分分
析方法 #文献 58 7提出了一种基于遗传算法的主成分分
析方法 #文献 597提出了通过反馈监督学习反复调整特
征子空间的方法 $ 为了改善分类效果 #选择更有利于分
类的特征 #本文提出基于贡献矩阵的二维主成分分析方
法 $ 首先利用贡献矩阵对图像预处理 #通过二维主成分
分析方法提取图像特征 #最后利用支持向量机分类器检
测微钙化点 $
! 基于贡献矩阵的微钙化点
!"! 贡献矩阵
通过对微钙化点检测问题的实验发现 #不同的特征
向量对检测结果的影响是不同的 $ 为了更好地利用特征
基于贡献矩阵的微钙化点检测
胡正平 6:8: 吴燕 8: 王成儒 8
;6<哈尔滨工业大学 通信电子工程系 图像信息处理研究所 :黑龙江 哈尔滨 6=>>>6?
8<燕山大学 通信电子工程系 : 河北 秦皇岛 >@@>>A4
摘 要% 提出了基于贡献矩阵的特征提取方法$ 首先采用基于结构分析的统计方法构造贡献矩
阵#利用贡献矩阵对图像预处理 B通过二维主成分分析方法提取图像特征 $ 将此算法用于微钙化点图
像特征提取 #利用支持向量机分类器进行分类$ 实验结果表明#该算法加快了训练速度 #同时有效地
降低了微钙化点检测的假阳性$
关键词% 支持向量机 贡献矩阵 二维主成分分析 特征提取 微钙化点检测
&接上页’
像的空间相关性较差 #图像的纹理细节非常丰富#而不同
波段图像的纹理和边缘非常近似 # 图像之间存在纹理结
构上的相关性 #9 维 C"D-E 方法很好地利用了这种结构
相关性#因此取得了较 8 维 C"D-E 方法更好的压缩性能$
另外# 为了与基于小波零树的编码方法做性能比较 #
本文采用了 9 维 C"FGH 方法对小波系数进行编码$从实验
结果可以看出 #在相同码率下 #此算法的峰值信噪比较 9
维 C"FGH 方法有很微小的降低$ 然而#C"D-E 方法处理的
是小波系数块#不需要像 C"FGH 方法那样在整个小波系数
域内搜索零树#因此#计算复杂性和资源需求比 C"FGH 方
法低$ 这一点对卫星遥感平台的应用很重要$
参考文献
6 I $J $CK+*’&. < D/L0MM0M ’/+N0 ).M’(N O3’(N P0&.1&003 .Q
R+S0,013 ).0QQ’)’0(13 5I7 $ FDDD H&+(3 $C’N(+, "&.)033’(N#6TT9 (
A6%68 U%9A=>%9AV8
8 $ &C+’M#W &$ &"0+&,/+( & $ (0R Q+31 +(M 0QQ’)’0(1 ’/+N0
).M0) L+30M .( 301 *+&1’1’.(’(N ’( K’0&+&)K’)+, 1&003 5I 7 &FDDD
H&+(3 &-’&)O’13 +(M C2310/3 Q.& X’M0. H0)K(.,.N2 #6TTV (V%VU%
8A9%8=>
9 $ &F3,+/ #W &$ &"0+&,/+( &$( 0/L0MM0M +(M 0QQ’)’0(1 ,.RY
)./*,0Z’12 K’0&+&)K’)+, ’/+N0 ).M0& 5-7 &C+( I.30%C"FD [*1
C.) :6TTT %8TA%9>=
A \ &H+OL/+( &G’NK *0&Q.&/+()0 3)+,+L,0 ’/+N0 )./*&033’.(
R’1K D]-[H5I 7 & FDDD H&+(3 &F/+N0 "&.)033’(N#8>>>(T%^U%
66=_%66^>
= " &‘ &\&+N.11’#a & ".NN’#$ &b &" &b+N.P’(’ <-./*&033’.( .Q /O,1Y
’3*0)1&+, ’/+N03 L2 1K&00YM’/0(3’.(+, C"FGH +,N.&’1K/5I 7&
FDDD H&+(3 &a0.3)’0()0 +(M b0/.10 C0(3’(N#8>>>(9_;6U%
A6V%A8^
V 王 琪 #郭 雷 & 基于 6c8 维小波变换的多光谱图像压缩
5 I 7 &光子学报 #8>>9(98;dU%668V%668d
^ $eH[eFeF J#]$b‘$f\ J#J$HGFDf "
=%88> &收稿日期 %8>>AY66Y>A’
计算机应用
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
66
!电子技术应用" !""!年第 !期欢迎网上投稿 !!!"#$%&$%"’& !!!"($%&$%"’)*+’&
向量解决不同问题 #本文引入了贡献矩阵 $ 贡献矩阵和
原始特征矩阵维数相同 #且该矩阵的每一维数据反映了
原始特征向量的该维对分类结果的贡献大小 #用该矩阵
对原始特征向量进行预处理 $
产生经验矩阵的方法有 % "# $经验分析法 #取决于人
的经验 #无法通过计算机自动确定 & %&$基于结构分析的
统计方法 # 通过对大量图像的几何特征的分布进行分
析 #对乳腺 ! 图像中的目标进行定位 ’边缘提取 #通过
统计确定出每一部分对分类贡献的大小 #从而确定贡献
矩阵 & %’$反向优化算法 #根据前两种方法确定一个初始
的贡献矩阵 #然后按照这个初始值对样本处理 #求出分
类结果 #反过来根据分类结果修正贡献矩阵 #最后得到
一个优化的贡献矩阵使分类效果达到最好 $
本文采用第二种方法构造贡献矩阵 $ 由于微钙化点
是一些相对周围区域灰度值较高的亮点 #故在微钙化点
检测问题的分类中起重要作用的是相对邻域的亮点 #对
应贡献矩阵中较大的贡献系数 #对于其他的像素 #应赋
予较小的贡献系数 $
!"# 二维主成分分析
经典的主成分分析 ( )*是基于一维向量 #这里采用直
接针对二维图像数据的二维主成分分析方法 $
令 ! 为 " 维单位列向量 $ # 为 $!" 的随机矩阵 #通
过线性变换
%! "+ $
得到图像 # 映射的特征向量 $ 为了得到一个最优的
映射向量 #引入映射样本的总类分散度来度量映射向量
! 的判别力 $ 用映射特征向量协方差矩阵的迹来描述总
类分散度 $ 采用准则
’(!), ()"*+$ "& $
其中 *+ 为训练样本的映射特征向量的协方差矩阵 #
() "*+$表示 *+ 的迹 $ 最大化上述准则的物理意义就是找
到映射方向 !#将所有样本映射到该方向之后能够使映
射样本的总类分散度最大 $ 协方差矩阵 *+ 定义为 %
*+,, "%-,% $ .%-,% $ ( "’ $
,, (#!-,(#!) * (#!-,(#! ) */
于是
()"*+$,!/(, "#-,# $ /"#-,# $*! ") $
定义图像 # 的协方差矩阵 0(
0(,,( "#-,# $ ("#-,# $* "! $
从定义很容易证明 0( 是非负的 #而且可以直接从图
像训练样本得到 $ 假设共有 1 个训练样本 #第 2 个样本
记作 $!" 维矩阵 #2" 2,+-&-* -1 $#所有样本的平均图像
记作 ###这样
0(, +1
1
2 ,+
! "#2-##$ /"#2-## $ ". $
准则 %&$改写为 /
’ %! $,!/0(! %0 $
最优映射轴 !123 是最大化 ’+ 的单位向量 #就是 0( 对
应最大特征值的特征向量 $ 一般来说 #只有一个最优轴
向是不够的 #通常需要选择映射轴向的一个子集 #即最
大化 ’+ 的一组正交向量 !+#!* -!3
即
4!+-*#!35,67896:’"! $
!4/!2,;- 4" 2 5 4 6 2,+-*#
# 3 "< $
实际上 #最优映射轴 !+#!* -!3 就是 0( 对应前 3
个最大特征值的特征向量 $
!"$ 特征提取
利用最优映射向量提取图像特征 #对于一个给定的
图像样本 # #
%7!76 7,+-&-*#3 "= $
这样得到一组映射的特征向量 %+#%*#%3#称作图
像样本的主成分$ 需要指出的是二维主成分分析的每一个
主成分都是矢量#而一维主成分分析的是标量$ 8,(%+#%
*#%3*为图像的特征#用作后续分类器的输入$
!"% 支持向量机
支持向量机以结构化风险最小化代替常用的经验
风险最小化作为优化准则 #可以在理论上取得更好的泛
化性能 $ 下面以两类模式的分类为例说明其基本原理 $
设样本集 "+4#94$# 4 ,+- * -"#94$4>+# ?+5#其中 94
是模式 +4 的类别标号 #通过满足 @A7BA7 条件的核函数
: % ; # < $将输入模式映射到一个更高维特征空间 = 中 #
在此高维空间求取一个线性分类面 # 使两类距离最大
%称为最优线性分类面 $$
这相当于求解约束条件下的二次优化问题
9CD +
& 4 6 2
!9492: %+46+2$!4!2?
2
!!4# % %+;$
约束条件
"
4 , +
!!492,;- ;&!4&> %++ $
其中 > 是对线性不可分样本的分类错误的惩罚因
子 #!4 为每个约束条件对应的 E6876D8C6D 乘子 $
求解上述二次优化问题 #可以从训练样本中得到一
系列对应 !4"; 的向量 # 这些特征向量称为支持向量 #
分类面由这些向量决定 $
F,G8D
+4!*?
!94 !4 : %+46+ H>’ (@ %+& $
其中 *? 为支持向量 $
核函数的选择决定了高维特征空间 = 的结构 #常用
的函数有三种 %
多项式核函数
:(+6+4$, (%+++4$>+* A %+’ $
IJK%I6LC6M J6GCG KFDB3C1D$核
:(+6+4$,A:2 ? +-+4
&
" % %+)$
NC891CL 核函数
计算机应用
+&
!电子技术应用" !""!年第 !期 本刊邮箱 #!"#$%&’!(&)*(&%
真实
"# 个数
$ %& $&&’ %
% () *+,$’ (
( %- *-,%’ )
) %( *$,(’ (
. / $&&’ &
- %% *.,.’ (
/ $/ $&&’ %
0 (0 $&&’ )
* %& *.,&’ (
表 $ * 例测试样本微钙化点检测结果
检出率 12
!#"#$ 34 56789% :"$"&;<’ ; :$.;
!"# 算法描述
本文采用分等级的微钙化点检测 %预处理 &感兴趣
区域提取和钙化点检测 ’ 预处理包括图像增强和去噪 (
通过提取感兴趣区域 ) 可以去除大量不含钙化点的区
域 )提高训练速度和分类精度 ( 通过感兴趣区域中钙化
点的检测 )可以得到微钙化点 ( 感兴趣区域的提取以及
微钙化点的检测问题都是分类问题 )即将包含钙化点的
区域和不包含钙化点的区域或者钙化点与非钙化点区
分开( 本文使用支持向量机进行分类 ( 下面详细介绍感
兴趣区域的选取部分 )分为两个阶段 %训练阶段和测试
阶段(
!"#"! 训练阶段
:$ ;对每一幅感兴趣区域 #设为 (!) 维 *和非感兴趣
区域 #(!) 维 *的图像样本 )利用图像统计特征计算贡献
矩阵 *)且维数与图像相同 ( 图像的统计特征本文采用
统计平均值 =
+ :",$ ;4 $:%-<$;$:%-<$;
-
&. / . 0-
! 1:"2& #$2/ ; :$>;
对图像中的每个像素 ) 首先计算其 %-<$ 邻域灰度
均值 )根据该像素的灰度值与该均值的差值大小给贡献
矩阵对应的贡献系数赋值 3&/)且 &?3&/?$( 若差值较大 )
则说明该点对分类的影响较大 ) 应赋予较大的贡献系
数 +反之 )则赋予较小的贡献系数值 (
:% ;利用贡献矩阵对训练样本图像预处理 ( 这里定义
一种运算
4.5"64:7&/"3&/; :$+;
即图像各像素与贡献矩阵中对应位置的贡献系数
相乘 (
:( ;由公式 :>;, :@;& :A;利用二维主成分分析提取图像
特征 )作为支持向量机的输入向量 (
:) ;训练支持向量机 )保存最优分类面参数 (
!"#"$ 测试阶段
:$ ;对测试样本用大小 (!) 的窗口 )" 方向以步长 (B
%)$ 方向以步长 ) B% 遍历 ) 对窗口选定的每一个区域利
用图像统计特征计算贡献矩阵 (
:% ;利用贡献矩阵对测试样本图像预处理 (
:( ;利用二维主成分分析提取图像特征 (
:) ;调用训练好的支持向量机对测试样本分类 ( 本实
验使用 CD1 核函数 :见公式 :$);;)!4.)84$&&&(
微钙化点的检测 )基本步骤同上 )只是提取的特征
不同 ( 提取的钙化点的特征包括面积 & 对比度和从
ECF" 9EGHHIG7J CKLMI7 FKNK7JK7OK "65HMP;提取的四个方
向的加权和 Q .R)作为支持向量机的输入向量 (
$ 实验结果
本文对 $&& 幅乳腺 9 图像作为训练样本 )并对其他
A 幅测试样本进行测试 )实验结果如表 $ 所示 )给出了
每个测试样本中微钙化点 "S :"MOHIO6TOMUMO65MI7; 的真实
个数 &检出个数以及假阳性 12:16TVK 2IVM5MWK;( 与主成分
分析提取特征相比 )本文提出的特征提取方法 )运算速
度提高 ( 倍以上 ( 而且随着样本数量增多 )本文提出的
基于贡献矩阵的二维主成分分析比经典主成分分析具
有更显著优势 (
本文提出了基于贡献矩阵的二维主成分分析特征
提取方法 ( 首先 )与经典的对向量运算的主成分分析方
法不同 )二维主成分分析方法是直接针对二维图像数据
的 )因而大大减少了计算量 )加快了运算速度 ( 而且 )贡
献矩阵是根据特征向量对分类结果的影响大小来确定
的 )用来对图像预处理 )可以弥补经典主成分分析仅仅
基于特征值大小选择特征的不足 )选择更加有利于分类
的特征 (乳腺 X 线图像中微钙化点检测的实验结果验证
了算法的可行性 )在保证检测精度的前提下 )大大提高
了运算速度 (
参考文献
$ CIY67 Z, E[M7M6HV\M ] ^7JH_K‘ E\I[HI7, CIGL8 VK5 YK58IJV
M7 UK65GHK VKTKO5MI7 67J HKOIL7M5MI7, 2655KH7 CKOIL7M5MI7 aK5b
5KHV Qc R ] %&&( +%)d 0(($0)*
% EG7 eK867L]DKfMV ]gKIHLK] "MTTKH] CI76TJ, hf‘KO5 JK5KO5MI7
GVM7L UK65GHK VGfVK5 VKTKO5MI7, 2655KH7 CKOIL7M5MI7 Qc R] %&&)+
(+:$$; d%$>.$%$+>
( 蒋伟峰 ]刘济林 , 基于 NO6 学习子空间算法的有限汉字识
别 ,中国图象图形学报 Qc R ]%&&$+%d $@>$$*&
) 高秀梅 ]杨静宇 ]袁小华 ]杨健 , 广义主分量分析及人脸识
别 ,计算机工程与应用 Qc R ]%&&(+#$$* d($$(%])@
. i,F, S8K7L] XM6INK7L S6M] XM6I[KM S8K7 ] aMYM7L iG]
XGKTM7L aIG , SIYNG5KHb6MJKJ JK5KO5MI7 67J OT6VVMUMO65MI7 IU
YMOHIO6TOMUMO65MI7V M7 Y6YYILH6YVd6 VGHWKj ,2655KH7 CKOIL7Mb
5MI7 (> :%&&(;%%*>+$%**$
#收稿日期 %%&&)b$$b$@*
计算机应用
$(