收稿日期: 2010- 06- 20� 修回日期: 2010- 08- 01
� � 第 28卷 � 第 1期 计 � 算 � 机 � 仿 � 真 2011年 1月 � �
文章编号: 1006- 9348( 2011) 01- 0392- 04
化工原料中对羧基苯甲醛含量的软测量建模
邵联合 1,韩 � 莉 2
( 1. 保定电力职业技术学院,河北 保定 071051; 2. 东北电力大学自动化
学院,吉林 吉林 132012 )
摘要:研究化工原料生产中对羧基苯甲醛含量预测问题。传统对 4- CBA含量的实时控制的算法依赖样本数据的个数,导
致求解复杂,计算速度慢,准确度低。为了克服传统算法的不足,解决 PTA氧化过程非线性、时变、大滞后,样本数据采集困
难等问题,提出了一种基于最小二乘支持向量机的软测量建模
,采用小样本的
数回归预测建立了对二甲苯 ( PX )氧化
反应器的数学模型,通过交叉验证的方法进行参数选择,结果
明预测模型具有良好的非线性,较高的精确度,泛化能力强,
是用于 PTA氧化过程中 4- CBA含量预测的一种有效的方法。
关键词:软测量;数学模型;对羧基苯甲醛;最小二乘支持向量机
中图分类号: TP391. 9� � 文献标识码: A
Soft SensorM odeling of the 4- CBA Content in
Chem ical rawM aterials
SHAO L ian- he
1
, HAN L i
2
( 1. Pow er Eng ineering Departm ent, Baod ing Techn ica l and Voca tiona l Co lleg e
o f E lectr ic Power, Baod ingH ebei 071051, China;
2. Co llege of Automa tion Eng ineering, Northeast D ianliUn iversity, Jilin Jilin 132012, Ch ina)
ABSTRACT: C arboxy benzaldehyde content pred iction in produc tion o f chem ical raw m ater ia ls is resea rched. In or�
der to contro l the 4- CBA content in rea l- tim e, trad itiona l algor ithm s rely on the number of sam ple data, resulting
in so lv ing comp lication, slow compu ting speed and low accuracy. In order to ove rcom e the defic ienc ies of trad itional
a lgor ithm s and so lve the problem s o f nonlinear, tim e- vary ing, tim e de lay, the d ifficu lty o f samp le da ta co llection in
PTA ox ida tion process, a so ft m easure based on least square suppo rt vecto rm achines ( LS - SVM ) is proposed. A
m a them atical model o f P- xylene( PX ) ox idation reactor is established through m a ll sam ple function regression pre�
diction. C ro ss va lida tion m ethod is used to se lect param eters. The resu lt show s that the pred iction m ode l has good
nonlinear, high accuracy, and genera lization ab ility, so it is an effec tivem ethod in forecasting o f 4- CBA conten t o f
PTA ox ida tion process.
KEYWORDS: So ft- sensing; M a them a tica lm ode;l 4- CBA; Least squares support vecto rm ach ine( LS- SVM )
1� 引言
PTA苯二甲酸是生产聚酯纤维的主要化工原料之一, 对
羧基苯甲醛 ( 4- CBA )含量是 PTA产品中的主要杂质及重要
质量指标 [ 1]。根据反应机理研究, 4- CBA含量过低, 则表明
氧化反应程度加深, 副反应加剧, 能耗及醋酸、PX单耗增加。
而浓度过高则表明氧化反应停留时间较少, 氧化反应不足,
将导致 PX转化率过低, 这是生产过程主要必须控制和克服
的, 因此为了节能降耗,并保证 PTA的产品纯度,氧化反应单
元的 4- CBA含量实时控制是非常重要的。在工业生产中 4
- CBA含量往往通过离线光谱分析获得, 但离线的分析滞
后数小时, 且分析采样次数少 (一天两三次 ) , 远远不能满足
控制的要求, 为了实时预测中间反应物 4- CBA含量, 需要
建立一个预测模型。
传统几种用于 4- CBA含量预测的传统软测量建模方
法 [ 2- 4]及存在的不足如:
1)机理建模方法: 这种软测量方法是建立在对被测对
象有深刻认识的基础上,它要求对被测对象的内部特性完全
理解, 而 PX氧化过程是一极其复杂的非线性工业过程,影响
4- CBA含量的变量太多,很难建立精确的机理模型。
2)回归分析方法: 基于回归分析的方法需要大量的样
本数据, 对测量误差比较敏感, 而且只能得到变量问的稳态
关系。因而对于 PX氧化过程这一复杂的非线性工业过程,
�392�
采用回归分析法进行软测量建模也是不可取的。
3)人工神经网络方法: 针对 PX氧化这个是复杂的、具
有不确定性、非线性的过程, 采用神经网络方法可在不具备
对象的先验知识的条件下,根据对象的输入输出直接建模实
现 4- CBA含量在线测量。但是神经网络是基于经验风险
最小化原则, 而在 PX氧化过程能够获得的样本也是有限的。
神经网络结构过多地依赖于设计者的经验。存在过拟合现
象, 当输入信息、空间维数较大时, 不仅网络结构复杂, 而且
收敛速度慢, 甚至难以收敛和易陷入局部极小。
针对上述算法在线测量 4- CBA含量的不足, 提出了一
种基于最小二乘支持向量机的学习算法 ( LS- SVM ), 该算法
的训练过程遵循结构风险最小化原则, 将不等式约束改为等
式约束, 将经验风险由偏差的一次方改为二次方, 将求解二
次规划问题转化为求解线性方程组, 避免了不敏感损失函
数, 大大降低了计算复杂度, 且运算速度高。预测模型具有
良好的非线性, 精确度高,泛化能力强。
2� LS- SVM的基本原理
最小二乘支持向量机的算法描述如下:
对于给定的训练数据集 ( x i, y i ), 其中, i = 1, 2, . . . , l, xi
R, y i R,利用一非线性映射 �(! )将样本从原空间 RN映
射到特征空间 �( xi ),在高维特征空间中构造最优决策函数:
y ( x ) = �! �( x ) + b ( 1)
这样非线性估计函数转化为高维特征空间中线性估计
函数, 利用结构风险最小化原则, 寻找 �, b就是最小化:
R =
1
2
∀ �∀ 2 + C! R emp ( 2)
其中 ∀ �∀ 2。控制模型的复杂度, C 是正则化参数, 控
制误差样本的惩罚程度, R emp为误差控制函数,即 不敏感损
失函数, 常用的损失函数有线性 损失函数、二次 损失函
数、H uberg损失函数,选取不同的损失函数,可构造不同形式
的支持向量机。根据结构风险最小化原理, 回归问题表示成
约束优化问题:
m inJ ( �, !) = 1
2
�! � + C#l
i= 1
!2i
s. t. � yi = �( xi ) ! � + b + !, i = 1, 2, . . . , l ( 3)
其中, C为常数, b为偏差。用拉格朗日法求解这个优化
问题:
L (�, b, !, ∀) = 1
2
�! � + C #l
i= 1
!2
i
-
#l
i= 1
∀
i
(�( x
i
)! � + b + !
i
- y
i
) ( 4)
式中 ∀
i
( ∀
i
= 1, 2, . . . , l) 为拉格朗日乘子。由优化条件:
�L
�� = 0∃ � = #li= 1 ∀i�( xi ),
�L�b = 0∃ #li= 1 ∀i = 0,
�L
�!i = 0∃ ∀i = C!i, i = 1, . . . , l,
�L�∀i = 0∃ �! �( xi ) + b + !i - yi = 0,
� � � � � � � � � � � i = 1, . . . , l.
( 5)
根据 M ercer条件, 存在映射 �和核函数K (! , ! ), 使得
K (x
i
, x
j
) = �( x
i
)! �( x
j
)。利用 ( 4)消除 (5)中的变量 �, !可
以得到如下的矩阵方程
0 1Tv
1v ZZ
T + C- 1 I
b
a
=
0
y
( 6)
其中 I为 n % n的矩阵,
y = y1, . . . , y i ,
1v = 1, . . . , 1 ,
∀ = ∀1, . . . , ∀i
Z = � x 1 T , � x2 T, . . . , � x i T T。
根据 M ercer条件,定义核函数如下:
K ( x i, x j ) = (�( xi ) ! �( x j ) ), i, j = 1, . . . l ( 7)
综上,该方程组为:
0 1 & 1
1 K (x 1, x1 ) & K (x1, xi )
# # #
1 K (x
i
, x
1
) & K (x
i
, x
i
) + 1 /C
b
∀1
#
∀
i
=
0
y 1
#
y
n
( 8)
用最小二乘法求出回归系数 ∀i和偏差 b,得非线性预测
模型:
f( x ) = #n
i= 1
∀iK (x, xi ) + b ( 9)
由于该线性方程组通常采用最小二乘法求解, 因此称
此类改进的 SVM [ 5- 6]为 LS - SVM。LS - SVM具有很好的泛化
能力, 且训练速度要比
的 SVM更快, 更适用于小样本的
函数回归预测。
3� 对羧基苯甲醛 ( 4 - CBA)含量的预测
针对影响 4 - CBA含量因素 [ 7] 复杂性、不确定性、非线
性, 并且实际能够获得的在线样本数据有限, 本文采用 LS -
SVM 方法建立 4 - CBA含量预测的软测量模型。
3. 1� 辅助变量的选取
影响 4 - CBA含量变化的因素有很多,一般辅助变量的
选取遵循以下几个原则:
�393�
1) 过程适应性,工程上易于在线获取并有一定的测量
精度。
2 ) 灵敏性, 对过程输出或不可测扰动能作出快速反
应。
3) 特异性,对过程输出或不可测扰动之外的干扰不敏
感。
4) 准确性,构成的软测量仪表应能够满足精度要求。
5) 鲁棒性,对模型误差不敏感。
按照上述原则, 根据 PX 氧化过程机理分析 [ 5], 确定与
组分含量关系密切且容易测量的参数有: 混合罐进料流量,
催化剂浓度, 第一结晶器温度 , 第一结晶器的尾氧含量等为
辅助变量, 以 4 - CBA含量为主导变量。
3. 2� 模型的建立
在基于最小二乘支持向量机的软测量器中软测量模型
为最小二乘支持向量机。在软测量器中, 可测变量 X 对象的
控制输入 u、对象可测输出变量 y作为软测量器的输入变量,
被估计变量的最优估计为输出。在具体建立软测量模型时,
从输入变量中选择一组与主导变量密切相关的一组二次变
量, 作为支持向量机的输入, 离线分析计算值或大采样间隔
的测量值 !Y作为软测量模型的输出, 用 f ( x ) = #l
i= 1
a iK (x, x i )
+ b实现输入输出的非线性函数关系 Y = f( u, y, X )。
在进行最小二乘支持向量机建模时, 有两类参数, 即正
规化参数 C和核参数 (如生成多项式的核的阶数 d ), 是非常
重要的参数。本文采用交叉验证的方法进行参数的选取 [8]。
首先确定正规化参数集 S
c
= c1, . . . , cN 和核参数集 S∃ =
∃1, . . . , ∃N 。然后从参数集中选取参数分别进行组合, 对最
小二乘支持向量机进行训练。用确认集检验, 选出最佳的参
数组合作为模型的最终参数。
图 1� 基于最小二乘支持向量机的软测量建模
基于最小二乘支持向量机的软测量建模步骤见图 1。
在 PTA 生产过程中, DCS系统每隔半分钟采集一次数
据, 被采集的过程变量多达上百个, 将这些变量全部当作模
型的输入变量是不切实际的, 一方面会使模型复杂化, 另一
方面还会降低模型的预测能力, 因此在建立软测量模型之
前需要选择模型的输入变量。
为了使软测量模型在各种干扰因素存在的情况下仍能
较精确地预测 4 - CBA 含量的变化趋势, 在采集训练样本时
必须指定各个模型输入变量对应的滞后时间。
软测量模型的输入变量、变量滞后时间以及正常操作
值见表 1。从实时数据库中采集数据 463个样本用于训练。每
个样本有 10维属性, 分别代表在某一时刻工况下的操作参
数, 样本输出为 4 - CBA 浓度。
表 1� 模型采用的过程变量及对应的滞后时间
序号 变量 滞后时间 m in 设定值
输入变量:
1 混合罐进料流量, FPX ( kg. h- 1 ) 205 28243. 57
2
F反应氧化器进料流量, FFeed
( k g. h- 1 )
180 143008. 71
3 催化剂浓度, [ C o] ( ppm ) 185 361. 07
4 反应器温度, TR ( ∋ ) 110 188. 005
5 反应器液位, LR (% ) 110 88. 994
6
氧化反应器冷凝抽出水流量,
WWC ( kg. h- 1 )
95 673. 23
7 反应器尾氧含量, VOR (% ) 95 4. 075
8
总的反应装置抽出水量, WWD
( k g. h- 1 )
90 40939. 27
9 第一结晶器温度, TC ( ∋ ) 75 184. 88
10
第一结晶器的尾氧含量, VOC
(% )
70 4. 07
输出变量:
11
粗 TA中的 4- CBA含量, 4 - CBA
( ppm )
0 2702
4� 仿真研究
采用 LS - SVM 进行训练, 核函数为高斯径向基函数,
N = 453, 从 x ( 454) 开始预测, 不断更新函数模型, 直到
x (463)。图 2是 PTA样本集从 x ( 454)到 x ( 463)的测试过程。
其中蓝线为 4 - CBA 测量值,红线为预测值。
性能指标采用 P I = 1
N #Nt= 1 ( y ( t) - y* ( t)y ( t) ) 2, 式中 y ( t)
为实际值 y* ( t)是预报值。实验采用 RBF核函数, C = 50。其
性能指标 P I值为 0. 0015。
图 3为 PTA样本集从 x ( 250)到 x ( 463)为测试过程,其
中蓝线为 4 - CBA 测量值, 红线为预测值。其性能指标 P I值
为 0. 0021。
图 4为PTA样本集从 x ( 26)到 x ( 463)为测试过程,其中
�394�
图 2� 数据集 x ( 454) 到 x ( 463) 的预测
图 3� 数据集 x ( 250) 到 x ( 463) 的预测
蓝线为 4 - CBA测量值,红线为预测值。其性能指标 P I值为
0. 0069。
图 4 � 数据集 x( 26 ) 到 x ( 463) 的预测
根据上述的实验结果可以看出当训练样本越多, 其性
能指标值越大。LS - SVM 的训练只要求解一个线性方程组,
避免了不敏感损失函数, 大大降低了计算复杂度, 且运算速
度高于一般的 SVM。
5� 结论
最小二乘支持向量机用等式约束代替不等式约束, 将
优化问题转化为求解线性方程, 对内存的要求很低, 运算量
很少, 易于实现。在优化目标中选取了不同的损失函数, 同
标准支持向量机相比需要优化的参数减少, 模型确定更加方
便。利用其对 PTA氧化过程中 4- CBA含量的进行预测,
表明基于 LS - SVM 的预测模型具有很好的预测效果, 4 -
CBA含量软测量的实现为 PTA装置的稳定操作和离线指导
提供了依据。
参考文献:
[ 1] � 王树青,元英进. 生化过程自动化技术 [M ] . 北京:化学工业
出版社, 1999.
[ 2] � 俞金寿,刘爱伦, 张克进. 软测量技术及其在石油化工中的应
用 [M ]. 北京:化学工业出版社, 2000.
[ 3] � 李海青,黄志尧. 软测量技术原理及应用 [M ] .北京:化学工业
出版社, 2000.
[ 4] � 李修亮,苏宏业, 褚健. 基于在线聚类的多模型软测量建模方
法 [ J] . 化工学报, 2007, 58 ( 11) : 2834- 2839.
[ 5] � 吕志军,杨建国, 项前. 基于支持向量机的纺纱质量预测模型
研究 [ J] . 控制与决策, 2007, 23( 6) : 561- 565.
[ 6] � 邓乃扬,田英杰. 数据挖掘中的新方法 � 支持向量机 [M ] . 北
京:科学出版社, 2004.
[ 7] � 王丽军,张宏建, 李希. PTA生产中 4- CBA浓度的影响因素
分析和软测量 [ J] . 合成纤维工业 [ J] . 2005, 28 ( 6) : 1- 4.
[ 8 ] � 周林成,杨慧中. 基于 KPCA和最小二乘支持向量机的软测量
建模 [ J] . 计算机仿真, 2008, 25( 10 ) : 94- 97.
[作者简介 ]
邵联合 ( 1974- ), 男 (汉族 ) ,黑龙江虎林市人,讲
师,硕士,主要研究领域为智能控制、计算机控制技
术;
韩 � 莉 ( 1959- ), 女 (汉族 ) ,吉林省吉林市人,教
授,硕士研究生导师,主要研究领域为控制理论与控
制工程。
�395�