M essy GA是一种典型的变长度染色体遗传算法,在寻优过程可以提高优良的染色体片断在群体中的比例,加速优良染色体片断的传播速度,从而获得比简单遗传算法更好的性能2.1编码和适应度函数由聚类目标函数J可知,聚类最终目标是获得样本集X的一个模糊划分矩阵U和聚类中心向量V ,而U和V是相关的,因此本文对聚类中心向量V进行编码,设n个样本要分成c类, c的取值范围为[ 2 , c根据各自的取值范围,采用浮点数编码则一个个体I可表示为本文采用遗传算法同时对c和V进行优化,所以个体I的长度是变化的借助目标函数J来定义适应度函数f f(?):其中,ε为一给定常数下面是计算适应度函数的步骤(算法流程1):步骤1从个体基因串中获得对应个体长度的c个聚类中心参数v步骤2根据下式计算U矩阵中元素u步骤3按下式重新计算聚类中心参数:步骤4根据式(4)和式(10 )计算2.2选择算子本文选用带精英保留策略的轮盘赌选择方法来进行群体中个体的优胜劣汰操作为了保留稳定有效的选择压力,对父代中的个体按照适应度值由高到低进行排序,并按照序号赋予每个个体一个等级,这时第i个等级的个体被选中的概率定义为2.3切断算子和拼接算子变长度染色体遗传算法采用切断算子叉切断和拼接算子可将群体中各个个体重组,即将不同个体中对应于同一输入参数的染色体进行重组而形成新个体,具体流程见图2首先,切断算子将群体中父代个体v和v(分别由5个和3个聚类中心组成的向量)按照特定概率切成两个部分:以特定概率在染色体中选择一个位置,在该处将染色体基因型切断,使其成为2个新个体的染色体片断然后拼接算子以特定概率随机选取2个被切断算子作用后的个体,交换各自的相应部分,从而形成新个体v′和v′2.4非均匀变异算子对于一给定父代个体x ,基因x以一定概率进行变异,所产生后代x′=[ x可随机从以下两个公式选择:式中x和x是x的上限和下限表达式如下所示:式中:r为[ 0 , 1]之间的随机数T是最大进化代数b为决定非均匀程度的参数在遗传算法进化过程中,变异操作主要是保证群体的多样性本文采用以下策略对变异概率p进行自适应调整式中:p和p为常数,通常取值为0.1和表示种群最大适应度值f表示种群平均适应度值f表示要变异的个体适应度值2.5算法流程步骤1设置进化代数计数器t =1 随机生成m个初始个体组成初始群体P,每个个体染色体长度由聚类数c和聚类数据集维数决定,并根据算法流程1求出每个个体的适应度值保留种群最优个体步骤2对P做切断和拼接运算得P′步骤3对P′根据式(14)~式(17)做非均匀变异运算,得到P″步骤4根据算法流程1求出P″中每个个体适应度,然后采用带精英保留策略的轮盘赌方法进行选择,选择概率采用式(13)进行自适应调整步骤5终止条件判断,若不满足终止条件,则t =t 1 ,并将步骤4中的m个个体作为新的下一代群体P,然后转到步骤2 如满足终止条件,则输出计算结果,算法结束3仿真研究收集某煤粉制备车间2008年生产历史数据,选出具有均匀性和代表性的580组历史数据把前500组数据作为训练数据,利用本文所提M LSSV Rs方法和LSSVRs方法进行软测量模型的训练学习后80组数据用来验证软测量模型采用变染色体长度的遗传算法得到模糊聚类最优聚类数为5支持向量机中参数均选为:γ=立软测量模型对验证数据所得预测输出和误差通常采用平均相对变动值(average relative variance , ARV)衡量预测值与实测值之间的差别:式中:N为比较数据个数x(i)为实测值x为实测数据平均值x(i)为预测值从图3 ,图4中可看出基于FCM算法的M LSSVRs软测量模型比LSSVRs软测量模型对煤粉粒度具有更高的预测精度和泛化能力煤粉粒度的预测误差在±0.1 之间,训练数据ARV为0. ,验证数据集ARV为0.183 ,结果表明所提软测量模型具有较高的预测精度4结语针对煤粉粒度这个影响回转窑燃烧效率的不可直接测量变量,建立了煤粉粒度FCMSV Rs软测量模型采用变长度染色体遗传算法同时对FCM算法的模糊聚类数和聚类中心进行优化,避免了传统FCM聚类方法对数据分布的依赖性张立岩,岳恒,张君,等基于最小二乘支持向量机的制粉过程煤粉细度软测量模型[ J]清华大学学报, 2007, 47薛云志,陈伟,王永吉,等?一种基于Messy GA的结构测试数据自动生成方法[ J]