五邑大学学报(自然科学版) 2008年 质为依据某种最优准则(如最小二乘准则、极小极大化准则等)构造目标函数Q,在约束条件下(如 使权重之和为1)极小化Q,求得组合模型的加权系数,该方法预测的精度高(相对于目标函数而言). 设由实际观察值构造的m种预测方法,记为: ( ),仍( ),…, ( ).为讨论方便将符号记为: 1)_),=(Y1,Y2,…,Y ) ,Y“ =仍( ); 2)在 ,X2,…,Xn点的拟合值为:Yf‘ = ( ),( 1,2,…,n); 3)与实际值的误差为: D=()I “一Yi),(i=1,2,…,n). 由式(1),可得: eo= =( ,( )一Yi).令 el1 e21 el2 e22 … (1) ,,l … E= 1 en2 …,,l ● ● : : ,,l 于是得到最优非负权重系数的非线性规划模型为: r rrifnQ=min )=k E Ek {e【k:1 k 0 (2) 由于非线性规划问题(2)式实际上是一个线性约束的二次规划问题,又由于对Vk≠0总有 )>0,从而可知一定有最优解存在 引.对于(2)式的求解可选用一般求解二次规划的算法来实 现.从而将最优组合预测方法的权重选择问题转化为一个二次规划问题. 所谓二次规划指的是某非线性规划的目标函数为自变量的二次函数,并且约束条件全是线性函 数.其数学模型为: r min ̄x Hx+fTx 西 I Aeq・x beq ㈩ L lb 1.2组合预测算法的实现 lIb 1)输入n组观察值x,Y; 2)由ra种预测方法可以确定误差矩阵E; 3)求解(2)式的非线性约束规划问题,得其最优解:k =( ,七三,…,km) ; 4)由k可得最优组合预测模型: ( ,k)=kl ̄(x)+k2仍( )+…+km ( ). (4) 2单一模型的选择和建立 2.1 多元线性回归模型 设要拟合的模型为 Y=属+届 + x2+…+ + . (5) 其中属,届,…, 为未知的待估参数, 为误差项.若对变量Y和Xo, ,…,Xm通过N次观测得到一 组数据:Y,,xj1,xj2,…, 『用, =1,2,…,N代人(5)式则得到: .Ⅳ Y = +∑ +Ej. =1 (6) 其中回归系数 利用最小二乘法求得.样本中各因子的提取采用统计检验的方法,最后,选人5个 因子作为预测因子,需预测水位作为响应因子.利用训练集计算出回归系数 和误差项 的估计值 维普资讯 http://www.cqvip.com
第22卷第1期 耿悦敏:基于最优加权的组合预测模型及应用 65 之后,建立回归模型为: Y=0.480 21xa一0.353 45x2+0.290 47x4—0.223 96xal+0.830 lx13+0.070 818. (7) 2.2灰色系统模型GM(1,1) 以灰色系统理论的GM(1,1)模型为基础的预测称为灰色预测㈣.目前,GM(1,1)模型是灰色系 统法中应用最普通的一种预测方法.GM(1,1)模型的计算步骤为:1)将原始数据进行累加生成;2) 利用生成后的数列建模;3)预测时通过反生成以恢复事物的原貌,最后计算出预测值.GM(1,1)模 型的白化微分方程为: 一+ax(1】:“十一 “. . df 经过拉普拉斯变换和逆变换,整理可得到GM(1,1)模型: (足+1)=lL (。 (1)一兰Ie一 +兰. aj a (8) 参数列为l I:(曰 曰)一 B ,其中, 一 ( (】 (1)+ ( 】(2)) ( (】 (2)+ (1 (3)) ,一 B= Y =【 ‘。 (2) ‘。 (3)… ‘。 ( )】 ; 一 ( 【 】( 一1)+ (】 ( )) 2.3 BP神经网络模型 BP网络是由Rumelhart、Hinton和Williams完整提出来的,它是一种包含有输入层、隐含层和 输出层的单向传播的多层前向网络,它解决了多层网络中隐含单元连接权的学习问题.由于系统是 非线性的,初始值对学习能否达到局部最小和是否能够收敛的关系很大.输入样本需要进行归一化 处理,使那些比较大的输入仍落在传递函数梯度大的地方.Hsui6l等的研究表明,1个三层人工神经 网络模型就可解决一般函数的拟合、逼近问题.水文预报实际上就是函数拟合问题,因此,三层人 工神经网络能满足要求.实验中间层的神经元传递函数选用s型正切函数tansig,输出层神经元传 递函数选用纯线性函数purelin,训练选用Levenberg—Marquardt(LM)算法. 隐层节点数的确定,参考公式nl= -Fm-F口,其中,m为输出神经元数, 为输入单元数,口 为【1,10]之间的常数.利用Matlab 7.0编制了BP人工神经网络模型计算机程序,进行训练集样本 训练,由小到大改变节点数,训练并检验其精度.图 1显示了训练次数为1 000次,期望误差0.000 1, 训练速率0.05的情况下,网络性能随隐层节点数变 化的趋势.在训练过程中,无论是训练样本还是测 试样本,开始的时候都是均方差随隐层节点的增加 而上下波动;接着,训练样本和测试样本的误差都 出现相对稳定的情形;随着隐层节点数的继续增 加,训练样本和测试样本的均方差再次随隐层节点 州 , 的增加而上下波动.当节点数的增加误差不再减小 时,其临界值即为应采用的数值.最后,经过网络 的实际训练结果比较,选定网络隐含层节点数为6, 此时网络能较快地收敛到所要求的精度. 隐层节点数 图1 BP网络训练误差曲线 维普资讯 http://www.cqvip.com
五邑大学学报(自然科学版) 2008焦 3预测实例 本文数据取自珠江三角洲天河水文站及其 上游马口和三水的水位及流量,下游大虎、南 沙、横门、冯马庙等9个水文站的水位,总计 截取连续观测213 h的数据.该问题可用图2来 流量与水位 水位 流量与水 水位 表示,天河站的水位与河道上游来水条件息息 相关,由于枯水季节降雨量微少,因而忽略不 计,允许误差在±0.1 m. 3.1单一模型预测 图2问题图示 用单一模型解决图2所示问题,结果见表1 表1 3个模型精度的比较 假设之前建立的回归模型为 ,BP网络模型为厂2,GM(1,1)模型为f3.利用训练集的预测结 f 0.006 488 5 0.002 843 9-0.001 340 11 E E=l 0.002 843 9 0.002 121 3 0.001 799 2 1. I—0.001 340 1 0.001 799 2 0.148 560 0 J 七氍]. 表2不同预测方法的预测结果比较 维普资讯 http://www.cqvip.com
第22卷第1期 耿悦敏:基于最优加权的组合预测模型及应用 67 续上表 4 结论 从表2不难看出,44"模型中精度最高的是组合模型,原因在于:回归模型、BP网络模型、GM(I, 1)模型都是通过对被预测对象所处的环境,结合自身模型的特点作了某些假设而得到的结果,对预 测对象的分析具有一定的局限性.而组合预测方法能利用更多的信息,使单一模型之间优势互补, 因而提高了模型的精度. 参考文献: 【1】BATES J N,GRANGER C W J.Combined forecasting[J].Journal of Operational Research,1969,20:451-468. 【2】王郁.组合预测何以兴起【J】.预测,1989(4):1-2,13. 【3】丁咏梅,周晓阳.组合预测在粮食产量预测中的应用【J】.决策参考,2004(3):44-45. 【4】文新辉,陈开周.一种新的最优组合预测方法及其应用【J】.西安电子科技大学学报,1994(9):284-290. 【5】邓聚龙.灰色系统一社会经济【M】.北京:国防工业出版社,1985. [6】BARNARD.Optimization for training neural nets[J】.IEEE Trans on Neural Networks,1992,3(2):232-240. 【责任编辑:熊玉涛】
因篇幅问题不能全部显示,请点此查看更多更全内容