您的当前位置:首页正文

基于matlab的稳健估计

2020-02-21 来源:爱go旅游网


稳健估计

一. 概述

测量数据处理是对一组含有误差的观测值,依一定的数学模型,包括函数模型和随机模型,按某种估计准则,求出未知参数的最优估值,并评定其精度。当观测值中仅包含偶然误差时,按最小二乘准则估计平差模型的参数,将具有最优的统计性质,亦即所估参数为最优线性无偏估计。

统计学家根据大量观测数据分析指出,在生产实践和科学实验所采集的数

据中,粗差出现的概率约为1%~10%(Huber《Robust Statistics》)。粗差被定义为比最大偶然误差还要大的误差,如果平差模型中包含了这种粗差,即使为数不多,仍将严重歪曲参数的最小二乘估计,影响成果的质量,造成极为不良的后果。随着全球定位系统(GPS)、地理信息系统(GIS)、遥感(RS)等先进测量技术的发展,测量数据采集的现代化和自动化,在某种意义上而言,粗差也不可避免地被包含在平差模型之中。因此,如何处理同时存在偶然误差和粗差的观测数据,以达到减弱或消除其对成果的影响,是近二十年来现代测量平差所注意研究的理论课题。

现代测量平差理论中,考虑粗差产生的原因和影响,在数据处理时可将粗差归为函数模型,或归为随机模型。将粗差归为函数模型,粗差即表现为观测量误差绝对值较大且偏离群体;将粗差归为随机模型,粗差即表现为先验随机模型和实际随机模型的差异过大。

将粗差归为函数模型,可解释为均值漂移模型,其处理的思想是在正式进行最小二乘平差之前探测和定位粗差,然后剔除含粗差的观测值,得到一组比较净化的观测值,以便

符合最小二乘平差观测值只具有偶然误差的条件;而将粗差归为随机模型,可解释为方差膨胀模型,其处理的思想是根据逐次迭代平差的结果来不断地改变观测值的权或方差,最终使粗差观测值的权趋于零或方差趋于无穷大,这种方法可以保证所估计的参数少受模型误差,特别是粗差的影响。

前已指出,在测量数据服从正态分布情况下,最小二乘估计具有最优统计性质。但最小二乘法对含粗差的观测量相当敏感,个别粗差就会对参数的估值产生较大的影响。

二. 稳健估计原理

稳健估计的基本思想是:在粗差不可避免的情况下,选择适当的估计方法,使参数的估值尽可能避免粗差的影响,得到正常模式下的最佳估值。稳健估计的原则是要充分利用观测数据(或样本)中的有效信息,限制利用可用信息,排除有害信息。由于事先不大准确知道观测数据中有效信息和有害信息所占比例以及它们具体包含在哪些观测中,从抗差的主要目标着眼是要冒损失一些效率的风险,去获得较可靠的、具有实际意义的、较有效的估值。

三. 案例分析

1.问题介绍

设某物品的长度X的真的8次观测值为:

L1=10.001 L2= 10.002 L3= 9.998 L4= 9.993

L5= 10.001 L6= 10.008 L7=10.500 L8= 9.997

均值为10.0625,试通过稳健回归分析其观测结果。

2.实验代码

clear all

a=textread('C:\\Users\\Administrator\\Desktop\\稳健估计\\源数据.txt')

x=a(1:1,1:8)

x=x'

y=a(2:2,1:8)

[b,stats]=robustfit(x,y,'huber',1.345,0)%稳健估计分析函数,可以选取不同的密度函数

dlmwrite('C:\\Users\\Administrator\\Desktop\\稳健估计

\\13.txt',b,'delimiter','\','-append','roffset',2,'coffset',0,'newline','pc')%写入数据

yhat=x*b

plot(x,y,'*')%画原始数据散点图

hold on%图形叠加显示

plot(x,yhat,'b-','linewidth',2)%画对应函数的的回归曲线,用蓝色加宽实线表示

legend('原始数据散点','robustfit函数对应的回归曲线');%图例

xlabel('影响因子(x)')%为x轴标注

ylabel('观测值(y)')%为y轴标注

3.数据输出与图形显示

1)实验输出b=1.0061

2)散点图与回归曲线如下:

从图中可以看出,L7的观测数据位粗差,应用稳健估计建立回归模型时应该不予考虑。

因篇幅问题不能全部显示,请点此查看更多更全内容