您的当前位置:首页正文

回归分析期中测试

2023-10-31 来源:爱go旅游网
期中测试题

一、填空题

1.变量之间的关系有函数关系、____________. 2. 所有子集回归中自变量选择的准则

有: 、 、 .

3.回归方程E(y)01x的参数0、1的最小二乘估计与最大似然估计等价的条件是 .

4.逐步回归方法中当 时,容易出现“死循环”.

5.一元线性回归的残差满足性质(1)(2) E(ei) ;var(ei) .6.对线性回归系数显著性检验的t检验来说,P值越小,t值 . 7.在 条件下,回归系数显著性的t检验、回归方程显著性的

F检验及相关系数的显著性检验是等价的.

8.样本容量n不变而自变量个数p增加时平方和SST、SSR、SSE分别如何变化? .

9.回归分析的主要应用有:经济结构分析、 、 . 10. 多元线性回归的基本假设有 、 、 .

11.处理多重共线性问题时,对自变量作线性变换使之两两正交,然后再对其作回归的方法称为 .

ˆ是线性回归方程E(y)x中的最小二乘估计,则有12.0010ˆ)= ,var(ˆ) . E(0013.多元线性回归方程的显著性F检验通过表明 对因变量y的线性影响显著.

14.判断某样本是否是异常数据时,我们常常要借助于 图.

15.普通最小二乘估计法的缺点是

二、判断题0

( )1.简单相关系数r0.8时,显著性检验可能没有通过;而简单相关系数r0.2时,显著性检验可能通过.

( )2.由标准化残差知,当ZREi3时相应的观测值一般是异常值. ( )3.简单相关系数r0表明变量间没有任何关系. ( )4.作预测时一般外推的效果要优于内插. ( )5.多重共线性问题在任何情况下都必须处理.

( )6.经典线性回归中残差序列e1,e2,,en是均值为0且等方差的. ( )7.矩阵XX有多少个特征根近似为0,设计矩阵X就有多少个多重共线性关系.

( )8.对回归系数显著性的t检验和对回归方程显著性的F检验是等价的. ( )9.强影响点一定是异常点. ( )10.前进法的缺点是“一棍子打死”.

( )11.多重共线性可导致回归系数的符号与实际不符.

( )12.VIFj10时,说明自变量xj与其余自变量间存在多重共线性问题.

三、选择题

1.自变量选择的一般准则是( ).

A) 少而精 B) 多而全 C) 尽可能使用全模型 D) 尽可能使用选模型 2.等级相关系数可用于检验样本的( )问题.

A) 异方差性 B) 自相关性 C) 多重共线性 D) 回归参数与现实不符 3.线性回归中普通最小二乘估计的缺点是( ).

A) 回归直线被拉向方差大的项; B) 回归直线被拉向方差小的项; C) 方差大的项在平方和中所起的作用小; D) 是有偏估计.

4.下列关于相关系数的说法中不正确的有( ).

A) 复相关系数反映了整体与共性指标; B) 简单相关系数反映了局部和个性指标;

C) 等级相关系数能够反映变量间的曲线关系; D) 简单相关系数反映变量间线性关系而等级相关系数不能.

5.下列关于相关分析与回归分析的说法中不正确的是( ). A) 变量在回归分析中地位不等,而在相关分析中地位相等; B) 在相关分析中两变量都是随机变量;

C) 相关分析不仅对变量间线性关系密切程度进行刻画还可以进行预测及控制;

D) 回归分析不仅揭示变量间的关系还可以用回归方程进行预测及控制. 6.用y表示北京市各开发区的销售收入(百万元),x1表示招商项目数,x2表示招商企业注册资本(百万元),作线性回归后得到回归方程为

**ˆ327.0392.036x10.468x2,标准化回归方程为yˆ*0.594x1,y0.485x2下面的说法不正确的是( ).

A) 招商项目每增加1个,销售收入增加2.036百万元;

B) 招商企业注册资本每增加1百万元,销售收入增加0.468万元; C) 招商项目数比招商企业注册资本对销售收入的影响大; D) 招商项目数比招商企业注册资本对销售收入的影响小.

7.在所有子集回归中,如果建立方程的目的是为了预测,应使用( )准则.

2A) Ra达到最大 B) AIC达到最小 C) Cp统计

量达到最小 D) R2达到最大

8.下列关于逐步回归法的说法中正确的是( ).

A) 逐步回归法的思想是“逐个引入” ;B) 逐步回归法一定优于所有子集回归;

C) 逐步回归法要求进出; D) 进出时容易出现“死循环”. 9.样本容量n与自变量个数p接近时,下列最不可能发生的是( ). A) R2接近于零; B) R2接近于1,但是显著性检验无法通过; C) 设计矩阵X的多重共线性问题严重;D) 参数的最小二乘估计的方差很大.

四、证明题

ˆ是回归方程E(y)x中参数的最小二乘估计,证明:1.00101(x)22ˆvar(0).

nLxxˆ*2.证明标准化回归系数与普通回归系数之间的关系:jj1,2,,p.

LjjLyyˆ,j3.帽子矩阵HX(X(1)H2H;(2)tr(H)p1. X)1X,证明:

ˆLSSR/14.证明:在一元线性回归中,t统计量t1xx与F统计量F之

ˆSSE/(n2)间满足:Ft2.

ˆ25.证明:1SSE是2的无偏估计.

np16.是矩阵XX的一个近似为0的特征根,c(c0,c1,,cp)是对应于特征根的单位特征向量,矩阵X按列分块后为X(X0,X1,,Xp),证明:矩阵X存在多重共线性关系.

五、解答题

1.考虑过原点的线性回归方程yi1xii,i1,2,,n,误差1,2,,n仍满

ˆ, 并计算ˆ的期望及方差. 足基本假设,求1的最小二乘估计112.对某地区的居民收入x(万元)与储蓄额y(万元)的历史统计数据作回归,部分结果如下:

y648.1240.085x,F300.737,sig0.000

残差图如下:

试分析:

(1)给定显著性水平0.05,回归方程的显著性检验结果如何? (2)从残差图上分析,这组样本数据存在什么问题?除了残差图外,还有什么方法可以诊断这种问题?

(3)样本数据中的问题如何解决?该方法的思想是什么?

3.根据某地区1995年-2004年食品需求量y、可支配收入x1、食品类价格指数

x2、物价总指数x3和流动资产拥有量x4

的数据资料作线性回归得到的方差分析表和回归系数表如下:

ANOVA b

Model Sum of Squares Regression 16616.844 Residual Total Coefficientsa df 4 5 9 Mean Square F 4154.211 6.631 626.463 Sig. .000 a33.156 16650.000 Unstandardized Coefficients Standardized Coefficients Collinearity Statistics t -1.801 3.660 -2.209 2.271 .305 Sig. .132 .015 .078 .072 .772 Tolerance VIF .008 .014 .008 .018 126.280 72.827 125.123 55.440 Model 1 (Constant) 可支配收入 B -135.335 .097 Std. Error Beta 75.132 .026 .902 1.497 .049 .821 -.376 .507 .045 食品类价格指数 -1.991 物价总指数 3.401 流动资产拥有量 .015 试分析:

(1)回归方程和标准化回归方程是什么?

(2)在0.05时,回归方程的显著性检验和回归系数的显著性检验结果如何? (3)判断数据有无问题,该问题将带来怎样的后果?详述本课程涉及的解决这一问题所有方法及其思想.

4. 考察第三产业对我国国际旅游外汇收入的影响,考察旅游外汇收入y(百万美元)与12个影响因素:x1——农林牧渔服务业;x2——地质勘察水质管理业;x3——交通运输仓储和邮电通信业;x4——餐饮业;x5——金融保险业;x6——房地产业;x7——社会服务业;x8——卫生服务业;x9——教育文化艺术;x10——科学研究和综合艺术;x11——党政机关;x12——其他行业.根据变量的设置情况试分析:

(1) 直接进行线性回归分析的结果可能会出现什么问题? (2) 详述你所知道的所有自变量选择的方法.

5.根据1983年-2000年中国粮食产量与相关投入数据进行回归分析得到的相关结果如下:

ˆ12816y.446.213x10.421x20.166x30.098x40.028x5,R20.9828,

F137.11,

其中:y表示粮食产量(万吨);x1表示农业化肥施用量(万公斤);x2表示粮食播种面积(千公顷);x3表示受灾面积(公顷);x4表示农业机械总动力(万千瓦);x5表示农业劳动力(万人).试分析:

(1) 给定0.05,回归方程的显著性检验结果如何?(F0.05(5,12)3.11) (2) 自变量x1和x5的偏回归系数的经济含义是什么?

(3) 方程中的偏回归系数合理吗?如果不合理,导致的可能原因是什么?

请给出几种解决该问题的方法并阐述各方法的思想.

因篇幅问题不能全部显示,请点此查看更多更全内容