一、单选题
1. 抽样比的计算公式为( B )。
A. f= (n-1)/ (N-1) B. f=n/N C. f= (n-1)/N D. f= (N-n)/N
2. 不放回的简单随机抽样指的是哪种情形的随机抽样?(D ) A. 放回有序 B. 放回无序 C. 不放回有序 D. 不放回无序
3. 放回的简答随机抽样指的是哪种情形的随机抽样?( A ) A. 放回有序 B. 放回无序 C. 不放回有序 D. 不放回无序 4. 通常所讨论的简单随机抽样指的是( D)。 A. 放回的简单随机抽样 B. 放回无序随机抽样 C. 不放回有序随机抽样 D. 不放回的简单随机抽样
5. 下面给出的四个式子中,错误的是(D )。 A. E(y)Y B.E(Ny)Y
ˆ)R C.E(p)P D. E(R6. 关于简单随机抽样的核心定理,下面表达式正确的是( A )。
1f21f2S B. V(y)s
n1n121f2C. V(y)s D. V(y)s
nnA. V(y)7. 下面关于各种抽样方法的设计效应,表述错误的是( B )。
A. 简单随机抽样的deff=1 B. 分层随机抽样的deff>1 C. 整群随机抽样的deff>1 D. 机械随机抽样的deff≈1
8. 假设考虑了有效回答率之外所有其他因素的初始样本量为400,而设计有效回答率
为80%,那么样本量应定为( B )。
A. 320 B. 500 C. 400 D. 480 9. 在要求的精度水平下,不考虑其他因素的影响,若简单随机抽样所需要的样本量为300,分层随机抽样的设计效应deff=0.8,那么若想达到相同的精度,分层随机抽样所需要的样本量为(C )。
A. 375 B. 540 C. 240 D. 360 二、多选题
1. 随机抽样可以分为( ABCD)。 A. 放回有序
B. 放回无序
C. 不放回有序 D.不放回无序
2.随机抽样的抽取原则是(ABC ) A.随机取样原则
B.抽样单元的入样概率已知 C. 抽样单元的入样概率相等 D.先入为主原则 E.后入居上原则
3.辅助变量的特点( ABCD ) A.必须与主要变量高度相关
B.与主要变量之间的相关系数整体上相当稳定 C.辅助变量的信息质量更好
D.辅助变量的总体总值必须是已知的,或更容易获得 E.辅助变量可以是任何一个已知的变量 4.影响样本容量的因素包括(ABCDE) A.总体规模
B.(目标)抽样误差 C.总体方差 D.置信度 E.有效回答率
5. 简单随机抽样的实施方法(ABD) A.抽签法
B.利用统计软件直接抽取法 C.随便抽取法 D.随机数法 E.主观判断法
6. 产生随机数的方式有(ABCDE) A.使用计算器 B.使用计算机 C.使用随机表 D.使用随机数色子
E.使用电子随机数抽样器 三、简答题
1.简述样本容量的确定步骤。 2.简述预估方差的几种方法;
3.讨论下列从总体中抽得的样本是否属于概率抽选(回答“是”或“否”): (1)总体(1-112)。抽法:从数1-56中随机抽取一个数r,再从数1-2中抽取一个数,以决定该数为r或56+r;
(2)总体(1-112)。抽法:首先从1-2中抽选一个数以决定两个群1-100或101-112,再从抽中的群中随机抽选一个数r;
(3)总体(1-1109)。抽法:从1-10000中抽选一个随机数r,若第一位是偶数,则用后面的三位数来表示1-1000(以000代表1000);若第一位数是奇数,当后面的三位数在101-109之间就代表1001和1109,若在110和1000之间被抛弃,重新抽选r;
(4)总体(67084-68192)。抽法:从1-1109中抽选一个随机数r,然后用r+67083作为被抽选的数;
(5)总体(67084-68192)。抽法:从1-2000中抽选一个随机数r,若在0084-1192之间就加67000取相应数,否则就抛弃,重选r;
(6)总体有1109个数分布在61000-68000之间。抽法:随机抽选四位数r加60000,如果该数有相应的数就算抽中,无相应数抛弃重选;
(7)总体(1-17)。抽法:在1-100中抽选r,再除以20,若余数在1-17之间,就抽中相应的数,否则抛弃重选;
(8)总体(1-17)。抽法:在1-100中随机抽选一个数除以17,以余数作为抽中的数。 4. 设某个总体由L个子总体构成,今从该总体中抽取一个大小为n的简单随机样本,且设属于第j个子总体的单元数为nj固定的条件下,这nj个单元可看成是从第j个子总体中抽取的一个简单随机样本。
5. 简单随机抽样在抽样技术中的地位;
6. 简单随机抽样中样本量确定的原则及主要考虑因素; 7. 总体方差的预先确定思路。 四、计算题
1. 为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取300户进行调查,现得到其日用电平均值为9.5(千瓦时),方差为206。试估计该市居民日用电量的95%的置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少?
2. 某大学10000名本科生,现欲估计在暑假期间参加了各类英语培训的学生所占的比例,随机抽取了200名学生进行调查,得到p=0.35。试估计该大学所有本科生中暑假参加培训班的比例的95%的置信区间。
3. 研究某小区家庭用于文化方面(报刊、电视、网络等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表: 编号 1 2 3 4 5 6 7 8 9 10 文化支出 200 150 170 150 160 130 140 100 110 140 编号 11 12 13 14 15 16 17 18 19 20 文化支出 150 160 180 130 150 100 180 100 170 100 估计该小区的平均文化支出,并给出置信水平95%的置信区间。 4. 对某问题进行调查,在总体中抽取一个样本容量为200的简单随机样本,若赞成、反对及不表态的人数分别为:n1=132,n2=51,n3=17,试给出赞成、反对或不回答比例P1、P2、P3的近似置信区间。设N很大,f可忽略。
5. 在人口变动情况的调查中,出生率是一个重要的指标.根据以前的调查数据,出生率的估计可取为18‰,问在置信度95%下,实际调查估计P的绝对误差限为0.5‰和相对误差限5%各需多大的样本量(忽略fpc,且N-1≈N)?
6. 某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年的粮食产量,得到
均值为1220吨,方差为25600,据此估计该地区今年的粮食产量,并给出置信水平95%夫人置信区间。
7. 某次关于1000个家庭人均住房面积的调查中,委托方要求绝对误差限为2平方米,置信水平为95%,现根据以前的调查结果,认为总体方差为68,试确定简单随机抽样所需的样本量,若欲估计有效回答率为70%,则样本量最终为多少?
8. 某地区对本地100家化肥厂的尿素产量进行调查,以至去年的总产量为2135吨,抽取10个企业调查今年的产量,得到样本均值为25吨,这些企业去年的年平均产量为22吨。是采用比率估计方法计算该地区化肥总产量。
9. 请证明教材中的定理3.3:对简单随机抽样,有
Cov(y,x)1fSxy n1N其中,Sxy(YiY)(XiX),为总体协方差.
n1i110. 如果在解第3题时,可以得到下表中的家庭月总支出,而全部家庭的总支出平均为1600,利用比估计的方法估计平均文化支出, 给出置信水平95%夫人置信区间,并比较比估计和简单估计的效率。 编号 1 2 3 4 5 6 7 8 9 10 文化支出 200 150 170 150 160 130 140 100 110 140 总支出 2300 1700 200 1500 1700 1400 1500 1200 1200 1500 编号 11 12 13 14 15 16 17 18 19 20 文化支出 总支出 150 160 180 130 150 100 180 100 170 100 1600 1700 2000 1400 1600 1200 1900 1100 1800 1300 11. 某养牛场购进120头肉牛,购进时平均体重为100公斤,先从中抽取10头,,记录重量,三个月后再次测量,结果如下: 编号 1 2 3 4 5 6 7 8 9 10 原重量 95 97 87 120 110 115 103 102 92 105 现重量 150 155 140 180 175 185 165 160 150 170 请采用回归估计法计算120头牛现在的平均重量,计算其方差的估计,并和简单各界的结果进行比较。
12. 设总体N=5,其指标值为{3,5,6,7,9}
(1)计算总体方差和S2;
(2)从中抽取n=2的随机样本,分别计算放回抽样和不放回抽样的方差V(y); (3)按放回抽样和不放回抽样的分别列出所有可能的样本并计算y,验证E(y)=Y; (4)按放回抽样和不放回抽样的所有可能的样本,计算其方差V(y),并与公式计算的结果进行比较;
(5)对所有的可能样本计算样本方差s2,并验证在放回抽样的情况下E(s2)=;在不放回的情况下:E(s2)= S2。
13. 在一森林抽样调查中,某林场共有1000公顷林地,随机布设了50块面积为0.06公顷的方形样地,测得这50块样地的平均储蓄量为9m3,标准差为1.63 m3,试以95%的置信度估计该林场的木材储蓄量。
14. 某居民区共有10000户,现用抽样调查的方法估计该区居民的用水量。采用简单随机抽样抽选了100户,得ý=12.5,s2=1252。估计该居民区的总用水量95%的置信区间。若要求估计的相对误差不超过20%,试问应抽多少户做样本?
15. 某工厂欲制定工作定额,估计所需平均操作时间,从全厂98名从事该项作业的工人中随机抽选8人,其操作时间分别为4.2,5.1,7.9,3.8,5.3,4.6,5.1,4.1(单位:分),试以95%的置信度估计该项作业平均所需时间的置信区间(有限总体修正系数可忽略)。
16. 从某百货商店的3000张发货票中随机抽取300张来估计家用电器销售额,发现其中有200张是销售家用电器的,这200张发货票的总金额是48956元,其离差平方和为12698499。若置信度是95%,试估计这3000张发货票中家用电器销售额的置信区间。
17. 某总体有10个单元,分为A,B,C三类,其中A类有2个单元,B类和C类各有四个单元。若采用不放回抽样抽取一样本量为4的简单随机样本来估计B类单元在B,C两类单元中的比例,试计算估计量的标准误。
18. 某县采用简单随机抽样估计粮食、棉花、大豆的播种面积,抽样单元为农户。根据以往资料其变量的变异系数为
名称 粮食 棉花 大豆 变异系数 0.38 0.39 0.44 若要求以上各个项目的置信度为95%,相对误差不超过4%,需要抽取多少户?若用这一样本估计粮食的播种面积,其精度是多少?
19. 从一叠单据中用简单随机抽样方法抽取了250张,发现其中有50张单据出现错误,试以95%的置信度估计这批单据中有错误的比例。若已知这批单据共1000张,你的结论有何变化?若要求估计的绝对误差不超过1%,则至少抽取多少张单据作样本?
20. 欲调查二种疾病的发病率,疾病A的发病率较高,预期为50%;
疾病B的发病率预期为1%。若要得到相同的标准差0.5%,采用简单随机抽样各需要多大的样本量?试对上述不同的结果加以适当的说明。
21. 假设总体中每个单元有两个指标值Yi和Xi,i=1,…,N,记y,为相应的简单随机样本的均值。试证样本协方差
22syx1n(yiy)(xix) n1i1是总体协方差
Syx1n(YiY)(XiX) n1i1的无偏估计。
22. 设ý是从总体{Yi, …,YN}中抽取的样本量为n的简单随机样本的均值,ýn1是从样本量为n1的简单随机子样本均值,ýn2是剩余的样本单元均值。试证:
Cov(yn1,yn2)=SyN2
(提示:利用以下事实:两个子样本均可看成是从总体中直接抽取的简单随机子样本)。
因篇幅问题不能全部显示,请点此查看更多更全内容