统计抽样计算题(有计算过程)

合集下载

高中数学统计抽样方法精选题目(附答案)

高中数学统计抽样方法精选题目(附答案)

高中数学统计抽样方法精选题目(附答案)一、抽样方法1.简单随机抽样(1)特征:①一个一个不放回的抽取;②每个个体被抽到可能性相等.(2)常用方法:①抽签法;②随机数表法.2.系统抽样(1)适用环境:当总体中个数较多时,可用系统抽样.(2)操作步骤:将总体平均分成几个部分,再按照一定方法从每个部分抽取一个个体作为样本.3.分层抽样(1)适用范围:当总体由差异明显的几个部分组成时可用分层抽样.(2)操作步骤:将总体中的个体按不同特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样.1.(1)采用系统抽样方法从960人中抽取32人做问卷调查.为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为()A.7B.9C.10 D.15(2)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取________所学校,中学中抽取________所学校.[解析](1)从960人中用系统抽样方法抽取32人,则每30人抽取一人,因为第一组抽到的号码为9,则第二组抽到的号码为39,第n组抽到的号码为a n=9+30(n-1)=30n-21,由451≤30n-21≤750,得23615≤n≤25710,所以n=16,17,…,25,共有25-16+1=10人.(2)小学中抽取30×150150+75+25=18所学校;从中学中抽取30×75150+75+25=9所学校.[答案](1)C(2)189注:1.系统抽样的特点(1)适用于元素个数很多且均衡的总体. (2)各个个体被抽到的机会均等.(3)总体分组后,在起始部分抽样时采用的是简单随机抽样. (4)如果总体容量N 能被样本容量n 整除,则抽样间隔为k =Nn . 2.与分层抽样有关问题的常见类型及解题策略(1)确定抽样比.可依据各层总数与样本数之比,确定抽样比.(2)求某一层的样本数或总体个数.可依据题意求出抽样比,再由某层总体个数(或样本数)确定该层的样本(或总体)数.(3)求各层的样本数.可依据题意,求出各层的抽样比,再求出各层样本数. 2.某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )A .抽签法B .系统抽样法C .分层抽样法D .随机数法解析:选C 根据年级不同产生差异及按人数比例抽取易知应为分层抽样法. 3.某学校高一、高二、高三3个年级共有430名学生,其中高一年级学生160名,高二年级学生180名,为了解学生身体状况,现采用分层抽样方法进行调查,在抽取的样本中高二学生有32人,则该样本中高三学生人数为________.解析:高三年级学生人数为430-160-180=90,设高三年级抽取x 人,由分层抽样可得32180=x90,解得x =16. 答案:164.某单位有职工960人,其中青年职工420人,中年职工300人,老年职工240人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为14人,则样本容量为________.解析:因为分层抽样的抽样比应相等,所以420960=14样本容量,样本容量=960×14420=32.答案:32二、用样本的频率分布估计总体的频率分布1.频率分布直方图2.茎叶图5.(1)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5].样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.(2)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].①求图中a的值;②根据频率分布直方图,估计这100名学生语文成绩的平均分;③若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.分数段[50,60)[60,70)[70,80)[80,90)x∶y 1∶12∶13∶44∶5 [为50×0.18=9.答案:9(2)解:①由频率分布直方图可知(0.04+0.03+0.02+2a)×10=1.所以a=0.005.②该100名学生的语文成绩的平均分约为x=0.05×55+0.4×65+0.3×75+0.2×85+0.05×95=73.③由频率分布直方图及已知的语文成绩、数学成绩分布在各分数段的人数比,可得下表:分数段[50,60)[60,70)[70,80)[80,90)x 5403020x∶y 1∶12∶13∶44∶5y 5204025100-(5+20+40+25)=10.注:与频率分布直方图有关问题的常见类型及解题策略(1)已知频率分布直方图中的部分数据,求其他数据,可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.(2)已知频率分布直方图,求某种范围内的数据,可利用图形及某范围结合求解.6.如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为()A.0.2 B.0.4C.0.5 D.0.6解析:选B由茎叶图可知数据落在区间[22,30)内的频数为4,所以数据落在区间[22,30)内的频率为410=0.4,故选B.7.为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画出样本的频率分布直方图如图所示.根据此图,估计该校2 000名高中男生中体重大于70.5公斤的人数为()A .300B .360C .420D .450解析:选B 样本中体重大于70.5公斤的频率为: (0.04+0.034+0.016)×2=0.090×2=0.18.故可估计该校2 000名高中男生中体重大于70.5公斤的人数为:2 000×0.18=360(人). 8.某商场在庆元宵节促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为________万元.解析:总销售额为2.50.1=25(万元),故11时至12时的销售额为0.4×25=10(万元).答案:10三、用样本的数字特征估计总体的数字特征有关数据的数字特征9.(1)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A .46,45,56B .46,45,53C .47,45,56D .45,47,53(2)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差(3)由正整数组成的一组数据x 1,x 2,x 3,x 4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)[解析] (1)从茎叶图中可以看出样本数据的中位数为中间两个数的平均数,即45+472=46,众数为45,极差为68-12=56,故选择A.(2)由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错.故选C.(3)假设这组数据按从小到大的顺序排列为x 1,x 2,x 3,x 4,则⎩⎨⎧x 1+x 2+x 3+x44=2,x 2+x32=2,∴⎩⎪⎨⎪⎧x 1+x 4=4,x 2+x 3=4, 又s = 14[(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2] =12(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2=122[(x 1-2)2+(x 2-2)2]=1, ∴(x 1-2)2+(x 2-2)2=2. 同理可求得(x 3-2)2+(x 4-2)2=2.由x 1,x 2,x 3,x 4均为正整数,且(x 1,x 2),(x 3,x 4)均为圆(x -2)2+(y -2)2=2上的点,分析知x 1,x 2,x 3,x 4应为1,1,3,3.[答案] (1)A (2)C (3)1,1,3,3 注:平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.10.为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A .①③ B .①④ C .②③D .②④解析:选B 法一:∵x 甲=26+28+29+31+315=29,x 乙=28+29+30+31+325=30,∴x 甲<x 乙,又s 2甲=9+1+0+4+45=185,s 2乙=4+1+0+1+45=2,∴s 甲>s 乙.故可判断结论①④正确.法二:甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论①④正确,故选B.11.甲和乙两个城市去年上半年每月的平均气温(单位:℃)用茎叶图记录如图所示,根据茎叶图可知,两城市中平均温度较高的城市是__________,气温波动较大的城市是__________.解析:根据题中所给的茎叶图可知,甲城市上半年的平均温度为9+13+17×2+18+226=16,乙城市上半年的平均温度为12+14+17+20+24+276=19,故两城市中平均温度较高的是乙城市,观察茎叶图可知,甲城市的温度更加集中在峰值附近,故乙城市的温度波动较大.答案:乙 乙12.甲、乙两台机床同时加工直径为100 mm 的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位:mm):甲:99,100,98,100,100,103; 乙:99,100,102,99,100,100.(1)分别计算上述两组数据的平均数和方差;(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求. 解:(1)x 甲=99+100+98+100+100+1036=100(mm),x 乙=99+100+102+99+100+1006=100(mm),s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73(mm 2), s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1(mm 2).(2)因为s 2甲>s 2乙,说明甲机床加工零件波动比较大,因此乙机床加工零件更符合要求.四、线性回归1.两个变量的线性相关(1)散点图:将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形.(2)正相关与负相关:①正相关:散点图中的点散布在从左下角到右上角的区域. ②负相关:散点图中的点散布在从左上角到右下角的区域. 2.回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)线性回归方程:方程y ^=b ^x +a ^是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的线性回归方程,其中a ,b 是待定参数.⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2=∑i =1nx i y i-n x y ∑i =1nx 2i-n x 2,a ^=y -b x .13.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)[解] (1)由于x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =16(90+84+83+80+75+68)=80.所以a ^=y -b ^x =80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得 L =x (-20x +250)-4(-20x +250) =-20x 2+330x -1 000 =-20(x -8.25)2+361.25.当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润. 注:(1)线性回归分析就是研究两组变量间线性相关关系的一种方法,通过对统计数据的分析,可以预测可能的结果,这就是线性回归方程的基本应用,因此利用最小二乘法求线性回归方程是关键,必须熟练掌握线性回归方程中两个重要估计量的计算.(2)回归直线方程恒过点(x ,y ).14.某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:回归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻两个月的概率;(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?解:(1)将6组数据按月份顺序编号为1,2,3,4,5,6,从中任取两组数据,基本事件构成的集合为Ω={(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)}共15个基本事件,设抽到相邻两个月的事件为A ,则A ={(1,2),(2,3),(3,4),(4,5),(5,6)}共5个基本事件,∴P (A )=515=13.(2)由表中数据求得x =11,y =24,∑i =14x i y i =1 092,∑i =14x 2i =498.代入公式可得b ^=187.再由a ^=y -b ^x ,求得a ^=-307,所以y 关于x 的线性回归方程为 y ^=187x -307.(3)当x =10时,y ^=1507,⎪⎪⎪⎪1507-22=47<2; 同样,当x =6时,y ^=787,⎪⎪⎪⎪787-12=67<2. 所以该小组所得线性回归方程是理想的.。

统计学原理计算题及参考答案

统计学原理计算题及参考答案

1、某生产车间30名工人日加工零件数(件)如下: 30 26 42 41 36 44 40 37 37 25 45 29 43 31 36 36 49 3447 33 43 38 42 32 34 38 46 43 39 35 要求:(1)根据以上资料分成如下几组:25—30,30—35,35—40,40—45,45—50,计算各组的频数和频率,编制次数分布表;(2) 根据整理表计算工人平均日产零件数。

(20分)则工人平均劳动生产率为:17.38301145===∑∑fxf x(2)当产量为10000件时,预测单位成本为多少元?(15分)xbx a y n x b n y a x x n y x xy n b c 5.2808010703125.232105.26151441502520250512503210128353)(222-=+==+=⨯+=-=-=-=--=-⨯⨯-⨯=--=∑∑∑∑∑∑∑因为,5.2-=b ,所以产量每增加1000件时,即x 增加1单位时,单位成本的平均变动是:平均减少2.5元 (2)当产量为10000件时,即10=x 时,单位成本为55105.280=⨯-=c y 元>课程的测试,甲班平均成绩为81分,标准差为9.5分;乙班的成绩分组资料如下: 计算乙班学生的平均成绩,并比较甲.乙两班哪个班的平均成绩更有代表性? 解:乙班学生的平均成绩∑∑=fxf x ,所需的计算数据见下表:75554125===∑∑fxf x (比较甲.乙两班哪个班的平均成绩更有代表性,要用变异系数σν的大小比较。

)甲班%65.207549.1549.152405513200)(2======-=∑∑xff x x σνσσ%73.11815.9===xσνσ 从计算结果知道,甲班的变异系数σν小,所以甲班的平均成绩更有代表性。

计算(1)产品产量总指数及由于产量增长而增加的总成本.(2)总成本指数及总成本增减绝对额. 解;(1)产品产量总指数为: %42.1112102342106351120605010060%10550%102100%12000==++=++⨯+⨯+⨯=∑∑qp qkp 由于产量增长而增加的总成本:∑∑=-=-242102340000qp q kp(2)总成本指数为:%62.10721022660501006046120011==++++=∑∑qp qp总成本增减绝对额:∑∑=-=-162102260011qp q p. 解:商品流转次数c=商品销售额a/库存额bba c =商品销售额构成的是时期数列,所以67.23837163276240200==++==∑na a 库存额b 构成的是间隔相等的时点数列,所以33.533160327545552453224321==+++=+++=b b b b b 第二季度平均每月商品流转次数475.433.5367.238===ba c 第二季度商品流转次数3*4.475=13.4251. 2008年某月份甲、乙两市场某商品价格和销售量、销售额资料如下:试分别计算该商品在两个市场上的平均价格. 解:甲市场的平均价格为:04.123270033220027001507001080007350011009007001100137900120700105==++=++⨯+⨯+⨯==∑∑fxf x乙市场的平均价格为74.1172700317900700800120031790013795900120960001051260009590096000126000==++=++++==∑∑xM M x。

初三数学统计抽样方法练习题

初三数学统计抽样方法练习题

初三数学统计抽样方法练习题一、选择题1. 下列哪个不属于概率抽样的方法?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 方便抽样2. 在全年级500名学生中进行调查,为了保证数据的真实性和代表性,最好采用下列哪种抽样方法?A. 方便抽样B. 分层抽样C. 多阶段抽样D. 简单随机抽样3. 为了调查某学校学生的学习习惯,将该校分为文科和理科两个分层,然后分别从两个分层中随机抽取部分学生进行调查,这是采用了哪种抽样方法?A. 分层抽样B. 系统抽样C. 简单随机抽样D. 方便抽样4. 用数字0、1、2等表示某城市居民的收入等级,调查时采用随机数表,将表中的数字与居民住址相对应,这是采用了哪种抽样方法?A. 方便抽样B. 简单随机抽样C. 系统抽样D. 多阶段抽样5. 在某企业中,每隔5个职工抽取一个作为样本,这是属于哪种抽样方法?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 多阶段抽样二、计算题1. 某学校全体学生共1000人,想要进行班级的名字调查,随机抽取了其中10个班级进行调查。

试问,这属于哪种抽样方法?并计算每个班级的抽样概率。

(题目部分参考内容)答:这属于多阶段抽样方法。

每个班级的抽样概率为 1/100。

2. 某市区有100个居民小区,希望了解居民对社区环境的评价,抽取其中5个小区进行调查。

试问,这属于哪种抽样方法?并计算每个小区的抽样概率。

(题目部分参考内容)答:这属于简单随机抽样方法。

每个小区的抽样概率为 1/20。

三、解答题1. 为了调查某中学初三学生的学习时间分配情况,先在全校300名学生中随机抽取了30名学生作为样本,接着从这30名学生中随机抽取了15名男生和15名女生。

请问,这属于哪种抽样方法?并从样本中得到学习时间的数据结果。

(题目部分参考内容)答:这属于两阶段抽样方法,第一阶段为简单随机抽样,第二阶段为分层抽样。

学习时间数据结果应该从这30名学生中随机选择样本进行调查和统计。

统计计算练习

统计计算练习

统计计算练习标志变异指标⼯资更具有代表性。

2.某⼯⼚⽣产⼀批零件共10万件,为了解这批产品的质量,采取不重复抽均合格率、标准差及标准差系数。

3.某车间有两个⼩组,每组都是7名⼯⼈每⼈⽇产零件数如下:第⼀组:20 40 60 70 80 100 120 第⼆组:67 68 69 70 71 72 73试计算两个⼩组每⼈平均⽇产量、全距、平均差、标准差,并⽐较哪⼀组的平均数代表性⼤?性和推⼴价值。

5.根据平均数和标准差的关系。

(1)(1)设%25,600==σV x ,则标准差为多少?(2)(2)设450,202==x x ,则标准差系数为多少?(3)(3)设360,3622==x σ,则平均数为多少?(4)(4)设174%,2.172==x V σ,则平均数为多少?第七章时间数列计算题1.某仓库1⽉1⽇某产品库为1800吨,3⽉1⽇为2000吨,6⽉1⽇为2100吨,6⽉30⽇为1940吨。

问该产品上半年平均库存是多少?4.根据下表中已知资料,运⽤时间数列指标的相互关系,推算发展⽔平、累计增长量、定基发展速度和定基增长速度指标。

年翻两翻,达到28000亿元,则平均发展速度应为多少?如果按年平均增长速度为7.2%计算,到1990年我国⼯农业总产值可达多少亿元?6.已知某地区2000年各⽉⽉初⼈⼝资料如下:1⽉初230万⼈,2⽉初230万⼈,3⽉初240万⼈,4⽉初250万⼈,6⽉初250万⼈,8⽉初260万⼈,12⽉初260万⼈,次年1⽉初260万⼈。

试计算该地区全年平均⼈⼝数。

第⼋章统计指数计算题1.1.某百货公司2000年商品销售额为5600万元,2001年⽐2000年增加500万元,零售价格指数上涨3.6%。

试计算该百货公司零售额变动中由于零售价格和零售量变动的影响程度和影响绝对额。

2.2.某企业⽣产三种产品有关数据如下表所⽰:3.3.下⾯是某家计调查得到的数据,试利⽤可变构成指数体系进⾏因素分析。

《统计学原》课程考题解析(3)

《统计学原》课程考题解析(3)

《统计学原理》课程考题解析(3)典型考题:区间估计1.考题回顾抽样估计是运用数理统计原理,在抽样调查的基础上,利用样本的实际计算样本指标,对全体研究对象的数量特征作出具有一定可靠程度的估计,以达到对现象总体的认识。

由于总体指标是表明总体数量特征的参数,所以也称参数估计。

总体参数估计是教材第5章的内容,同时也是本门课程的重点和难点内容,总体参数估计有点估计和区间估计两种,考核的重点是区间估计。

在历年的考试每次均会围绕这个内容来出题,其题型主要是计算题。

2.考题(1)2005年1月计算第3题:从某年级学生中按简单随机抽样方式抽取50名学生,对会计学课的考试成绩进行检查,得知其平均分数为75.6分,样本标准差10分,试以95.45%的概率保证程度推断全年级学生考试成绩的区间范围。

如果其它条件不变,将允许误差缩小一半,应抽取多少名学生?(2)2005年7月计算第5题(2007年1月计算第2题):某工厂有2000个工人,用简单随机不重复方法抽出100个工人作为样本,计算出平均工资560元,标准差32.45元。

要求:(1)计算抽样平均误差;(2)以95.45%(t=2)的可靠性估计该工人的月平均工资区间。

(3)2006年1月计算第3题:某企业生产一批日光灯管,随机重复抽取400只作使用寿命试验。

测试结果,平均寿命为5000小时,样本标准差为300小时,400只中发现10只不合格。

求平均数的抽样平均误差和成数的抽样平均误差。

(4)2006年7月计算第2题(2007年7月计算第2题):采用简单重复抽样的方法,抽取一批产品中的200件作为样本,其中合格品为188件。

要求:(1)计算样本的抽样平均误差;(2)以95.45%的概率保证程度对该产品的合格品率进行区间估计(t=2)。

3.考题解析总体参数的区间估计是根据给定的概率保证程度的要求,利用实际抽样资料,指出被估计值的上限和下限,即指出总体参数可能存在的区间范围。

医学统计学分析计算题-答案 (1)

医学统计学分析计算题-答案 (1)

第二单元 计量资料的统计推断分析计算题2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4:表4 某年某地健康成年人的红细胞数和血红蛋白含量指 标性 别 例 数 均 数 标准差 标准值* 红细胞数/1012·L -1 男 360 4.66 0.58 4.84女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2女255117.610.2124.7请就上表资料:(1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。

(3) 试估计该地健康成年男、女红细胞数的均数。

(4) 该地健康成年男、女血红蛋白含量有无差别?(5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解:(1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV )比较二者的变异程度。

女性红细胞数的变异系数0.29100%100% 6.94%4.18S CV X =⨯=⨯= 女性血红蛋白含量的变异系数10.2100%100%8.67%117.6S CV X =⨯=⨯=由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。

(2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。

男性红细胞数的标准误0.031X S ===(1210/L ) 男性血红蛋白含量的标准误0.374X S ===(g/L )女性红细胞数的标准误0.018X S ===(1210/L )女性血红蛋白含量的标准误0.639X S ===(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。

样本含量均超过100,可视为大样本。

σ未知,但n 足够大 ,故总体均数的区间估计按(/2/2X X X u S X u S αα-+, )计算。

统计学第五章抽样习题

统计学第五章抽样习题
E、大小是可以控制的
11.用抽样指标估计总体指标应满足的要求是( )
A、一致性 B、准确性 C、客观性
D、无偏性 E、有效性
12.在其他条件不变的情况下,下列关于抽样平均误差、总体变 异程度及样本容量之间关系的陈述,正确的有( )
A、总体变异程度一定时,样本容量越大,抽样平均误差越大
B、总体变异程度一定时,样本容量越大,抽样平均误差越小
B、抽样单位数占总体单位数的比重很大时
C、抽样单位数目很少时
D、抽样单位数目很多时
2020/3/17
7
10、在其他条件不变的情况下,抽样单位数目和抽样误差的关系 是( ) A、抽样单位数目越大,抽样误差越大 B、抽样单位数目越大,抽样误差越小 C、抽样单位数目的变化与抽样误差的数值无关 D、抽样误差变化程度是抽样单位数变动程度的1/2
19、随着样本单位数的无限增大,样本指标和未知的总体
指标之差的绝对值小于任意小的正整数的可能性趋于
必然性,称为抽样估计的( )
A、无偏性
B、一致性
C、有效性
D、 充足性
20、能够事先加以计算和控制的误差是( )
A、抽样误差
B、登记误差
C、标准差
D、标准差系数
2020/3/17
13
21、在一定抽样平均误差的条件下,要提高推断的可靠




10.对于简单随机重复抽样,若其他条件不变,则当误差范围
缩小一半,抽样单位数必须
倍,若误差范围扩大一
倍,则抽样单位数为原来的

11.点估计是直接用
估计不考虑

估计总体指标的推断方法。点 。
2020/3/17
29
14. 抽样法的基本特点是( )

概率与统计的抽样练习题

概率与统计的抽样练习题

概率与统计的抽样练习题1. 在一所高中的600名学生中,有300名男生和300名女生。

从学生总体中,随机选择100名学生。

问以下问题的概率分别是多少?a) 选中的学生中,有60名男生和40名女生;b) 选中的学生中,男生人数少于女生人数;c) 选中的学生中,男生和女生人数相等;d) 选中的学生中,男生和女生人数的差异在10名以内。

2. 某电子设备制造公司生产的电池产品有两个型号:A型和B型。

从批次中抽取10个产品进行质量检查。

已知A型产品占批次的60%,B型产品占40%。

问以下问题的概率分别是多少?a) 抽取的10个产品中,恰好有6个是A型产品;b) 抽取的10个产品中,至少有2个是A型产品;c) 抽取的10个产品中,A型产品比B型产品少2个以上。

3. 某快递公司共有200个包裹,其中有60个损坏的。

从这些包裹中随机选取20个进行检查。

问以下问题的概率分别是多少?a) 抽取的20个包裹中,有3个是损坏的;b) 抽取的20个包裹中,至少有一个是损坏的;c) 抽取的20个包裹中,损坏的包裹占比不超过15%。

4. 某市场调查公司想要估计某种新产品的销售量。

他们在该地区随机选择了160个家庭进行调查。

问以下问题的概率分别是多少?a) 抽取的160个家庭中,有50个家庭购买了该产品;b) 抽取的160个家庭中,至少有10个家庭购买了该产品;c) 抽取的160个家庭中,购买该产品的家庭占比不低于30%。

5. 某银行客户的信用评级情况如下:优秀(10%),良好(30%),合格(40%),差(20%)。

从1000名客户中,随机选择200名进行调查。

问以下问题的概率分别是多少?a) 抽取的200名客户中,有20名优秀客户;b) 抽取的200名客户中,良好客户的人数多于合格客户的人数;c) 抽取的200名客户中,差评级客户的人数在40名以内。

这些抽样练习题可以帮助巩固概率与统计的基本知识,并提供实际应用的情境。

通过计算概率,我们可以更好地理解随机事件的发生规律,为决策提供科学依据。

统计学计算题例题(课件)

统计学计算题例题(课件)

【例1】:某企业生产A 产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量,样本人均产量为35件,产量的样本标准差为4.5件。

请以95.45%的置信度估计该日人均产量的置信区间。

解:①计算抽样平均误差()件4269.0100010011005.411222≈⎪⎭⎫ ⎝⎛-=⎪⎭⎫ ⎝⎛-≈⎪⎭⎫ ⎝⎛--=N n n s N n N n x σμ ②计算抽样极限误差由9545.01=-)(α,查正态概率表得2=Z(件)8538.04269.02=⨯==∆x x Z μ③确定置信区间 估计区间上限:85.358538.035=+=U X (件) 估计区间下限:15.348538.035=-=L X (件)故,可以95.45%的置信度断言,该日人均产量在34.15~35.85件之间。

【例2】某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量,要求在95﹪的概率保证程度下,估计该厂全部工人的日平均产量和日总产量。

解: ()()()件件47.69941441126100126002==--====∑∑∑∑f f x x s f xf x ()件614.01000100110047.6122=⎪⎭⎫ ⎝⎛-=⎪⎭⎫ ⎝⎛-=N n n s x μ()件203.1614.096.1=⨯=⋅=∆x x Z μ则该企业工人人均产量及日总产量的置信区间为:()()203.11261000203.11261000,203.1126203.1126+≤≤-+≤≤-X N X即该企业工人人均产量在124.797至127.203件之间,其日总产量在124797至127303件之间,估计的可靠程度为95﹪。

【例2变形】工人日产量在118件以上者为完成生产定额任务,要求在95﹪的概率保证程度下,估计该厂全部工人中完成定额的工人比重及完成定额的工人总数。

统计学习题(抽样分布、参数估计)

统计学习题(抽样分布、参数估计)

统计学习题(抽样分布、参数估计)练习题第1章绪论(略)第2章统计数据的描述2.1某家商场为了解前来该商场购物的顾客的学历分布情况,随机抽取了100名顾客。

其学历表示为:1.初中;2.高中/中专;3.大专;4.本科及以上学历。

调查结果如下:4222434414 2244432422 3121441424 2332134344 3312424324 2322212244 2123333334 2343313232 4313434214 2242334121(1)制作一张频数分布表。

(2)绘制一张条形图,反映学历分布。

2.2为了解某电信客户对该电信公司的服务的满意度情况,某调查公司分别对两个地区的电信用户在以下五个方面对受访用户的满意情况进行了问卷调查得到的数据如下(表中数据为平均满意度打分,从1分到10分满意度依次递增):地区企业形象客户期望质量感知价值感知客户总体满意度A 8.269504 7.51773 9.2624117.9148948.411348B 7.447368 8.3684218.9736848.1052637.394737试用条形图反映将两地区的满意度情况。

2.3下面是一个班50个学生的经济学考试成绩:88569179699088718279 988534744810075956092 83646569996445766369 6874948167818453912484628183698429667594(1)对这50名学生的经济学考试成绩进行分组并将其整理成频数分布表,绘制直方图。

(2)用茎叶图将原始数据表现出来。

2.4如下数据反映的是某大学近视度数的情况,共120名受访同学,男女同学各60名。

男149 161761821310 80 951081414 0 144145151515161681882121 0 21211052121211116817521 0 356462121212121312121 0 2121212121375375383838 8 45566065120 30120 7521女120 3334537437538700 90700 60141516212121211517170 0 0 0 0 0 0 0 5 521 0 1752121214043451217517 8 181818518519195196202021 0 21212121212121333335 0 3636363840474865055(1)按近视度数分别对男女学生进行分组。

210编号统计第八章习题

210编号统计第八章习题

第八章抽样推断计算题1.一批商品(10000件)运抵仓库,随机抽取100件检验其质量,发现有10件不合格。

试按重复与不重复抽样分别计算合格率抽样平均误差。

2.某厂生产彩色电视机,按不重复抽样方法从一批出厂产品中抽取1%的产品进行质量检验,取得如下资料:正常工作时间(千小时)电视机(台)6—8158—103010—125012—144014—169合计144试计算抽样平均误差。

3.假设某班期末统计学考试成绩服从正态分布,平均成绩为70分,标准差为12分,要求计算:(1)随机抽取1人,该同学成绩在82分以上的概率;(2)随机抽取9人,其平均成绩在82分以上的概率。

4.某手表厂在某段时间内生产100万个某种零件,用纯随机抽样方式不重复抽取1000个零件进行检验,测得废品为20件。

如以99.73%概率保证,试对该厂这种零件的废品率作定值估计和区间估计。

5.利用第1题的资料,以95.45%的概率保证程度对该批商品的合格率作出区间估计。

6.根据第2题的资料,对该厂生产的这批彩色电视机的正常工作时间作出区间估计。

如果规定彩色电视机的正常工作时间在12 000小时以上为一级品,试对该厂这批出厂产品的一级品率作出区间估计。

(F(t)=95%)7.对某型号电子元件10000只进行耐用性能检查。

根据以往抽样测定,求得耐用时数的标准差为600小时。

试求在重复抽样条件下:(1)概率保证程度为68.27%,元件平均耐用时数的误差范围不超过150小时,要抽取多少元件做检查?(2)根据以往抽样检验知道,元件合格率为95%,合格率的标准差为21.8%,要求在99.73%的概率保证下,允许误差不超过4%,试确定重复抽样所需抽取的元件数目是多少?如果其他条件均保持不变,采用不重复抽样应抽取多少元件做检查?8.电子元件厂日产10000只元件,经多次一般测试得知一等品率为92%,现拟采用随机抽样方式进行抽检,如果求误差范围在2%之内,可靠程度为95.45%,问需抽取多少电子元件?9.从麦当劳餐厅连续三个星期抽查49位顾客,以调查顾客的平均消费额,得样本平均消费额为25.5元。

统计学抽样推断计算题答案

统计学抽样推断计算题答案

【解】五、4题 (1)
已知: x =1000小时,s=15小时元, n=100
μ x= σ
2
n
=
s
2
n
=
15
2
100
= 1 . 5 ( 小时 )
Δ x =tμ x = 2× .5= 3(小时) 1
x± x =1000 ± Δ 3 = [997, 1003]小时
【解】五、4题 (1)
n 1= t σ Δ
要求:1)计算样本平均数和抽样平均误差; 2)以95.45%的可靠性估计该厂工人的 月平均工资和工资总额的区间。
样本平均数和方差计算表
月平均 工人数 工资(元) (人) 524 4 534 6 540 9 550 10 560 8 580 6 600 4 660 3 50 合计 xf 2096 3204 4860 5500 4480 3480 2400 1980 28000 (x-x) f 5184 4056 3600 1000 0 2400 6400 30000 52640
2 1 2 2
n2=
t σ
2
2 2
(0.5Δ1 )
=4n1
=4× 100=400(只)
平均工资的置信区间为:
[550.82,569.18]元
工资总额的置信区间为: [550.82×1500,569.18× 1500]元
即为:[826230,853770]元
五、2题
从一批袋装食品中,按简单随机重复 抽样方法抽取50 包检查,结果如下:
每包重量(克) 90-95 95-100 100-105 105-110 包数(包) 2 3 35 10
【解】五、3题 (2)
已知, p=10/100=10%

统计学计算题例题及计算分析

统计学计算题例题及计算分析

计算分析题解答参考1.1.某厂三个车间一季度生产情况如下:计算一季度三个车间产量平均计划完成百分比和平均单位产品成本.解:平均计划完成百分比=实际产量/计划产量=733/(198/0。

9+315/1。

05+220/1。

1) =101.81%平均单位产量成本 X=∑xf/∑f=(15*198+10*315+8*220)/733 =10。

75(元/件) 1。

2.某企业产品的有关资料如下:试分别计算该企业产品98年、99年的平均单位产品成本.解:该企业98年平均单位产品成本 x=∑xf/∑f=(25*1500+28*1020+32*980)/3500 =27。

83(元/件)该企业99年平均单位产品成本x=∑xf /∑(m/x )=101060/(24500/25+28560/28+48000/32) =28.87(元/件)1。

3.1999年某月甲、乙两市场三种商品价格、销售量和销售额资料如下: 试分别计算三种商品在两个市场上的平均价格。

解:三种商品在甲市场上的平均价格x=∑xf/∑f=(105*700+120*900+137*1100)/2700 =123.04(元/件)三种商品在乙市场上的平均价格x=∑m/∑(m/x)=317900/(126000/105+96000/120+95900/137) =117.74(元/件)2.1.某车间有甲、乙两个生产小组,甲组平均每个工人的日产量为22件,标准差为3.5件;乙组工人日产量资料:试比较甲、乙两生产小组中的哪个组的日产量更有代表性? 解:∵X 甲=22件 σ甲=3。

5件∴V 甲=σ甲/ X 甲=3.5/22=15。

91% 列表计算乙组的数据资料如下:∵x 乙=∑xf/∑f=(11*10+14*20+17*30+20*40)/100 =17(件)σ乙=√[∑(x-x)2f]/∑f =√900/100 =3(件) ∴V 乙=σ乙/ x 乙=3/17=17。

《统计学》抽样调查习题和答案

《统计学》抽样调查习题和答案

六.计算题部分1、对一批成品按重复抽样方法抽选100件,其中废品4件,当概率为95.45%(t=2)时,可否认为这批产品的废品率不超过6%?答案:解:2%,41004,100====t p n 0196.0100)04.01(04.0)1(=-=-=n p p p μ039.00196.02=⨯==∆p p t μ p p p P p ∆+≤≤∆-039.004.0039.004.0+≤≤-P0.1%------7.9% ∴废品率不超过6%2、某乡有5000农户,按随机原则重复抽取100户调查,得平均每户年纯收入12000元,标准差2000元。

要求:(1)以95%的概率(t=1.96)估计全乡平均每户年纯收入的区间。

(2)以同样概率估计全乡农户年纯收入总额的区间范围。

答案: 解: 2001002000===n x σμ 39220096.1=⨯==∆x x t μ x x x X x ∆+≤≤∆- 3921200039212000+≤≤-X11608-----12392(元) 5000×11608------5000×12392(元)3、某企业生产一种新的电子元件,用简单随机重复抽样方法抽取100只作耐用时间试验,测试结果,平均寿命6000小时,标准差300小时,试在95.45%(t=2)概率保证下,估计这种新电子元件平均寿命区间。

答案:解:2,300,6000,100====t x n σ (小时)30100300===n x σμ (小时)60302=⨯==∆x x t μ x x x X x ∆+≤≤∆- 606000606000+≤≤-X 5940-----6060(小时)4、 从某年级学生中按简单随机抽样方式抽取50名学生,对邓小平理论课的考试成绩进行检查,得知其平均分数为75.6分,样本标准差10分,试以95.45%(99.73%t=3、68.27%t=1)的概率保证程度推断全年级学生考试成绩的区间范围。

统计学第五章抽样习题

统计学第五章抽样习题

A、缩小概率度
B、增大抽样误差范围
C、缩小抽样误差范围 E、增大概率度
D、 增加抽样数目
2020/3/17
24
8.抽样法是一种( ) A、搜集统计资料的方法 B、对现象的总体进行科学估计和推断的方法 C、随机性的非全面调查的方法 D、快速准确的全面调查方法 E、抽选少数典型单位所进行的调查方法
2020/3/17
E、大小是可以控制的
11.用抽样指标估计总体指标应满足的要求是( )
A、一致性 B、准确性 C、客观性
D、无偏性 E、有效性
12.在其他条件不变的情况下,下列关于抽样平均误差、总体变 异程度及样本容量之间关系的陈述,正确的有( )
A、总体变异程度一定时,样本容量越大,抽样平均误差越大
B、总体变异程度一定时,样本容量越大,抽样平均误差越小
B、抽样单位数占总体单位数的比重很大时
C、抽样单位数目很少时
D、抽样单位数目很多时
2020/3/17
7
10、在其他条件不变的情况下,抽样单位数目和抽样误差的关系 是( ) A、抽样单位数目越大,抽样误差越大 B、抽样单位数目越大,抽样误差越小 C、抽样单位数目的变化与抽样误差的数值无关 D、抽样误差变化程度是抽样单位数变动程度的1/2
2020/3/17
22
4、从一个总体中可以抽出许多个样本,因此 ( A、抽样指标的数值不是唯一确定的 B、抽样指标是用来估计总体参数的 C、总体指标是一个随机变量 D、样本指标是随机变量 E、样本指标称为统计量
5、在抽样推断中,样本单位数的多少取决于 ( A、总体标准差的大小 B、允许误差的大小 C、抽样估计的把握程度 D、总体参数的大小 E、抽样方法和组织形式

统计学习题 第四章 抽样估计

统计学习题 第四章  抽样估计

第四章抽样估计一、判断题1.抽样估计的目的是用以说明总体特征。

2.抽样分布就是样本分布。

3.既定总体在当抽样方法、抽样组织形式和样本容量确定时,样本均值的分布惟一确定。

4.样本容量就是样本个数。

5.在抽样中,样本容量是越大越好。

6.抽样的目的是判断样本估计值是否处于以总体指标为中心的某规定区域范围内。

7.当估计量有偏时,人们应该弃之不用。

8.对于一个确定的抽样分布,其方差是确定的,因而抽样标准误也是确定的。

9.抽样极限误差越大,用以包含总体参数的区间就越大,估计的把握程度也就越大,因此极限误差越大越好。

10.非抽样误差会随着样本容量的扩大而下降。

二、单项选择题1.想了解学生的眼睛视力状况,准备抽取若干学校、若干班级的学生进行测试,则()。

A.观测单位是学校B.观测单位是班级C.观测单位是学生D.观测单位可以是学校、也可班级或学生2.下列误差中属于非一致性的有()。

A.估计量偏差B.偶然性误差C.抽样标准误D.非抽样误差3.抽样估计中最常用的分布理论是()。

A.t分布理论B.二项分布理论C.正态分布理论D.超几何分布理论4.抽样标准误大小与下列哪个因素无关?()A.样本容量B.抽样方式、方法C.概率保证程度D.估计量5.下列关于抽样标准误的叙述哪个是错误的?()A.抽样标准误是抽样分布的标准差B.抽样标准误的理论值是惟一的,与所抽样本无关C.抽样标准误比抽样极限误差小D.抽样标准误只能衡量抽样中的偶然性误差的大小三、计算分析题1. 某小组5个工人的每周工资分别为520、540、560、580、600元,现从中用简单随机抽样形式(不重复抽样)随机抽取2个工人周工资构成样本。

要求:(1)计算总体平均工资的标准差;(2)列出全部可能的样本平均工资;(3)计算样本平均工资的平均数,并检验其是否等于总体平均工资;(4)计算样本平均工资的标准差;(5)用抽样平均误差的公式计算并验证是否等于(4)的结果。

2.从某大型企业中随机抽取100名职工,调查他们的工资。

概率统计——抽样分布课后练习(附答案)

概率统计——抽样分布课后练习(附答案)

课后练习:一、单项选择:1、抽样误差是指:()A.抽样推断中各种原因引起的全部误差B.工作性误差C.系统性代表误差D.随机误差 D2、重复抽样的抽样误差()A.大于不重复抽样的抽样误差B.小于不重复抽样的抽样误差C.等于不重复抽样的抽样误差D.不一定 A3、在简单重复抽样下,若总体标准差不变,要使抽样平均误差变为原来的一半,则样本单位数必须()A.扩大为原来的2倍B.减少为原来的一半C.扩大为原来的4倍D.减少为原来的四分之一 C4、在抽样之前对每一个单位先进行编号,然后使用随机数字表抽取样本单位,这种方式是()A.等距抽样B.分层抽样C.简单随机抽样D.整群抽样 C5、一个连续性生产的工厂,为检验产品的质量,在一天中每隔1小时取5分钟的产品做全部检验,这是()A.等距抽样B.分层抽样C.整群抽样D.简单随机抽样 C6、某工厂连续生产,为检验产品质量,在一天中每隔半小时取一件产品做检验,这是()A.简单随机抽样B.整群抽样C.机械抽样D.类型抽样 C7、为了了解某工厂职工家庭收支情况,按该厂职工名册依次每50人抽取1人,对其家庭进行调查,这种调查属于()A.简单随机抽样B.等距抽样C.类型抽样D.整群抽样 B8、抽样平均误差的实质是()A. 总体标准差B. 抽样总体的标准差C. 抽样误差的标准差D. 抽样平均数的标准差 D9、为调查某消费群体的消费习惯,将消费者按受教育层次分类后,再确定比例抽取样本,此抽样方法属于()A. 纯随机抽样B. 分层抽样C. 机械抽样D. 整群抽样 B10. 抽样调查必须遵循的基本原则是()A. 灵活性原则B. 准确性原则C. 随机原则D. 可靠性原则 C11. 抽样误差是()A. 代表性误差B. 登记性误差C. 系统性误差D. 随机误差 D12. 抽样平均误差和极限误差的关系是()A. 抽样平均误差小于极限误差B.抽样平均误差大于极限误差C. 抽样平均误差等于极限误差D. 抽样平均误差可能大于、等于或小于极限误差 D13. 在其他条件不变的情况下,如果允许误差缩小为原来的1/2,则样本容量()A. 扩大为原来的4倍B. 每个大为原来的2倍C. 缩小为原来的1/4倍D. 缩小为原来的1/2倍 A14. 一般来说, 在抽样组织形式中,抽样误差较大的是()A. 简单抽样B. 分层抽样C. 整群抽样D. 等距抽样 C15. 根据抽样的资料, 一年级优秀生比重为10%, 二年级为20%,在人数相等时,优秀生比重的抽样误差()A. 一年级较大B. 二年级较大C.相同 D. 无法判断16. 根据重复抽样的资料, 甲单位工人工资方差为25,乙单位为100,乙单位人数比甲单位多3倍, 则抽样误差()A. 甲单位较大B. 无法判断C.乙单位较大 D. 相同17. 最符合随机原则地抽样组织形式是( )A. 整群抽样B. 类型抽样C. 阶段抽样D. 简单随机抽样二、判断题1、 抽样调查必须遵循的原则是灵活性原则。

应用统计学试题和答案分析

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分)1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12。

6元,标准差为2.8元。

试以95。

45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。

已知:8.2,6.12==S x 0455.0=α 则有: 202275.02==Z Z α 平均误差=4.078.22==n S极限误差8.04.0222=⨯==∆nS Z α据公式x x ±=±∆ 代入数据,得该快餐店顾客的总体平均花费数额95。

45%的置信区间为(11。

8,13.4)3附:1080512)(=∑-=i x x i8.392512)(=∑-=i y y i 58=x 2.144=y17900512=∑=i x i104361512=∑=i y i4243051=∑=yx ii i3题 解① 计算估计的回归方程:∑∑∑∑∑--=)(221x x n y x xy n β==-⨯⨯-⨯290217900572129042430554003060=0.567 =-=∑∑nxnyββ10144。

2 – 0.567×58=111。

314估计的回归方程为:y=111。

314+0。

567x② 计算判定系数:222122()0.56710800.884392.8()x x R y y β-⨯===-∑∑4计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。

4题 解:① 拉氏加权产量指数= 1000001.1445.4 1.13530.0 1.08655.2111.60%45.430.055.2q p q q p q ⨯+⨯+⨯==++∑∑② 帕氏单位成本总指数=11100053.633.858.5100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==⨯+⨯+⨯∑∑ 模拟试卷(二) 一、填空题(每小题1分,共10题)1、我国人口普查的调查对象是,调查单位是 。

统计学计算题例题(含答案)

统计学计算题例题(含答案)

1、某企业制定了销售额的五年计划, 该计划要求计划期的最后一年的年销售额应达到 1200万元。

实际执行最后两年情况如下表:请根据上表资料,对该企业五年计划的完成情况进行考核。

1、 计划完成相对数 =1410/1200*100%=117.5%该计划完成相对数指标为正指标, 计划完成相对数又大于 100% ,所以表示该计划超额完成。

从第 四年 5 月至第五年 4 月的一年的年销售额之和恰好为 1200 万元,所以该计划在第五年 4 月完成,提 前 8 个月完成。

2、 某地区制定了一个植树造林的五年计划,计划中设定的目标是五年累计植树造林面积为 2000 万 亩。

实际执行情况如下:请对该长期计划的完成情况进行考核。

2、 计划完成程度相对数 =2100/2000*100%=105%计划完成相对数指标大于100%, 且该指标为正指标 , 所以该计划超额完成截止第五年第三季度累计完成 2000 万亩造林面积,所以提前 1 个 季 度 完 成3、某班学生统计学课程考试成绩情况如下表:请根据上述资料计算该班统计学课程的平均成绩、成绩的中位数、众数和成绩的标准差。

3、某企业职工年龄情况如下表:X 二三于=4740/62=76.45 (分)Me=70+ (62/2-18) *10/20=76.5 (分)Mo=70+(20 J5)70/[(2CM5)+(2CM8)]=77 」4 (分)G-7(55-76.45f *3 +⋯⋯+ (95^76.45f *6/62=10.45 (分)4、某学校有5000 名学生,现从中按重复抽样方法抽取250 名同学,调查其每周观看电视的小时数的情况,获得资料如下表:请根据上述资料,以95% 的概率保证程度对全校学生每周平均收看电视时间进行区间估计。

4> 样本平均数X= Sxf/Sf-l250/250-5样 ______________ __________二>/ 刀(好予f/(工f—1 )二V 1136/249 二2. 14抽样平均误差U 二s/ Vn=0.14因为 F (t) =95%, 所以日.96抽样极限误差△ 二t U 二 1. 96*0. 14=0. 27 区间下限=5-0. 27=4. 73 区间上限二5+0. 27-5. 27全校学生每周平均收看电视的吋间在( 4.73,5.27) 小时之间,概率保证程度为95%5 、某企业对全自动生产线上的产品随机抽取1000 件进行检验,发现有45 件是不合格的,设定允许的极限误差为1.32% 。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

抽样计算题:1、某乡水稻总面积20000亩,以不重复抽样方法从中随机抽取400亩实割实测得样本平均亩产645公斤,标准差72.6公斤。

要求极限误差不超过7.2公斤。

试对该乡水稻的亩产量和总产量作出估计。

(1))亩产量的上、下限:(公斤)98.63702.7645=-=∆-x x(公斤)652.0202.7645=+=∆+x x总产量的上下限:(万公斤)96.12752000098.637=⨯(万公斤)1304.0420000652.02=⨯(2)计算该区间下的概率()t F : 抽样平均误差 ()(公斤)3.592000040014006.72122=⎪⎭⎫⎝⎛-=⎪⎭⎫⎝⎛-=N n n x σμ 因为抽样极限误差x x z μ=∆ 96.159.302.7所以≈=∆=μz 可知概率保证程度()t F =95%2.某地有8家银行,从它们所有的全体职工中随机性抽取600人进行调查,得知其中的486人在银行里有个人储蓄存款,存款金额平均每人3400元,标准差500元,试以95.45%的可靠性推断: (1)全体职工中有储蓄存款者所占比率的区间范围;(2)平均每人存款金额的区间范围。

(1)全体职工中有储蓄存款者所占比率的区间范围:%816004861===n n p ()()%23.39%811%811=-⨯=-=p p p σ抽样平均误差 %6.16003923.0===nP p σμ根据给定的概率保证程度()t F ,得到概率度z()%45.95=t F ⇒ 2=z则抽样极限误差%2.3%6.12=⨯==∆p p t μ 估计区间的上、下限%8.77%2.3%81=-=∆-p p%2.84%2.3%81=+=∆+p p(2)平均每人存款金额的区间范围:抽样平均误差()(元)41.0260050022===nx σμ概率度z=2则抽样极限误差 (元)82.4041.202=⨯==∆x x z μ平均每人存款额的上、下限:(元)18.335982.403400=-=∆-x x(元)82.440382.403400=+=∆+x x3..某企业生产某种产品的工人有1000人,采用不重复抽样从中随机抽取100人调查当日产量,得到他们的人均日产量为126件,标准差为6.47件,要求在95﹪的概率保证程度下,估计该厂全部工人的日平均产量和日总产量。

(F (t )=95%,t=1.96)抽样平均误差 ()(件)61.010*********47.6122=⎪⎪⎭⎫⎝⎛-=⎪⎪⎭⎫ ⎝⎛-=N n nx σμ 概率度z 或t=1.96则抽样极限误差 (件)20.161.096.1=⨯==∆x x z μ全部工人的日平均产量的上、下限:件)2.1278.124()2.1126(-=±=∆±x x日总产量的上、下限:(件)124800)2.1126(1000)(N =-=∆-x x(件)127200)2.1126(1000)N(=+=∆+x x4.某高校由5000名学生,随机抽取250名调查每周看电视的时间,分组资料如下:要求:按不重复抽样的方法,在95.45%的概率下,估计全部学生每周平均看电视时间的可能范围。

(计算结果保留2位小数)()()()()小时26.5~74.4x X 小时)(26.013.02z 13.0500025012504.544N n 1n 小时)(544.4f f x x s 小时)(52501250f xf x x x x 2x 222=∆±==⨯==∆=⎪⎪⎭⎫ ⎝⎛-=⎪⎪⎭⎫ ⎝⎛-===-====∑∑∑∑μσμσσx5.对某鱼塘的鱼进行抽样调查,从鱼塘的不同部位同时撒网,捕到鱼200条,其中草鱼180条。

试按99.73%的概率保证程度:对该鱼塘草鱼所占比重作区间估计。

草鱼比重(成数):%902001801===n n p ()()%30%9.01%9.01=-⨯=-=p p p σ 抽样平均误差 %12.22003.0===nP p σμ()%73.99=t F ⇒ 3=z则抽样极限误差%36.6%12.23=⨯==∆p p z μ 该鱼塘草鱼所占比重作估计区间的上、下限%64.83%36.6%90=-=∆-p p%36.96%36.6%90=+=∆+p p6.对某鱼塘的鱼进行抽样调查,从鱼塘的不同部位同时撒网捕到鱼150条,其中草鱼123条,草鱼平均每条重2千克,标准差0.75千克,试以99.73%的保证程度:(1)对该鱼塘草鱼平均每条重量做区间估计(2)对该鱼塘草鱼所占比重做区间估计第一问:第二问:30.06660.2029(千克)xx z μ∆==⨯=0.0676(千克)x μ===()0.75(千克),3s z σ==2(千克)x =()()20.2029 1.797~2.20(3千克)x X x =±∆=±=()()()12P P n 1230.82n 150p 1-p 0.820.180.14760.03143*0.03140.09410.820.094172.59%~91.41%p P z P p σμμ=====⨯====∆====±∆=±=7.某电子产品使用寿命在1000小时以上为合格品,现在用简单随机重复抽样方法,从10000个产品中抽取100个对其使用寿命进行测试。

其结果如下:根据以上资料,以68.27%的概率(t=1)保证程度,对该产品的合格率进行区间估计。

合格率(成数):%95100951===n n p ()()%79.21%95.01%95.01=-⨯=-=p p p σ 抽样平均误差 %2.21002179.0===nP p σμ则抽样极限误差%2.2%2.21=⨯==∆p p t μ该产品合格率的区间:%2.97_%8.92%2.2%95=±=∆±p p8.某校进行一项英语测验,为了解学生的考试情况,随机抽选部分学生进行调查,所得资料如下:试以95.45%的可靠性估计该校学生英语考试的平均成绩的范围。

(假定采用重复抽样)(计算结果保留2位小数)()()()()()分88.78-74.332.27676.6x X 分)(276.2138.12z (分)138.1100129.44n 分)(44.129f f x x s 分)(6.76100/7660fxf x x xx 2x 222=±=∆±==⨯==∆=====-====∑∑∑∑μσμσσx9.随机抽取某市400户家庭作为样本,调查结果是:80户家庭有一台及一台以上机动车。

试确定以99.73%(t=3)的概率保证估计该市有一台及一台以上机动车的家庭的比率区间。

样本成数:%20400801===n n p ()()%40%201%201=-⨯=-=p p p σ 抽样平均误差 %0.24004.0===nP p σμ则抽样极限误差%0.6%0.23=⨯==∆p p t μ该市有一台及一台以上机动车的家庭的比率区间:%26_%14%6%20=±=∆±p p10.一企业研制了某种新型电子集成电路,根据设计的生产工艺试生产了100片 该集成电路泡,通过寿命测试试验得知这100片该集成电路的平均使用寿命为60000个小时,标准差为500个小时,要求以95.45%的概率保证程度(t=2)估计该集成电路平均使用寿命的区间范围。

()()()()小时00506-599500500006x X 小时100502z (小时)50100500n 小时500s 小时,60000x x x x22x =±=∆±==⨯==∆======μσμσσx11.某食品厂要检验本月生产的10000袋某产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。

要求在95.45﹪的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品?说明:如果题目中无特别要求,使用重复抽样即可。

袋)(1005252222222=⨯=∆=σz n12.某市场调研公司想估计某地区有彩电的家庭所占比例50%,该公司希望估计误差不超过0.05,若置信度(概率)为95%,该公司应抽取多大样本?户)(38516.38405.05.05.01.96p)-p(1t =n 2222==⨯⨯=∆试按不重复抽样方法,以95%的把握程度估计(1)该企业全部职工平 均文化程度;(2)估计受教育程度在10年以上的职工的比重。

(1)该企业全部职工平均文化程度()()()()()年99.7-7.5124.075.7x X 年)(24.012.096.1z (年)12.0)30002001(2001.78)-1(n 年)(78.1f f x x s 年)(75.7f x x x x22x 2=±=∆±==⨯==∆=-====-===∑∑∑∑μσμσσNn f x x(2)样本成数:%22200441===n n p ()()%42.41%221%221=-⨯=-=p p p σ抽样平均误差 %8.230020012004142.0122=⎪⎪⎭⎫ ⎝⎛-=⎪⎪⎭⎫ ⎝⎛-=N n nP p σμ 则抽样极限误差%54.5%8.296.1=⨯==∆p p z μ受教育程度在10年以上的职工的比重区间:%54.27_%46.16%54.5%22)(=±=∆±=p p P。

相关文档
最新文档