高二8-1统计(随机抽样直方图茎叶图)知识点经典例题及练习题带答案
高二81统计随机抽样直方图茎叶图知识点经典例题及练习题带答案
环球雅思教育学科教师讲义讲义编号: ______________ 副校长/组长签字:签字日期:【考纲说明】1、理解随机抽样的必要性和重要性,了解分布、样本数据标准差的意义和作用,理解用样本估计总体的思想。
2、会画频率分布直方图、频率折线图、茎叶图,会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题【趣味链接】U2合唱团在17分钟内得赶到演唱会场,途中必需跨过一座桥,四个人从桥的同一端出发,你得帮助他们到达另一端,天色很暗,而他们只有一只手电筒。
一次同时最多可以有两人一起过桥,而过桥的时候必须持有手电筒,所以就得有人把手电筒带来带去,来回桥两端。
手电筒是不能用丢的方式来传递的。
四个人的步行速度各不同,若两人同行则以较慢者的速度为准。
BONO需花1分钟过桥,EDGE需花2分钟过桥,ADAM需花5分钟过桥,LARRY需花10分钟过桥,他们要如何在17分钟内过桥呢?【知识梳理】一、抽样方法与总体分布的估计1、随机抽样(1)总体:在统计学中, 把研究对象的全体叫做总体,把每个研究对象叫做个体,把总体中个体的总数叫做总体容量.总体与个体之间的关系类似于集合与元素的关系.(2)样本:从总体中随机抽取一部分个体叫做总体的一个样本,样本中个体的数目称为样本的容量,样本和总体之间的关系类似于子集和集合之间的关系.(3)简单随机抽样:一般地,从元素个数为N 的总体中不放回地抽取容量为的样本,如果每一次抽取时总体中的各个个体被抽到的可能性是相同的,那么这种抽样方法叫简单随机抽样,这样抽取的样本,叫做简单随机样本. 常用的方法有抽签法和随机数表法.(4)系统抽样:当总体中的个体比较多时,将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分中抽取一个个体,得到所需要的样本,这样的抽样方法称为系统抽样,也称作等距抽样.(5)分层抽样:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,可将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样. 2、频率分布直方图与茎叶图(1)频率分布:样本中所有数据(或数据组)的频数和样本容量的比就是该数据的频率,所有数据(或数据组)的频率的分布变化规律叫做频率分布,可以用频率分布表、频率分布折线图、茎叶图、频率分布直方图来表示. (2)频率折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图。
高中数学统计抽样方法精选题目(附答案)
高中数学统计抽样方法精选题目(附答案)一、抽样方法1.简单随机抽样(1)特征:①一个一个不放回的抽取;②每个个体被抽到可能性相等.(2)常用方法:①抽签法;②随机数表法.2.系统抽样(1)适用环境:当总体中个数较多时,可用系统抽样.(2)操作步骤:将总体平均分成几个部分,再按照一定方法从每个部分抽取一个个体作为样本.3.分层抽样(1)适用范围:当总体由差异明显的几个部分组成时可用分层抽样.(2)操作步骤:将总体中的个体按不同特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样.1.(1)采用系统抽样方法从960人中抽取32人做问卷调查.为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为()A.7B.9C.10 D.15(2)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取________所学校,中学中抽取________所学校.[解析](1)从960人中用系统抽样方法抽取32人,则每30人抽取一人,因为第一组抽到的号码为9,则第二组抽到的号码为39,第n组抽到的号码为a n=9+30(n-1)=30n-21,由451≤30n-21≤750,得23615≤n≤25710,所以n=16,17,…,25,共有25-16+1=10人.(2)小学中抽取30×150150+75+25=18所学校;从中学中抽取30×75150+75+25=9所学校.[答案](1)C(2)189注:1.系统抽样的特点(1)适用于元素个数很多且均衡的总体. (2)各个个体被抽到的机会均等.(3)总体分组后,在起始部分抽样时采用的是简单随机抽样. (4)如果总体容量N 能被样本容量n 整除,则抽样间隔为k =Nn . 2.与分层抽样有关问题的常见类型及解题策略(1)确定抽样比.可依据各层总数与样本数之比,确定抽样比.(2)求某一层的样本数或总体个数.可依据题意求出抽样比,再由某层总体个数(或样本数)确定该层的样本(或总体)数.(3)求各层的样本数.可依据题意,求出各层的抽样比,再求出各层样本数. 2.某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )A .抽签法B .系统抽样法C .分层抽样法D .随机数法解析:选C 根据年级不同产生差异及按人数比例抽取易知应为分层抽样法. 3.某学校高一、高二、高三3个年级共有430名学生,其中高一年级学生160名,高二年级学生180名,为了解学生身体状况,现采用分层抽样方法进行调查,在抽取的样本中高二学生有32人,则该样本中高三学生人数为________.解析:高三年级学生人数为430-160-180=90,设高三年级抽取x 人,由分层抽样可得32180=x90,解得x =16. 答案:164.某单位有职工960人,其中青年职工420人,中年职工300人,老年职工240人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为14人,则样本容量为________.解析:因为分层抽样的抽样比应相等,所以420960=14样本容量,样本容量=960×14420=32.答案:32二、用样本的频率分布估计总体的频率分布1.频率分布直方图2.茎叶图5.(1)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5].样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.(2)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].①求图中a的值;②根据频率分布直方图,估计这100名学生语文成绩的平均分;③若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.分数段[50,60)[60,70)[70,80)[80,90)x∶y 1∶12∶13∶44∶5 [为50×0.18=9.答案:9(2)解:①由频率分布直方图可知(0.04+0.03+0.02+2a)×10=1.所以a=0.005.②该100名学生的语文成绩的平均分约为x=0.05×55+0.4×65+0.3×75+0.2×85+0.05×95=73.③由频率分布直方图及已知的语文成绩、数学成绩分布在各分数段的人数比,可得下表:分数段[50,60)[60,70)[70,80)[80,90)x 5403020x∶y 1∶12∶13∶44∶5y 5204025100-(5+20+40+25)=10.注:与频率分布直方图有关问题的常见类型及解题策略(1)已知频率分布直方图中的部分数据,求其他数据,可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.(2)已知频率分布直方图,求某种范围内的数据,可利用图形及某范围结合求解.6.如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为()A.0.2 B.0.4C.0.5 D.0.6解析:选B由茎叶图可知数据落在区间[22,30)内的频数为4,所以数据落在区间[22,30)内的频率为410=0.4,故选B.7.为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画出样本的频率分布直方图如图所示.根据此图,估计该校2 000名高中男生中体重大于70.5公斤的人数为()A .300B .360C .420D .450解析:选B 样本中体重大于70.5公斤的频率为: (0.04+0.034+0.016)×2=0.090×2=0.18.故可估计该校2 000名高中男生中体重大于70.5公斤的人数为:2 000×0.18=360(人). 8.某商场在庆元宵节促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为________万元.解析:总销售额为2.50.1=25(万元),故11时至12时的销售额为0.4×25=10(万元).答案:10三、用样本的数字特征估计总体的数字特征有关数据的数字特征9.(1)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A .46,45,56B .46,45,53C .47,45,56D .45,47,53(2)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差(3)由正整数组成的一组数据x 1,x 2,x 3,x 4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)[解析] (1)从茎叶图中可以看出样本数据的中位数为中间两个数的平均数,即45+472=46,众数为45,极差为68-12=56,故选择A.(2)由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错.故选C.(3)假设这组数据按从小到大的顺序排列为x 1,x 2,x 3,x 4,则⎩⎨⎧x 1+x 2+x 3+x44=2,x 2+x32=2,∴⎩⎪⎨⎪⎧x 1+x 4=4,x 2+x 3=4, 又s = 14[(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2] =12(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2=122[(x 1-2)2+(x 2-2)2]=1, ∴(x 1-2)2+(x 2-2)2=2. 同理可求得(x 3-2)2+(x 4-2)2=2.由x 1,x 2,x 3,x 4均为正整数,且(x 1,x 2),(x 3,x 4)均为圆(x -2)2+(y -2)2=2上的点,分析知x 1,x 2,x 3,x 4应为1,1,3,3.[答案] (1)A (2)C (3)1,1,3,3 注:平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.10.为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A .①③ B .①④ C .②③D .②④解析:选B 法一:∵x 甲=26+28+29+31+315=29,x 乙=28+29+30+31+325=30,∴x 甲<x 乙,又s 2甲=9+1+0+4+45=185,s 2乙=4+1+0+1+45=2,∴s 甲>s 乙.故可判断结论①④正确.法二:甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论①④正确,故选B.11.甲和乙两个城市去年上半年每月的平均气温(单位:℃)用茎叶图记录如图所示,根据茎叶图可知,两城市中平均温度较高的城市是__________,气温波动较大的城市是__________.解析:根据题中所给的茎叶图可知,甲城市上半年的平均温度为9+13+17×2+18+226=16,乙城市上半年的平均温度为12+14+17+20+24+276=19,故两城市中平均温度较高的是乙城市,观察茎叶图可知,甲城市的温度更加集中在峰值附近,故乙城市的温度波动较大.答案:乙 乙12.甲、乙两台机床同时加工直径为100 mm 的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位:mm):甲:99,100,98,100,100,103; 乙:99,100,102,99,100,100.(1)分别计算上述两组数据的平均数和方差;(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求. 解:(1)x 甲=99+100+98+100+100+1036=100(mm),x 乙=99+100+102+99+100+1006=100(mm),s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73(mm 2), s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1(mm 2).(2)因为s 2甲>s 2乙,说明甲机床加工零件波动比较大,因此乙机床加工零件更符合要求.四、线性回归1.两个变量的线性相关(1)散点图:将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形.(2)正相关与负相关:①正相关:散点图中的点散布在从左下角到右上角的区域. ②负相关:散点图中的点散布在从左上角到右下角的区域. 2.回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)线性回归方程:方程y ^=b ^x +a ^是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的线性回归方程,其中a ,b 是待定参数.⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2=∑i =1nx i y i-n x y ∑i =1nx 2i-n x 2,a ^=y -b x .13.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)[解] (1)由于x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =16(90+84+83+80+75+68)=80.所以a ^=y -b ^x =80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得 L =x (-20x +250)-4(-20x +250) =-20x 2+330x -1 000 =-20(x -8.25)2+361.25.当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润. 注:(1)线性回归分析就是研究两组变量间线性相关关系的一种方法,通过对统计数据的分析,可以预测可能的结果,这就是线性回归方程的基本应用,因此利用最小二乘法求线性回归方程是关键,必须熟练掌握线性回归方程中两个重要估计量的计算.(2)回归直线方程恒过点(x ,y ).14.某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:回归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻两个月的概率;(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?解:(1)将6组数据按月份顺序编号为1,2,3,4,5,6,从中任取两组数据,基本事件构成的集合为Ω={(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)}共15个基本事件,设抽到相邻两个月的事件为A ,则A ={(1,2),(2,3),(3,4),(4,5),(5,6)}共5个基本事件,∴P (A )=515=13.(2)由表中数据求得x =11,y =24,∑i =14x i y i =1 092,∑i =14x 2i =498.代入公式可得b ^=187.再由a ^=y -b ^x ,求得a ^=-307,所以y 关于x 的线性回归方程为 y ^=187x -307.(3)当x =10时,y ^=1507,⎪⎪⎪⎪1507-22=47<2; 同样,当x =6时,y ^=787,⎪⎪⎪⎪787-12=67<2. 所以该小组所得线性回归方程是理想的.。
(完整版)茎叶图练习题
沙洲中学 2006~2007 学年度第一学期高二数学练习卷编写:宋兴富茎叶图练习题1.以下对于茎叶图的表达正确的选项是()( A )将数据的数按位数进行比较,将数大小基本不变或变化不大的作为一个主杆(茎) ,将变化大的位数作为分枝(叶) ,列在主杆的后边( B )茎叶图只能够解析单组数据,不可以对两组数据进行比较 ( C )茎叶图更不可以表示三位数以上的数据( D )绘图时茎要依据从小到大的次序从下向上列出,共茎的叶可以任意同队列出2.以下对于茎叶图的表达正确的选项是 ()( A )茎叶图可以展现未分组的原始数据,它与频次散布表以及频次散布直方图的办理方式不一样样样( B )对于重复的数据,只算一个( C )茎叶图中的叶是“茎”十进制的上一级单位( D )绘图时茎要依据从小到大的次序从下向上列出,共茎的叶可以任意同队列出0 81 0 9的叶子数为( )3.茎叶图中,茎 2 2 1 3 53 0 2 34 6( A ) 0 ( B ) 1( C ) 2 (D ) 34.数据 8, 51, 33, 39, 38, 23, 26, 28, 13, 16, 14 的茎叶图是 ()0 80 8 0 80 83 4 6 3 4 6 3 4 61 1 3 4 61 13 6 83 6 8 3 6 8( A )2( B ) 23 6 8(D )23 8 9( C ) 23 8 9 3 3 3 8 93 3 8 9 31 44 141415 5 5 155.用茎叶图对两组数据进行比较时 ()( A )左边的叶按从大到小的次序写,右边的叶按从小到大的次序写( B )左边的叶按从大到小的次序写,右边的叶也按从大到小的次序写( C )左边的叶按从小到大的次序写,右边的叶也按从小到大的次序写( D )左边的叶按从小到大的次序写,右边的叶按从大到小的次序写甲乙0 85 2 1 3 4 66.茎叶图5 42 3 6 8 中,甲组数据的中位数是()9 7 6 6 1 13 3 8 99 4 40 5 1( A ) 3131 36( C ) 36( D )( B )22 0 5 6 8 97.茎叶图 3 3 3 3 4 5 8 的茎为,叶子最多的茎是。
高二数学--概率与统计-(1)
高二数学 概率与统计考试要求1.统计(1)随机抽样① 理解随机抽样的必要性和重要性.② 会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法. (2)总体估计① 了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.② 理解样本数据标准差的意义和作用,会计算数据标准差. ③ 能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释. ④ 会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.⑤ 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题. (3)变量的相关性① 会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系. ② 了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 不要求记忆线性回归方程系数公式()()()1122211,nniiiii i nniii i x ynx y xxyyb a y bxxnxxx-------===---∑∑∑∑用最小二乘法求线性回归方程系数公式:7.概率(1)事件与概率① 了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别.② 了解两个互斥事件的概率加法公式. (2)古典概型①理解古典概型及其概率计算公式.②会计算一些随机事件所含的基本事件数及事件发生的概率. (3)随机数与几何概型①了解随机数的意义,能运用模拟方法估计概率. ②了解几何概型的意义.1.课本概念与定理详解(1)随机抽样①简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体数较少. ②系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多.③分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成.(2)众数、中位数、平均数①众数:在样本数据中,出现次数最多的那个数据.②中位数:在样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.在直方图中取频率为0.5处的频数。
高二8-1统计(随机抽样、直方图、茎叶图)知识点、经典例题及练习题带答案
环球雅思教育学科教师讲义讲义编号: ______________ 副校长/组长签字:签字日期:【考纲说明】1、理解随机抽样的必要性和重要性,了解分布、样本数据标准差的意义和作用,理解用样本估计总体的思想。
2、会画频率分布直方图、频率折线图、茎叶图,会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题【趣味链接】U2合唱团在17分钟内得赶到演唱会场,途中必需跨过一座桥,四个人从桥的同一端出发,你得帮助他们到达另一端,天色很暗,而他们只有一只手电筒。
一次同时最多可以有两人一起过桥,而过桥的时候必须持有手电筒,所以就得有人把手电筒带来带去,来回桥两端。
手电筒是不能用丢的方式来传递的。
四个人的步行速度各不同,若两人同行则以较慢者的速度为准。
BONO需花1分钟过桥,EDGE需花2分钟过桥,ADAM需花5分钟过桥,LARRY需花10分钟过桥,他们要如何在17分钟内过桥呢?【知识梳理】一、抽样方法与总体分布的估计1、随机抽样(1)总体:在统计学中, 把研究对象的全体叫做总体,把每个研究对象叫做个体,把总体中个体的总数叫做总体容量.总体与个体之间的关系类似于集合与元素的关系.(2)样本:从总体中随机抽取一部分个体叫做总体的一个样本,样本中个体的数目称为样本的容量,样本和总体之间的关系类似于子集和集合之间的关系.(3)简单随机抽样:一般地,从元素个数为N 的总体中不放回地抽取容量为的样本,如果每一次抽取时总体中的各个个体被抽到的可能性是相同的,那么这种抽样方法叫简单随机抽样,这样抽取的样本,叫做简单随机样本. 常用的方法有抽签法和随机数表法.(4)系统抽样:当总体中的个体比较多时,将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分中抽取一个个体,得到所需要的样本,这样的抽样方法称为系统抽样,也称作等距抽样.(5)分层抽样:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,可将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样. 2、频率分布直方图与茎叶图(1)频率分布:样本中所有数据(或数据组)的频数和样本容量的比就是该数据的频率,所有数据(或数据组)的频率的分布变化规律叫做频率分布,可以用频率分布表、频率分布折线图、茎叶图、频率分布直方图来表示. (2)频率折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图。
高中数学涉及的统计学知识典型例题分析
高中数学涉及的统计学知识典型例题分析一、基础知识:(一)随机抽样:1、抽签法:把总体中的N 个个体编号,把号码写在号签上,将号签放在一个容器中搅拌均匀后,每次从中抽取一个号签,连续抽取n 次,就得到容量为n 的样本2、系统抽样:也称为等间隔抽样,大致分为以下几个步骤:(1)先将总体的N 个个体编号(2)确定分段间隔k ,设样本容量为n ,若N n 为整数,则N k n= (3)在第一段中用简单随机抽样确定第一个个体编号l ,则后面每段所确定的个体编号与前一段确定的个体编号差距为k ,例如:第2段所确定的个体编号为l k +,第m 段所确定的个体编号为()1l m k +−,直至完成样本注:(1)若N n不是整数,则先用简单随机抽样剔除若干个个体,使得剩下的个体数能被n 整除,再进行系统抽样。
例如501名学生所抽取的样本容量为10,则先随机抽去1个,剩下的500个个体参加系统抽样(2)利用系统抽样所抽出的个体编号排成等差数列,其公差为k3、分层抽样:也称为按比例抽样,是指在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本。
分层抽样后样本中各层的比例与总体中各个层次的比例相等,这条结论会经常用到(二)频率分布直方图:1、频数与频率(1)频数:指一组数据中个别数据重复出现的次数或一组数据在某个确定的范围内出现的数据的个数.(2)频率:是频数与数据组中所含数据的个数的比,即频率=频数/总数(3)各试验结果的频率之和等于12、频率分布直方图:若要统计每个小组数据在样本容量所占比例大小,则可通过频率分布表(表格形式)和频率分布直方图(图像形式)直观的列出(1)极差:一组数据中最大值与最小值的差(2)组距:将一组数据平均分成若干组(通常5-12组),则组内数据的极差称为组距,所以有组距=极差/组数(3)统计每组的频数,计算出每组的频率,便可根据频率作出频率分布直方图(4)在频率分布直方图中:横轴按组距分段,纵轴为“频率/组距”(5)频率分布直方图的特点:②因为各试验结果的频率之和等于1,所以可得在频率分布直方图中,各个矩形的面积和为1 (三)茎叶图:通常可用于统计和比较两组数据,其中茎是指中间的一列数,通常体现数据中除了末位数前面的其他数位,叶通常代表每个数据的末位数。
(完整版)高中数学统计、统计案例知识点总结和典例
统计一.简单随机抽样:抽签法和随机数法1.一般地,设一个总体含有N个个体(有限),从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等(n/N),就把这种抽样方法叫做简单随机抽样。
2.一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本,这种抽样方法叫做抽签法。
抽签法的一般步骤:a、将总体的个体编号。
b、连续抽签获取样本号码。
3. 利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法。
随机数表法的步骤:a、将总体的个体编号。
b、在随机数表中选择开始数字。
c、读数获取样本号码。
4. 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。
二.系统抽样:1.一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。
系统抽样的一般步骤:(1)采用随机抽样的方法将总体中的N个个编号。
(2)将整体按编号进行分段,确定分段间隔k=N/n。
(k∈N,L≤k).(3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。
(4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。
在确定分段间隔k时应注意:分段间隔k为整数,当N/n不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。
三.分层抽样:1.一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。
《统计》知识点总结+典型例题+练习(含答案)
统计考纲要求1.理解总体、个体、样本等概念.2.会指出具体问题中的总体、个体、样本、样本容量.3.了解简单随机抽样、系统抽样、分层抽样等三种抽样方法.4.会根据特征选用合适的抽样方法抽取样本.5.理解用样本的频率分布估计总体.6.理解用样本均值、方差和标准差估计总体的均值、方差和标准差.知识点一:总体与样本1.定义:在统计中,所研究对象的全体叫做总体,组成总体的每个对象叫做个体.2.定义:被抽取出来的个体的集合叫做总体的样本,样本所含个体的数目叫做样本容量. 知识点二:抽样1.简单随机抽样定义:我们采用抽签的方法,将总体按照某种顺序编号,写在小纸片上.将小纸片揉成小团,放到一个不透明的袋子中,充分搅拌后,再从中逐个抽出10个小纸团.最后根据编号找到个体.这种抽样叫做简单随机抽样.注意:简单随机抽样必须保证总体的每个个体被抽到的机会是相同的.也就是说,简单随机抽样是等概率抽样.2.系统抽样定义:当总体所含的个体较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分中抽取一定数目的个体.这种抽样叫做系统抽样(或机械抽样).主要步骤:从容量为N的总体中,用系统抽样抽取容量为n的样本,按照下面的步骤进行:(1)编号:将总体的N个个体编号;(2)确定间隔:可以考虑用Nn(取整数)作间隔分段,将总体分成n段;(3)抽样:按照一定的规则抽取样本.如抽每段的第k个顺序号的个体(k为小于Nn的整数),得到容量为n的样本.3.分层抽样当总体是由有明显差异的几个部分组成时,可将总体按差异情况分成互不重叠的几个部分——层,然后按各层个体总数所占的比例来进行抽样,这种抽样叫做分层抽样. 对分层抽样的每一层进行抽样时,可采用简单随机抽样或系统抽样. 知识点三:用样本估计总体 1.用样本的频率分布估计总体频率频率的定义:各组内数据的个数,叫做该组的频数.每组的频数与全体数据的个数之比叫做该组的频率.频率分布直方图:根据频数分布表中各组的频率,得到频率分布表,由频率分布表画出频率分布直方图.用样本的频率分布估计总体的步骤为: (1)选择恰当的抽样方法得到样本数据;(2)计算数据最大值和最小值、确定组距和组数,确定分点并列出频率分布表; (3)绘制频率分布直方图;(4) 观察频率分布表与频率分布直方图,根据样本的频率分布,估计总体中某事件发生的概率.2.用样本均值、标准差估计总体 (1)平均数或均值定义:如果有n 个数1x ,2x ,…,n x ,那么121()n x x x x n=+++叫做这n 个数的平均数或均值,x 读作“x 拔”. 均值反映出这组数据的平均水平. (2)样本方差定义:如果样本由n 个数1x ,2x ,…,n x 组成,那么样本的方差为 2222121()()()1n s x x x x x x n ⎡⎤=-+-++-⎣⎦-. (3)样本标准差由于样本方差的单位是数据的单位的平方,使用起来不方便.因此,人们常使用它的算术平方根来表示个体与样本均值之间偏离程度,叫做样本标准差.即(+-n s x .题型一 总体、个体、样本、样本容量例1 某地区为了掌握7岁儿童身高状况,随机抽取200名儿童测试身高,请指出其中的总体、个体、样本与样本容量.解答:该地区所有7岁儿童的身高是总体,每一个7岁儿童的身高是个体,被抽取的200名7岁儿童的身高是样本,样本容量是200.题型二抽样例2某中职学校为了解2009级新生的身体发育情况,从1000名新生中,利用系统抽样,抽取一个容量为50的样本.请你来完成这个抽样.解答:将这1000名学生编号(也可以利用新生录取号),由于100020 50,所以取每段间隔为20,将编号分成50段,规定各段抽取第16个顺序号的学生,得到容量为50的样本.其学生号码依次为16,36,56,76, (996)题型三用样本均值、标准差估计总体例3 科研人员在研究地里的麦苗长势时,随机抽取20株,测得各株高为(单位:mm): 61675867656459625866645960635860 62606363求样本均值、样本方差、样本标准差.分析:应用公式解答:样本均值61.95,样本方差约为8.68,样本标准差约为2.95.一、选择题1.要能清楚的表示各部分在总体中所占的百分比,应选择().A 扇形统计图B 折线统计图C条形统计图 D 表框统计2.某社区有400个家庭,其中高等收入家庭120户,中等收入家庭180户,低收入家庭100户,为了调查社会购买力的某项指标,要从中抽取一个容量为100的样本记作①;某校高一年级有12名女排球运动员,要从中选出3人调查学习情况记作②.那么,完成上述2项调查应采用的抽样方法是( ).A. ①用随机抽样法,②用系统抽样法B.①用分层抽样法,②用随机抽样法C.①用系统抽样法,②用分层抽样法D.①用分层抽样法,②用系统抽样法3. 以下物征数中能反映一组数据波动大小的是().A极差B平均数C方差D以上都不是4.某同学参加跳远比赛前,若教练想对他10次的训练成绩进行了分析以判断他的成绩是否稳定,则教练需要知道该同学这10次成绩的( ).A平均数 B.方差 C.频数 D.频率5.数据5,7,7,8,10,11的平均值是( ).A.2B. 4C.8D. 16.一组数据:5,7,7,a,10,11,它们的平均值是8,则a的值是( ).A2 B.4 C.8 D.17.扇形统计图中,占圆面积40%的扇形的圆心角的度数是(B )A 162°B 144°C 150°D 120°8.用随机数表法从100名学生(男生25人)中抽选20人进行问卷调查,某男生被抽到的概率是( C ).A.1100B.125C.15D.149. 为了了解1200名学生对课改试验的意见,计划从中抽取一个容量为30的样本,若采用系统抽样的方法,则分段间隔为( ).A.40B.30C.20D.1210. 数据-1,-2,0,1,2的标准差是()A 1B 2 C、0 D二、判断题1.数据1,2,3,2 的众数是2, ( )2.为了了解某校学生早餐就餐情况,四位同学做了不同的调查:小华向初一年级的三个班级的全体同学做了调查;小明向初二年级的三个班级的全体同学做了调查;小华向初三年级的全体同学做了调查;小珍分别向初一(1)班、初二(1)、初三(1)班的全体同学做了调查,则小华同学的抽样调查较科学.()3.要了解一批灯泡的使用寿命,从中抽取60只灯泡进行试验,在这个问题中,样本是抽取的60只灯泡.()4.为了考查某地区初中毕业生的数学毕业会考情况,从中抽查了200名考生的数学成绩,在这个问题中总体是被抽查的200名考生.()5.某校一个年级有12个班,每个班有50名学生,每班的学号都是1~50,为了了解学生的课外兴趣爱好,要求对每班学号为20的学生进行问卷调查,那么这里采用的抽样方法是抽签法.()6.某职业学校高一年级有机电、财经、医护这三个专业,其学生人数之比是5∶3∶2,若用分层抽样的方法抽取容量为100的样本,则应从医护专业中抽取20个个体.()7. 为了知道一锅汤的味道,妈妈从锅里舀了一勺汤尝尝,这种调查方式是抽样调查.()8.若数据1,2,5,3,4的平均数为3.()9.青年歌手大奖赛共有10名选手参赛,并请了7名评委,下表是7名评委给参加最后决赛的两位选手甲评定的成绩,去掉一个最高分和一个最低分后,甲、乙选手剩余数据的平均成绩分别为84.()10. 有四位同学从编号为1-50的总体中抽取8个个体组成一个样本,他们选取的样本中个体编别为:①05,10,15,20,25,30,35,40;②43,44,45,46,47,48,49,50;③1,3,5,7,9,11,13,15,17;④43,25,2,17,35,9,24,19.认为样本④较具有随机性.()三、填空题1.从某工厂生产的某一批零件中,随机抽取10件,测得长度为(单位:cm):79、81、80、78、79、81、79、82、79、78,则总体是_______,个体是_______,样本是_______,样本容量是_______.2.0,-1,1,-2,1 的中位数是为________.3.数据2,4,6,8 的平均数是是________.4.小新家今年6月份头6天用米量如下表:请你运用统计知识,估计小新家6月份(30天)用米量为________千克。
高中数学 统计 经典例题和巩固练习(及详解)
高中数学 统计总复习(例题、巩固练习、例题和巩固练习详解)【典型例题】类型一:随机抽样例1.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是( )A .分层抽样法,系统抽样法B .分层抽样法,简单随机抽样法C .系统抽样法,分层抽样法D .简单随机抽样法,分层抽样法举一反三:【变式1】甲校有3600名学生,乙校有5400名学生,丙校有1800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个样本容量为90人的样本,应在这三校分别抽取学生( )A.30人,30人,30人B.30人,45人,15人C.20人,30人,10人D.30人,50人,10人【变式2】一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为l ,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 小组中抽取的号码个位数字与m+k 的个位数字相同.若m=6,则在第7组中抽取的号码是 .【变式3】某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加了其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的41,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同的年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定(Ⅰ)游泳组中,青年人、中年人、老年人分别所占的比例; (Ⅱ)游泳组中,青年人、中年人、老年人分别应抽取的人数.类型二:用样本估计总体例2.一次科技知识竞赛,两组学生成绩统计如下表:已经算得两个组的平均数都是80分,请根据你所学统计知识,进一步判断这两个组这次竞赛中的成绩谁优谁次,并说明理由。
茎叶图及其例题讲解
茎叶图一.茎叶图1.茎叶图:茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出。
2.茎叶图的特征(1)用茎叶图表示数据有两个优点:一是统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。
(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两组以上的数据虽然能够记录,但是没有表示两个记录那么直观、清晰。
当样本数据较多时,因为每一个数据都要在图中占据一个空间,用茎叶图很不方便。
3.制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出. 茎叶图对于分布在0~99的容量较小的数据比较合适,此时,茎叶图比直方图更详尽地表示原始数据的信息. 在茎叶图中,茎也可以放两位,后面位数多可以四舍五入后再制图.4.画茎叶图时的注意事项(1)将每个数据分为茎(高位)和叶(低位)两部分,当数据是两位整数时,茎为十位上的数字,叶为个位上的数字;当数据是由整数部分和小数部分组成时,可以把整数部分作为茎,小数部分作为叶。
(2)将茎上的数字按大小次序排成一列。
(3)为了方便分析数据,通常将各数据的叶按大小次序写在其茎右(左)侧。
(4)用茎叶图比较数据时,一般从数据分布的对称性、中位数,稳定性等方面来比较。
二.茎叶图中常用的几个量:众数.中位数.平均数(样本的数字特征) (1)众数:出现次数最多的数叫做众数.(2)中位数:如果将一组数据按大小顺序依次排列,把处在最中间位置的一个数据或中间两个数据的平均是叫做这组数据的中位数. (例:2、3、4、5、6、7 中位数:(4+5)/2=4.5) (例:1、2、3、6、7的中位数是3。
)(3)平均数与加权平均数:如果有n 个数,,,,n x x x x ⋯⋯321那么12nx x x x n++⋅⋅⋅+=叫做这n个数的平均数. 如果在n 个数中,1x 出现次1f 次, 2x 出现次2f 次,……,k x 出现次2f 次,(这里),n f f f k =+⋯⋯++21那么11221()k k x x f x f x f n=++⋅⋅⋅+叫做这n 个数的加权平均数,其中k f f f ⋯⋯,,21叫做权.(4)标准差与方差:设一组数据123nx x x x ⋯,,,,的平均数为x ,则nx x x x x x s s n 222212)()()(-++-+-== ,其中2s 表示方差,s 表示标准差. 例1 下面一组数据是某生产车间30名工人某日加工零件的个数,请设计适当的茎叶图表示这组数据,并由图出发说明一下这个车间此日的生产情况。
高二数学统计试题答案及解析
高二数学统计试题答案及解析1.某考察团对全国10大城市进行职工人均工资水平(千元)与居民人均消费水平(千元)统计调查,与具有相关关系,回归方程为,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为()A.83%B.72%C.67%D.66%【答案】A【解析】将y=7.675代入回归方程,可计算得x≈9.26,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.26≈0.83,即约为83%.【考点】回归方程2.回归分析中,相关指数的值越大,说明残差平方和A.越小B.越大C.可能大也可能小D.以上都不对【答案】A【解析】相关系数越大,则相关性越强。
即数据的残差平方和越小。
【考点】线性相关关系的判断。
3.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是()A.12,24,15,9B.9,12,12,7C.8,15,12,5D.8,16,10,6【答案】D【解析】由题意,得抽样比为,所以高级职称抽取的人数为,中级职称抽取的人数为,初级职称抽取的人数为,其余人员抽取的人数为,所以各层中依次抽取的人数分别是8人,16人,10人,6人,故选D.【考点】分层抽样.【方法点睛】分层抽样满足“”,即“或”,据此在已知每层间的个体数量或数量比,样本容量,总体数量中的两个时,就可以求出第三个.4.从某校高三年级随机抽取一个班,对该班名学生的高校招生体检表中的视力情况进行统计,其频率分布直方图如图所示:若某高校专业对视力的要求在以上,则该班学生中能报A专业的人数为________【答案】20【解析】根据频率分布直方图,得视力在0.9以上的频率为(1.00+0.75+0.25)×0.2=0.4,∴该班学生中能报A专业的人数为50×0.4=20.【考点】频率分布直方图.5.设某大学的女生体重(单位:)与身高(单位:)具有线性相关关系,根据一组样本数据(),用最小二乘法建立的回归方程为,则下列结论中不正确的是()A.与具有正的线性相关关系B.回归直线过样本点的中心C.若该大学某女生身高增加,则其体重约增加D.若该大学某女生身高为,则可断定其体重必为【答案】D【解析】 A正确;回归直线过样本点中心,故B正确;某女生身高增加,则其体重约增加,故D正确;C中体重为预测值,故C错误。
高中数学:必修第二册第九章-统计教学教案:随机抽样(习题含答案)
高中数学:第二册第九章:随机抽样教案一、基础知识梳理1.抽样的必要性在实际中要全面了解总体的情况,往往难以做到,一般也不可能或没有必要对每个个体逐一进行研究.因为:①一些总体中包含的个体数通常是大量的甚至是无限的.如不可能对所有的灯泡进行试验,记录每一个灯泡的使用寿命;②一些总体具有破坏性.如不可能对所有的炮弹进行试射;③一些调查具有破坏性.如不可能对地里所有的种子是否发芽都挖出来检验;④全面调查(普查)往往要浪费大量的人力、物力和财力.所以常通过从总体中抽取一部分个体,根据对这一部分个体的观察研究结果,再去推断和估计总体情况,即用样本估计总体一一这是统计学的一个基本思想.2.相关概念回顾(1)总体:统计中所考察对象的某一数值指标的全体构成的集合称为总体.(2)个体:构成总体的每一个元素叫做个体.(3)样本:从总体中抽取若干个个体进行考察,这若干个个体所构成的集合叫做总体的一个样本,样本中个体的数目叫做样本容量.3.简单随机抽样(1)概念),如果每一般地,设一个总体含有N个个体,从中逐个___________地抽取n个个体作为样本(n N次抽取时总体内的各个个体被抽到的机会都___________,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.(2)两种常用的简单随机抽样方法①抽签法(抓阄法):一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.抽签法简单易行,当总体中的个体数___________时,使总体处于“搅拌均匀”的状态比较容易,这时,每个个体有均等的机会被抽中,从而能够保证样本的代表性.②随机数法:随机数法,即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.这里仅介绍随机数表法.随机数表由数字0,1,2,…,9组成,并且每个数字在表中各个位置出现的机会都是一样的.随机数表法简单易行,不论总体容量是多少都可以使用,它很好地解决了用抽签法当总体容量较多时制签难的问题.但是当总体容量很大时,需要的样本容量也很大时,利用随机数法抽取样本仍不方便. 注意:为了保证所选数字的随机性,需在查看随机数表前就指出开始数字的横、纵位置.(3)简单随机抽样的特征:①有限性:简单随机抽样要求被抽取的样本的总体个数是有限的,便于通过样本对总体进行分析 ②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.④等可能性:简单单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样方法的公平性.4.系统抽样(1)概念在抽样中当总体个体数___________时,可将总体分成___________的若干部分,然后按照预先制定的规则,从每一部分抽取___________个体,得到所需的样本,这种抽样方法叫做系统抽样.(2)步骤一般地,假设要从容量为N 的总体中抽取容量为n 的样本,可以按下列步骤进行系统抽样:①先将总体的N 个个体编号,有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等. ②确定分段间隔k ,对编号进行分段.当N n (n 是样本容量)是整数时,取N k n=. ③在第1段用简单随机抽样的方法确定第一个个体编号()l l k ≤.④按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号()l k +,再加k 得到第3个个体编号(2)l k +,依次进行下去,直到获取整个样本.注意:若N n不是整数,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除.另外,系统抽样适用于总体容量较大,且个体之间无明显差异的情况.5.分层抽样一般地,在抽样时,将总体分成___________,然后按照___________,从各层独立地抽取一定数量的个体,将___________取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.分层抽样适用于已知总体是由差异明显的几部分组成的.6.三种抽样方法的区别和联系三种抽样方法的特点及其适用范围如下表:习题参考答案:3.(1)不放回相等(2)①不多4.(1)较多均衡一个5.互不交叉的层一定的比例各层二、重点知识梳理一、简单随机抽样要判断所给的抽样方法是否是简单随机抽样,关键是看它们是否符合简单随机抽样的定义,即简单随机抽样的四个特点:有限性、逐一性、不放回性、等可能性.(1)总体是数值指标的全体,例如,要考察某班男生的身高,则总体为该班全部男生的身高数据,而不是该班的男生.(2)个体是总体的一个元素,因此构成总体的每一个数值指标都为个体.(3)样本是总体的一部分,因此样本中所含个体的数量不能超过总体的数量,样本中个体的来源为总体中的个体.1.抽签法(1)对于抽签法,注意:①号签的大小、形状要完全相同.②抽签前需将号签搅拌均匀.(2)抽签法的优点:抽签法简单易行,当总体中的个体数不多时,使总体处于“搅拌均匀”的状态比较容易,这时,每个个体有均等的机会被抽到,从而能够保证样本的代表性(3)抽签法的缺点:①当总体中的个体数较多时,制作号签的成本就会增加,使得抽签的成本增加;②)号签很多时,把它们搅拌均匀就比较困难,很难保证每个个体人选样本的等可能性,从而产生坏样本(即代表性差的样本)的可能性增加.2.随机数表法(1)对于随机数表法,注意:①抽样过程中选定的初始数和读数的方向是任意的.②若用题中所给的编号,但编号位数不统一时,可在位数少的数前添加“0”来调整.③读数时应结合编号特点进行读取,如:编号为两位,则两位、两位地读取;编号为三位,则三位、三位地读取.(2)随机数表的形成随机数表由数字0,1,2,…,9组成,并且每个数字在表中各个位置出现的机会都是一样的(随机数表不是唯一的,只要符合各个位置出现各个数字的可能性相同的要求,就可以构成随机数表.常用的方法是通过随机数生成器,例如使用计算器或计算机的应用程序生成随机数的功能,可以生成一张随机数表,通常根据实际需要和方便使用的原则,将几个数组合在一起,如5个数一组,然后通过随机数表抽取样本)(3)随机数表法的步骤①编号.将N个个体编号,这里所谓的编号,实际上是编数字号码.例如:将100个个体编号成00,01,02,...,99,而不是编号成0,1,2, (99)此外,将起始号码选为00,而不是01,这样可使100个个体都可用两位数字号码表表示,便于运用随机数表取数.②选定初始值(数).为了保证所选数字的随机性,在查看随机数表前就指出开始数字的横、纵位置.③选号.从选定的数字开始按照一定的方向读下去,得到的号码若不在编号中或已被选用,则跳过,直到选满n个为止.④确定样本.按步骤③选出的号码从总体中找出与其对应的个体,组成样本.(4)随机数表法的优缺点优点:简单易行,不论总体容量是多少都可以使用,它很好地解决了用抽签法当总体容量较大时制签难的问题.缺点:当总体容量很大,需要的样本容量也很大时,利用随机数表法抽取样本仍不方便.【例1】某单位举办一场活动,共有50名志愿者参与了报名,现要从中随机抽出6人参加一项活动,请用抽签法进行抽样,并写出过程.【答案】答案详见解析.【解析】抽样过程:第一步,将50名志愿者编号,号码为1,2,3, (50)第二步,将号码分别写在号签上;第三步,将所有号签放入一个不透明的箱子中,充分搅匀;第四步,依次不放回地抽取6次,并记录其编号,对应编号的志愿者参加活动。
高中统计复习题(回归方程-独立性检验-茎叶图-频率分布直方图)
统计专题一、选择题1.对总数为N 的一批零件抽取一个容量为30的样本,若每个零件被抽取的概率为0.25,则N 等于( ) A.150 B.200 C.120 D.1002.(2010·重庆高考)某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人.为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本.若样本中的青年职工为7人,则样本容量为( )A .7B .15C .25D .353.(2010·福建高考)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A.91.5和91.5 B .91.5和92 C .91和91.5D .92和924.(2010·湖南高考)某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( ) A.y ︿=-10x +200 B.y ︿=10x +200 C.y ︿=-10x -200D.y ︿=10x -2005.(2011·山东济宁调研)执行如图所示的程序框图,若输出的b 的值为16,则图中判断框内①处应填( )A .3B .4C .5D .26.阅读如图所示的程序框图,若记y =f (x ).且x 0满足f (x 0)<0,若f [f (x 0)]=1,则x 0=( )A.π4 B.π3C.2π3 D.5π47.(2010·改编题)已知某算法的流程图如图所示,若将输出的数据(x,y)依次记为(x1,y1),(x2,y2),…(x n,y n).则程序结束时,最后一次输出的数组(x,y)是()A.(1 004,-2 006) B.(1 005,-2 008)C.(1 006,-2 010) D.(1 007,-2 012)8.(2011·安徽名校联考)关于统计数据的分析,有以下几个结论:①一组数不可能有两个众数;②将一组数据中的每个数据都减去同一个数后,方差没有变化;③调查剧院中观众观看感受时,从50排(每排人数相同)中任意抽取一排的人进行调查,属于分层抽样;④一组数据的方差一定是正数;⑤如下图是随机抽取的200辆汽车通过某一段公路时的时速分布直方图,根据这个直方图,可以得到时速在[50,60)的汽车大约是60辆.则这5种说法中错误的个数是()A.2 B.3C.4 D.5二、填空题(4×5分=20分)10.(2010·创新题)某企业三月中旬生产A、B、C三种产品共3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:由于不小心,表格中A A产品的样本容量比C 产品的样本容量多10,根据以上信息,可得C产品的数量是________件.11.一个总体中有100个个体,随机编号0,1,2,...,99,依编号顺序平均分成10个小组,组号依次为1,2,3, (10)现用系统抽样法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是___________________________.12.(2011·天津和平区一模)在如右图所示的程序框图中,当程序被执行后,输出s的结果是________.13.(2010·创新题)某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查对临界值表知P(K2≥3.841)≈0.05.p:有95%的把握认为“这种血清能起到预防感冒的作用”;q:若某人未使用该血清,那么他在一年中有95%的可能性得感冒;r:这种血清预防感冒的有效率为95%;s:这种血清预防感冒的有效率为5%.则下列结论中,正确结论的序号是________.(把你认为正确的命题序号都填上)①p∧綈q;②綈p∧q;③(綈p∧綈q)∧(r∨s);④(p∨綈r)∧(綈q∨s).三、解答题(共27分)14.(13分)(2011·北京海淀)某校高三年级进行了一次数学测验,随机从甲乙两班各抽取6名同学,所得分数的茎叶图如图所示.(1)根据茎叶图判断哪个班的平均分数较高,并说明理由;(2)现从甲班这6名同学中随机抽取两名同学,求他们的分数之和大于165分的概率.15.(14分)(2011·江苏徐州模拟)高三年级有500名学生,为了了解数学学科的学习情况,现从中随机抽取若干名学生在一次测试中的数学成绩,制成如下频率分布表:(1)根据上面图表,①②③④处的数值分别为__________、________、________、________; (2)在所给的坐标系中画出[85,155]的频率分布直方图;(3)根据题中信息估计总体平均数和中位数,并估计总体落在[129,155]中的频率.16.某中学100名高一新生分成水平相同的甲、乙两个“平行班”,每班50人.陈老师用A 、B 两种不同的教学方式分别对甲、乙两个班级进行教改实验.为了解教学效果,期末考试后,陈老师分别从两个班级中各随机抽取20名同学的成绩进行统计,作出茎叶图如下. 记成绩不低于90分者为“成绩优秀”.(I )在乙班的20个样本中,现从不低于86分的成绩中随机抽取2个,求抽出的两个成绩均优秀的概率;(II)附:2()()()()()n ad bc K a b c d a c b d -=++++(此公式也可写成2211221221()n n n n n n n n n χ-=)17. .(1)画出散点图; (2)求回归直线方程;(3)试预测广告费支出为10百万元时,销售额多大?BAAACBB 答案:800 答案:63 答案:286 答案:①④15解析:(1)因为乙班的成绩集中在80分,且没有低分,所以乙班的平均分比较高.(2)设从甲班中任取两名同学,两名同学分数之和超过165分为事件A .从甲班6名同学中任取两名同学,则基本事件空间中包含15个基本事件,而事件A 中包含4个基本事件, 所以,P (A )=415. ∴从甲班中任取两名同学,两名同学分数之和超过165分的概率为415.16解析:(1)椭机抽出的人数为120.300=40,由统计知识知④处应填1;③处应填440=0.1;②处应填1-0.050-0.1-0.275-0.300-0.200-0.050=0.025;①处应填0.025×40=1.(2)频率分布直方图如下图.(3)利用组中值算得平均数为:90×0.025+100×0.05+110×0.2+120×0.3+130×0.275+140×0.1+150×0.05=122.5;总体落在[129,155]上的频率为610×0.275+0.1+0.05=0.315.∴总体平均数约为122.5,总体落在[129,155]上的频率约为0.315.。
统计经典例题及答案
统计专题训练1、为了解小学生的体能情况,抽取了某校一个年级的部分学生进行一分钟跳绳次数测试,将取得数据整理后,画出频率分布直方图(如图).已知图中从左到右前三个小组频率分别为0.1,0.3,0.4,第一小组的频数为5.(1)求第四小组的频率;(2)参加这次测试的学生有多少人;(3)若次数在75次以上(含75次)为达标,试估计该年级学生跳绳测试的达标率是多少.解(1)由累积频率为1知,第四小组的频率为1-0.1-0.3-0.4=0.2.(2)设参加这次测试的学生有x人,则0.1x=5,∴x=50.即参加这次测试的学生有50人.(3)达标率为0.3+0.4+0.2=90%,所以估计该年级学生跳绳测试的达标率为90%.2、对某400件元件进行寿命追踪调查情况频率分布如下:寿命(h)频率[500,600)0.10[600,700)0.15[700,800)0.40[[800,900)0.20[900,1000]0.15合计 1(1)(3)估计元件寿命在700 h以上的频率.解(1)寿命与频数对应表:寿命(h)[500,600)[600,700)[700,800)[800,900)[来源:学科网ZXXK][900,1000]频数40601608060(2)估计该元件寿命在[500,800)内的频率为0.10+0.15+0.40=0.65.(3)估计该元件寿命在700 h以上的频率为0.40+0.20+0.15=0.75.3、两台机床同时生产一种零件,在10天中,两台机床每天的次品数如下:甲1,0,2,0,2,3,0,4,1,2 乙1,3,2,1,0,2,1,1,0,1(1)哪台机床次品数的平均数较小?(2)哪台机床的生产状况比较稳定?解(1)x甲=(1+0+2+0+2+3+0+4+1+2)×110=1.5,x乙=(1+3+2+1+0+2+1+1+0+1)×110=1.2. ∵x甲>x乙,∴乙车床次品数的平均数较小.(2)s2甲=110[(1-1.5)2+(0-1.5)2+(2-1.5)2+(0-1.5)2+(2-1.5)2+(3-1.5)2+(0-1.5)2+(4-1.5)2+(1-1.5)2+(2-1.5)2]=1.65,同理s2乙=0.76,∵s2甲>s2乙,∴乙车床的生产状况比较稳定.4、某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430(1)完成数据的茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.解(1)(2)由于每个品种的数据都只有25个,样本不大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据.(3)通过观察茎叶图可以看出:①品种A的亩产平均数(或均值)比品种B高;②品种A的亩产标准差(或方差)比品种B大,故品种A的亩产量稳定性较差.5、某个体服装店经营各种服装,在某周内获纯利润y(元)与该周每天销售这种服装件数x之间的一组数据关系如下表:x 3456789y 66 69 73 81 89 90 91已知:∑i =17x 2i =280,∑i =17x i y i =3487.(1)求x ,y ; (2)画出散点图;(3)观察散点图,若y 与x 线性相关,请求纯利润y 与每天销售件数x 之间的回归直线方程. 解 (1)x =3+4+5+6+7+8+97=6, y =66+69+73+81+89+90+917=5597≈79.86. (2)散点图如图所示.(3)观察散点图知,y 与x 线性相关.设回归直线方程为y ^=b ^x +a ^. ∵∑i =17x 2i =280,∑i =17x i y i =3487,x =6,y =5597, ∴b ^=3487-7×6×5597280-7×36=13328=4.75. a ^=5597-6×4.75≈51.36.∴回归直线方程为y ^=4.75x +51.36.6、某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量,分别记录如下:甲:52,51,49,48,53,48,49; 乙:60,65,40,35,25,65,60.(1)这种抽样方法是哪一种抽样方法?(2)画出茎叶图,并说明哪个车间的产品比较稳定. 解 (1)该抽样方法为系统抽样法. (2)茎叶图如图所示.由图可以看出甲车间包装的产品重量较集中,而乙车间包装的产品重量较分散,所以甲车间包装的产品重量较稳定.7、有一个容量为100的某校毕业生起始月薪的样本数据的分组及各组的频数如下:月薪[13,14)[14,15)[15,16)[16,17)[17,18)[18,19)[19,20)[20,21] (百元)频数71126231584 6(2)画出频率分布直方图和频率分布折线图;(3)根据频率分布估计该校毕业生起始月薪低于2000元的频率.解(1)样本频率分布表为.起始月薪(百元) 频数频率[13,14)70.07[14,15)110.11[15,16)260.26[16,17)230.23[17,18)150.15[18,19)80.08[19,20)40.04[20,21]60.06合计100 1(2)频率分布直方图和频率分布折线图如图.(3)起始月薪低于2000元的频率为0.07+0.11+0.26+0.23+0.15+0.08+0.04=0.94.即起始月薪低于2000元的频率估计为0.94.8.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:学生 1号 2号 3号 4号 5号 甲班 6 7 7 8 7 乙班67679解析 由题中表格数据,得甲班:x -甲=7,s 2甲=15×(12+02+02+12+02)=25; 乙班:x -乙=7,s 2乙=15×(12+02+12+02+22)=65. ∵s 2甲<s 2乙,∴两组数据中方差较小的为s 2甲=25. 9.高一(2)班有男生27名,女生21名,在一次物理测试中,男生的平均分82分,中位数是75分,女生的平均分是80分,中位数是80分. (1)求这次测试全班平均分(精确到0.01);(2)估计全班成绩在80分以下(含80分)的学生至少有多少? (3)分析男生的平均分与中位数相差较大的主要原因是什么? 分析 根据各种数的定义及意义解决问题.解 (1)由平均数公式得x -=148×(82×27+80×21)≈81.13(分).(2)∵男生的中位数是75,∴至少有14人得分不超过75分.又∵女生的中位数是80,∴至少有11人得分不超过80分.∴全班至少有25人得分低于80分.(3)男生的平均分与中位数的差别较大,说明男生中两极分化现象严重,得分高的和低的相差较大. 10.甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是:甲:8,6,7,8,6,5,9,10,4,7; 乙:6,7,7,8,6,7,8,7,9,5. (1)分别计算以上两组数据的平均数; (2)分别求出两组数据的方差; (3)根据计算结果,估计一下两名战士的射击情况. 解 (1)x甲=110×(8+6+7+8+6+5+9+10+4+7)=7(环),x乙=110×(6+7+7+8+6+7+8+7+9+5)=7(环).(2)解法1:由方差公式s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],得s 2甲=3.0(环2),s 2乙=1.2(环2). 解法2:由方差公式s 2=1n [(x ′21+x ′22+…+x ′2n )-n x ′2]计算s 2甲,s 2乙,由于两组数据都在7左右,所以选取a =7.∴s 2甲=110[(x ′21甲+x ′22甲+…+x ′210甲)-10x ′2甲]=110×(1+1+0+1+1+4+4+9+9+0-10×0) =110×30=3.0(环2).同理s 2乙=1.2(环2). (3)x甲=x 乙,说明甲、乙两战士的平均水平相当.又s 2甲>s 2乙,说明甲战士射击情况波动大.因此乙战士比甲战士射击情况稳定.11、假设关于某种设备的使用年限x (年)与所支出的修理费用y (万元),有如下的统计资料:由资料可知y 与x 具有线性相关关系.(1)求回归方程y =b x +a ; (2)估计使用年限为10年时维修费用是多少. 解 (1)先把数据列表如下.由表知,x =4,y =5,由公式可得b ^=112.3-5×4×590-5×42=12.310=1.23,a ^=y -b ^x =5-1.23×4=0.08, ∴回归方程为y ^=1.23x +0.08.(2)由回归方程y ^=1.23x +0.08知,当x =10时,y ^=1.23×10+0.08=12.38(万元). 故估计使用年限为10年时维修费用是12.38万元.12、下表提供了某厂节能降耗技术,改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.(1)(2)请据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?(参考值:3×2.5+4×3+5×4+6×4.5=66.5)解 (1)由题设所给数据,可得散点图如图所示. (2)由对照数据计算,得∑i =14x 2i =86,x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5. ∑i =14x i y i =66.5.∴由最小二乘法确定的回归方程的系数b ^=∑i =14x i y i -4x y∑i =14x 2i -4x 2=66.5-4×4.5×3.586-4×4.52=0.7,a ^=y -b ^x =3.5-0.7×4.5=0.35,由此所求的线性回归方程为y ^=0.7x +0.35. (3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗得降低的生产能耗约为: 90-(0.7×100+0.35)=19.65(吨标准煤).。
高二 茎叶图、直方图统计图的应用(胡达文)(1)
茎叶图、直方图统计图的应用知识梳理教学重、难点作业完成情况典题探究例1 某教师为了了解一次“普法”知识竞赛成绩情况,从800名学生中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表解答下列问题:(1)将频率分布表补全,并作出对应的频率分布直方图; (2)估计成绩在70.5~90.5分的学生的比例; (3)若成绩在85.5~95.5分的学生为二等奖,问参赛学生中获得二等奖的学生约为多少人?分组频数频率 60.5~70.5 0.16 70.5~80.5 10 80.5~90.5 18 0.3690.5~100.5 合计 50例2如图2是总体的一样本频率分布直方图,若[15,18)对应的频数为8,且[12,15)对应的小矩形面积为0.06.(1)求样本容量;(2)求样本在[12,15)内的频数;(3)求样本数据在[18,33)内的频率,并估计总体数据在[18,33)内的频率.例3某赛季甲、乙两名篮球运动员每场比赛的得分记录如下(甲运动员因伤缺席两场):甲运动员得分:13,51,23,8,26,38,16,33,14,28,39; 乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39. 用茎叶图表示两人的成绩,并由图指出哪位运动员的发挥更稳定?例4 为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8点到10点间各自的点击量如图.(1)甲、乙两个网站点击量的极差分别是多少?(2)甲网站点击量[]10,40间的频率是多少?(精确到0.00001) (3)甲、乙两个网站哪个更受欢迎?并说明理由?8 5 4 0 8 1 8 5 7 6 4 3 2 0 5 6 2 4 9 1 6 7 2 2 5 4 1 1 甲 0 1 2 3 4 5 6 7 乙演练方阵A 档(巩固专练)1.用样本频率分布估计总体分布的过程中,下列说法正确的是 ( ). A .总体容量越大,估计越精确 B .总体容量越小,估计越精确C .样本容量越大,估计越精确D .样本容量越小,估计越精确 2.下面对于茎叶图的说法正确的是( ).A .茎叶图不能保留原始数据B .茎叶图不能反映数据的分布情况C .当样本数据比较多时,用茎叶图很方便D .茎叶图可以随时添加数据3.一个容量为20的样本,组距与频数如下:( 10 , 20 ] , 2 ; ( 20 , 30 ] , 3 ; ( 30 , 40 ] , 4 ; ( 40 , 50 ] , 5 ; ( 50 , 60 ] , 4 ; ( 60 , 70 ] , 2 ; 则样本在( 10 , 50 ]上的频率为 ( ). A.120B. 14C. 12D. 7104.下面茎叶图中数据的平均值为14.3,则x y +的值为( ). A .25 B .6 C .33 D .55.图3为一组数据的茎叶图,共14个数据,但有一个数据已模糊不清了,已知这14个数据的中位数为65,则模糊不清的数字为______.6.从一堆苹果中任取了20个,并得到它们的质量(单位:g )数据分布表如表:分组 [)90100, [)100110, [)110120, [)120130, [)130140, [)140150, 频数123101则这堆苹果中,质量小于120克的苹果数约占苹果总数的 %.7.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17岁~18岁的男生体重(kg) ,得到频率分布直方图如图1. 那么,这100名学生中体重在[56.5,64.5]学茎 叶 2x 8 1 35 7 3y 9 0 1 2 茎 叶 0 1 5 7 9 0 __ 7 9 1 3 5 8 0 5 6 7 8生有______人.图18.抽查某班的15名学生在40 min 的课堂上的平均听课时间(单位:min )得到的数据的茎叶图如图5所示,现又抽查了另外5位同学的平均听课时间,其数据为32,15,21,33,30,请将这5个数据追加在茎叶图中.9.为了解某地初三年级男生的身高情况,从其中的一个学校选取容量为60的样本(60名男生的身高),分组情况如表2 ,求出表中a ,m 的值.表210. 12个人戒烟前和戒烟五个星期后的体重如下(单位:kg ) 人员 abcdefghijkl戒烟前 67 80 69 52 52 60 55 54 64 60 48 49 戒烟后708168555762545267585251画出茎叶图并回答下列问题:(1)这12个人戒烟前的体重的中位数和这12个人戒烟五个星期后的体重的众数各是多少?分组 147.5~155.5 155.5~163.5 163.5~171.5 171.5~179.5频数 62lm频率a0.1茎 叶 3 3 4 6 6 7 9 0 1 2 2 3 4 55 123(2)分别计算这12个人戒烟前和戒烟五个星期后的平均体重.B 档(提升精练)1.下面是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图1可知 ( ).A .甲运动员的成绩好于乙运动员B .乙运动员的成绩好于甲运动员C .甲、乙两名运动员的成绩没有明显的差异D .甲运动员的最低得分为0分2.已知样本:10,8,6,10,8,13,11,10,12,7,8,9,12,9,11,10,9,10,11,12,那么频率为0.2的范围是( ).A. 5.5~7.5B. 7.5~9.5C. 9.5~11.5D.11.5~13.53.将一个容量为m 的样本分成3组,已知第一组的频数为10,第二、三组的频率分别为0.35和0.45,则m = .4.从某校的高一学生中采用系统抽样法选出30人测量其身高,数据的茎叶图如图4(单位:cm ):若高一年级共有600人,据上图估算身高在1.70 m 以上的大约有_____人.5. 为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5~18岁男生体重(单位:kg ),得到如图3所示的频率分布直方图:甲 0 1 2 3 4 5 乙 8 247 199 36 25032 875421 944 1 茎 叶 2 5 2 3 3 6 8 3 3 4 5 5 7 7 8 1 2 2 3 3 4 4 4 5 57 88 0 114 15 16 17 18图3根据图3可得这100名学生中体重在[56.5,64.5)内的学生人数是______ _人.6.200辆汽车通过某一段公路的时速的频率分布直方图如图2,则时速在[50,60]的汽车大约有 辆.` 图2 图37.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果可用图3的条形图表示. 根据此图可得这50名学生这一天平均每人的课外阅读时间为____ h.8.如图是某班50名学生身高的频率分布直方图(精确到1cm),从左边起第一、二、三、四个小长方形的高的比为1:3:5:1,那么身高150cm 以下(不含150cm)的学生有多少人?身高为160cm 及160cm 以上的学生占全班学生总数的百分比约为多少?0.5 人数/个 时间/h20 10 50 1.0 1.5 2.0159. 目前,中国的青少年视力水平下降已引起全社会的关注,为了调查了解某中学高三年级1 500名学生的视力情况,从中抽测了一部分学生的视力, 整理数据后,分析数据如下:(1)在这个问题中,总体是 ; (2)填写频率分布表中未完成的部分;(3)若视力为4.9,5.0,5.1均属正常,不需矫正, 试估计该校毕业年级学生视力正常的人数约为多少?10.在同等条件下,对30辆同一型号的汽车进行耗油1L 所行路程的试验,得到如下数据(单位:km ),以前两位数为茎,画出上面数据的茎叶图.(提示:茎叶图中只单侧有数据) 14.1 12.3 13.7 14.0 12.8 12.9 13.1 13.6 14.4 13.8 12.6 13.8 12.6 13.2 13.3 14.2 13.9 12.7 13.0 13.2 13.5 13.6 13.4 13.6 12.1 12.5 13.1 13.5 13.2 13.4C 档(跨越导练)1. 为了了解某校高三学生视力情况,随机抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,但知道前4组的频数,每一个与前一个的比为 常数,后5组的频率,每一个与前一个的差为 常数,设最大的频率为a ,视力在4.6到5.0之间的学生数为b ,则a,b 的值分别为( ).A.0.27,78B. 0.27,83C. 27,78D. 2.7,832.在样本频率分布直方图中,共有11个小矩形,若中间一个的面积等于其余面积和的14,且样本容量为160,则中间一组的频数为 .3.为了了解高中学生的体能情况,抽了100名学生进行引体向上次数测试,将所得数据整理后,画出频率分布直方图如下图所示,图中从左到右依次为第1,2,3,4,5组.分 组 频 数 频 率 3.95~4.252 0.04 6 0.12 4.55~4.85 23 4.85~5.15 5.15~5.451 0.02 合计1.00频率分步表4.3 4.4 4.5 4.6 4.7 4.8 4.9 视力频率组距 5.0 5.1 5.2 0.30.1(1)第1组的频率为_____,频数为______.(2)若次数在5次(含5次)以上为达标,则达标率约为____.4.有一个容量为60的样本,(60名学生的数学考试成绩),分组情况如表3,将表格补全. 表3分组 0.5~ 20.5 20.5~ 40.5 40.5~ 60.5 60.5~ 80.5 80.5~ 100.5 频数 3 6 12频率0.35.图1为甲、乙两名同学某次考试中各科成绩(共9科,每科满分皆为100分)的茎叶图:由图回答:(1)甲、乙同学的各科成绩的中位数分别为____、____; (2)若60分以下为不及格,大于等于80分为优秀,则乙同学共有_____门课程不及格,_____门课程优秀;(3)甲、乙两个同学相比较,_______偏科现象更明显,________成绩相对好一些.6.如图4,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:(1)79.589.5 这一组的频数与频率分别是多少?(2)估计这次环保知识竞赛的及格率(60分及以上为及格)7.有一个容量为50 的样本,其数据的茎叶图如图2:甲 乙 4 5 6 7 8 9 105 9 5 9 86 07 42 3 8 5 3 8 9 3 81 3 4 5 6 6 6 7 8 8 8 8 9 9 92 0 0 0 01 1 2 2 2 2 23 3 34 4 45 5 56 6 6 67 7 78 8 8 93 0 1 1 2 3图2(1)列出样本的频率分布表;(2)画出频率分布直方图和频率分布折线图.8. 从两个班中各随机的抽取10名学生,他们的数学成绩如下:甲班: 76 74 82 96 66 76 78 72 52 68乙班: 86 84 62 76 78 92 82 74 88 85画出茎叶图并分析两个班学生的数学学习情况.9.为了了解一大片经济林生长情况,随机测量其中100株的底部周长,得到如下数据:(单位:cm)135 98 102 110 99125 97 117 113 110109 124 87 131 97105 123 111 103 105129 126 97 100 115111 89 110 121 80129 99 90 99 12199 101 116 97 102102 108 117 99 118123 119 98 121 101121 110 96 100 10392 102 109 104 112102 123 104 104 12892 114 108 104 102111 106 117 104 109120 121 104 108 118123 107 111 91 100108 101 95 107 101106 119 97 126 108113 102 103 104 108(1)编制频率分布表;(2)绘制频率分布直方图;(3)估计该片经济林中底部周长小于100 cm的树木约占多少?周长不小于120cm的树木约占多少?10.从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:由以上数据设计了茎叶图如图6:甲 乙 3 1 27 7 5 5 0 28 4 5 4 2 29 2 5 8 7 3 3 1 30 4 6 79 4 0 31 2 3 5 5 6 8 8 8 5 5 3 32 0 2 2 4 7 9 7 4 133 1 3 6 7 34 3 2356根据以上茎叶图,对甲、乙两个品种棉花的纤维长度作比较。
抽样、直方图茎叶图、数字特征
抽样、直方图、茎叶图与数字特征板块一随机抽样知识点:1.随机抽样:满足每个个体被抽到的机会是均等的抽样,共有三种经常采用的随机抽样方法:⑴简单随机抽样:从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.抽出办法:①抽签法:用纸片或小球分别标号后抽签的方法;②随机数表法:随机数表是使用计算器或计算机的应用程序生成随机数的功能生成的一张数表.表中每一位置出现各个数字的可能性相同.随机数表法是对样本进行编号后,按照一定的规律从随机数表中读数,并取出相应的样本的方法.简单随机抽样是最简单、最基本的抽样方法.2.简单随机抽样必须具备下列特点:⑴简单随机抽样要求被抽取的样本的总体个数N是有限的.⑵简单随机样本数n小于等于样本总体的个数N.⑶简单随机样本是从总体中逐个抽取的.⑷简单随机抽样是一种不放回的抽样.⑸简单随机抽样的每个个体入样的可能性均为nN.2.系统抽样:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法.抽出办法:从元素个数为N的总体中抽取容量为n的样本,如果总体容量能被样本容量整除,设Nkn=,先对总体进行编号,号码从1到N,再从数字1到k中随机抽取一个数s作为起始数,然后顺次抽取第2(1)s k s k s n k+++-,,,个数,这样就得到容量为n的样本.如果总体容量不能被样本容量整除,可随机地从总体中剔除余数,然后再按系统抽样方法进行抽样.系统抽样适用于大规模的抽样调查,由于抽样间隔相等,又被称为等距抽样.3.分层抽样:当总体有明显差别的几部分组成时,要反映总体情况,常采用分层抽样,使总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样,这种抽样方法叫做分层抽样.分层抽样的样本具有较强的代表性,而且各层抽样时,可灵活选用不同的抽样方法,应用广泛.一.系统抽样1.已知某商场新进3000袋奶粉,为检查其三聚氰胺是否超标,现采用系统抽样的方法从中抽取150袋检查,若第一组抽出的号码是11,则第六十一组抽出的号码为 . 备注:注意使用等差数列的方法。
高中数学合格考资料 专题08 统计
专题08统计考点一:随机抽样1.(2023春·湖南)某中学有男生600人,女生400人.为了调查学生身高情况,按性别进行分层,用分层随机抽样的方法抽取一个容量为10的样本,样本按比例分配,得到男生、女生的平均身高分别为170cm和160cm.用样本估计总体,则该校学生的平均身高是()A.162cm B.164cm C.166cm D.168cm【答案】C【分析】由分层抽样与平均数的概念求解,【详解】由题意得在抽取的10人中,男生6人,女生4人,故样本平均数为1706160416610⨯+⨯=,估计该校学生的平均身高是166cm故选:C2.(2023·云南)高一年级有男生210人,女生190人,用分层随机抽样的方法按性别比例从全年级学生中抽取样本,若抽取的样本中男生有21人,则该样本的样本容量为()A.30B.40C.50D.60【答案】B【分析】根据给定条件,利用分层抽样的意义列式计算作答.【详解】依题意,该样本的样本容量为21(210190)40 210⨯+=.故选:B3.(2023春·新疆)某兴趣班有男生35人,女生25人,按性别进行分层,用分层随机抽样的方法从该班学生中抽出一个容量为12的样本.如果样本按比例分配,那么女生应抽取()A.3人B.4人C.5人D.6人【答案】C【分析】按照分层比例抽取,即可求解.【详解】女生应抽取251252535⨯=+人.故选:C4.(2022春·贵州)某班有男生25人,女生15人,现用分层抽样的方法从该班抽取8人参加志愿者活动,则应抽取的女生人数为()A.2B.3C.4D.6【答案】B【分析】根据分层抽样的概念及计算方法,即可求解.【详解】由题意,某班有男生25人,女生15人,用分层抽样的方法从该班抽取8人参加志愿者活动,所以应抽取的女生人数为81532515⨯=+人.故选:B.5.(2021秋·贵州)某校有高一年级学生1000名,高二年级学生1200名,高三年级学生1100名,现用分层抽样的方法从该校所有高中生中抽取330名学生,则抽取的高三年级学生人数为()A.50B.70C.90D.110【答案】D【分析】利用分层抽样的定义直接求解即可【详解】由题意得抽取的高三年级学生人数为1100330110100012001100⨯=++,故选:D6.(2021春·贵州)某班有45名学生,其中男生25人,女生20人.现用分层抽样的方法,从该班学生中抽取9人参加禁毒知识测试,则应抽取的男生人数为()A.3B.4C.5D.6【答案】C【分析】利用分层抽样的性质进行求解即可.【详解】因为用分层抽样的方法,所以应抽取的男生人数为259545⨯=,故选:C7.(2023·广东)已知某校高一高二高三的人数分别为400、450、500,选派该校学生参加志愿者活动,采用分层抽样的方法选取27人,则高二抽取的人数为.【答案】9【分析】由分层抽样的定义按比例计算.【详解】由题意高二抽取的人数为450279 400450500⨯=++.故答案为:9.8.(2022春·天津)一支田径队有男运动员56人,女运动员42人,按性别进行分层,用分层随机抽样的方法从该田径队全体运动员中抽出一个容量为14的样本.如果样本按比例分配,那么应抽取的男运动员人数为.【答案】8【分析】利用分层抽样的定义求解.【详解】由题意可知抽取男运动员的人数为561485642⨯=+,故答案为:8.9.(2022·湖南)一支游泳队有男运动员20人,女运动员12人,按性别分层,用分层随机抽样从全体运动员抽取一个容量为8的样本,那么抽取的女运动员人数为.【答案】3【分析】根据抽样比例,即可求解.【详解】抽取的女运动员人数为128=332⨯故答案为:310.(2021秋·吉林)某校高二年级有男生510名,女生490名,若用分层随机抽样的方法从高二年级学生中抽取一个容量为200的样本,则女生应抽取名.【答案】98【分析】根据分层抽样的定义,计算男女生比例,即可计算求解.【详解】由已知得,男生与女生的比例为:51:49,根据分层抽样的定义,女生应该抽取的人数为:4920098100⨯=(人)故答案为:98考点二:总体百分位估计值1.(2023春·新疆)数据12,13,14,15,17,18,19,20,24,26的第80百分位数为()A .20B .22C .24D .25【答案】B【分析】由第80百分位数的求法求解即可.【详解】因为按从小到大排列的数据12,13,14,15,17,18,19,20,24,26共有10个数据,而1080%8⨯=,所以这组数据的第80百分位数为第8个与第9个数据的平均数,即为2024222+=.故选:B2.(2022春·浙江)某校高二年级开展数学测试,现从中抽取100名学生进行成绩统计.将所得成绩分成5组:第1组[)75,80,第2组[)80,85,第3组[)85,90,第4组[)90,95,第5组[]95,100,并绘制成如图所示的频率分布直方图.则第80百分位数约为()A .0.04B .92.5C .85D .90【答案】B【分析】先利用各矩形的面积之和为1,求得m ,再利用第80百分位数的定义求解.【详解】解:因为()0.010.070.060.0251m ++++⨯=,所以0.04m =,设第80百分位数为x ,则()()0.010.070.065900.040.8++⨯+-⨯=x ,解得92.5=x ,故选:B3.(2021秋·吉林)有一组数据,将其从小到大排序如下:157,159,160,161,163,165,168,170,171,173.则这组数据的第75百分位数是()A .165B .168C .170D .171【答案】C【分析】根据百分位数的定义求解即可.【详解】因为1075%7.5⨯=,所以这组数据的第75百分位数是第8个数170,故选:C.4.(2021秋·广西)2022年7月21日至30日某地区的最高温度(单位:℃)分别为:33,33,32,36,34,35,35,37,34,38,则这组数据的65%分位数是.【答案】35【分析】根据百分位数的计算公式计算即可.【详解】将33,33,32,36,34,35,35,37,34,38,按照从小到大的顺序排列,得32,33,33,34,34,35,35,36,37,38共10个数,由65%10 6.5⨯=,得这组数据的65%分位数是第7个数,所以这组数据的65%分位数是35.故答案为:35.考点三:计算平均数、众数,中位数1.(2023·河北)某快递驿站随机记录了7天代收快递的件数,如下表:天/第1234567件数285367463290335719698已知该驿站每代收1件快递收取0.8元服务费,据此样本数据,估计该驿站每月(按30天计算)收取的服务费是(单位:元)()A .8808B .9696C .10824D .11856【答案】C【详解】样本数据7天代收快递的件数的平均数为:()12853674632903357196984517x =⨯++++++=(件),∴每月(按30天计算)代收快递约为4513013530⨯=件,∴该驿站每月(按30天计算)收取的服务费约为135300.810824⨯=元.故选:C.2.(2023·山西)中国运动员谷爱凌在2022北京冬奥会自由式滑雪女子大跳台决赛中以188.25分夺得金牌.自由式滑雪大跳台比赛一般有资格赛和决赛两个阶段,比赛规定:资格赛前12名进入决赛.在某次自由式滑雪大跳台比赛中,24位参加资格赛选手的成绩各不相同.如果选手甲知道了自己的成绩后,则他可根据其他23位同学成绩的哪个数据判断自己能否进入决赛()A .中位数B .极差C .平均数D .方差【答案】A【分析】根据题意,结合中位数的定义,即可判断和选择.【详解】其他23位参赛同学,按成绩从高到低排列,这23个数的中位数恰好是第12位选手的成绩.若选手甲的成绩大于该选手的成绩,则进入决赛,否则不能进入决赛,因此可根据中位数判断选手甲是否能进入决赛.故选:A .3.(2021·吉林)已知一组数据如图所示,则这组数据的中位数是()A .27.5B .28.5C .27D .28【答案】A【解析】将茎叶图中的数据按照从小到大的顺序排列,根据中位数的定义计算可得.【详解】将茎叶图中的数据按照从小到大的顺序排列为:16,17,19,22,25,27,28,30,30,32,36,40,所以这组数据的中位数是272827.52+=.故选:A.4.(2021秋·贵州)如图所示茎叶图表示的数据中,中位数是()A .65B .77C .81D .89【答案】B【分析】根据中位数的概念即可得出结果.【详解】根据茎叶图,该组数据从小到大:65,66,73,75,77,78,81,84,89,所以中位数为:77.故选:B5.(2021秋·广东)如图是表示某班6名学生期末数学考试成绩的茎叶图,则这6名学生的平均成绩为()A .87B .86C .85.5D .85【答案】A【分析】利用平均数公式求得平均成绩.【详解】解:这6名学生的平均成绩为()1768585869397876x =+++++=,故选:A.6.(2021春·贵州)如图所示茎叶图表示的数据中,众数是()A .78B .79C .82D .84【答案】D【分析】根据茎叶图,看出现次数最多的数据是哪个,即可得答案.【详解】根据茎叶图可知,只有84出现的次数最多为2次,其余数均出现1次,故众数为84,故选:D7.(多选)(2023春·浙江)给定数6,4,3,6,3,8,8,3,1,8,则这组数据的()A .中位数为5B .方差为85C .平均数为5D .85%分位数为8【答案】ACD【分析】将数据从小到大排列,再求出平均数、中位数、方差及第85%分位数.【详解】将数6,4,3,6,3,8,8,3,1,8按小到大的顺序排列为:1,3,3,3,4,6,6,8,8,8则这组数据的中位数为4652+=,故A 正确;平均数为:13383462510+⨯+⨯++⨯=,故C 正确;则方差为()()()()()2222211545353853652 5.810⎡⎤-+-+-⨯+-⨯+-⨯=⎣⎦,故B 错误;因为1085%8.5⨯=,所以第85%分位数是从小到大第9个数字为8,故D 正确,故选:ACD8.(2021春·福建)数据1,2,2,2,3的中位数是.【答案】2【分析】根据中位数的概念判断即可;【详解】解:数据从小到大排列为1、2、2、2、3,故中位数为2;故答案为:2考点四:平均数、众数,中位数的估计值(小题)1.(2023·河北)河北雄安新区围绕职业培训、岗位开发、岗位对接等一系列工作,制定出台了《河北雄安新区当地劳动力教育培训实施方案(2019—2025年)》等30余项政策文件,截至2022年底,累计开展各项职业培训16.8万人次.雄安新区公共服务局为了解培训效果,对2022年参加职业技能培训的学员进行了考核测试,并从中随机抽取60名学员的成绩(满分100分),进行适当分组后(每组为左开右闭的区间),作出如图所示的频率分布直方图.这批学员技能考核测试成绩的众数的估计值是()A .65B .75C .85D .95【答案】C【详解】根据频率分布直方图中频率值最大的组为(]80,90,则众数为8090852+=故选:C.2.(2023·河北)河北雄安新区围绕职业培训、岗位开发、岗位对接等一系列工作,制定出台了《河北雄安新区当地劳动力教育培训实施方案(2019—2025年)》等30余项政策文件,截至2022年底,累计开展各项职业培训16.8万人次.雄安新区公共服务局为了解培训效果,对2022年参加职业技能培训的学员进行了考核测试,并从中随机抽取60名学员的成绩(满分100分),进行适当分组后(每组为左开右闭的区间),作出如图所示的频率分布直方图.这批学员技能考核测试成绩的中位数的估计值是()A .80.75B .81.25C .82.50D .82.75【答案】B【详解】根据频率分布直方图可知前四组的频率分别为0.005100.05,0.015100.15,0.025100.25,0.040100.40⨯=⨯=⨯=⨯=,前三组频率之和为0.050.150.250.450.5++=<,所以中位数在(]80,90组,设中位数为x ,则()0.450.040800.5x +⨯-=,解得81.25x =.故这批学员技能考核测试成绩的中位数的估计值是81.25.故选:B.3.(2023·河北)河北雄安新区围绕职业培训、岗位开发、岗位对接等一系列工作,制定出台了《河北雄安新区当地劳动力教育培训实施方案(2019—2025年)》等30余项政策文件,截至2022年底,累计开展各项职业培训16.8万人次.雄安新区公共服务局为了解培训效果,对2022年参加职业技能培训的学员进行了考核测试,并从中随机抽取60名学员的成绩(满分100分),进行适当分组后(每组为左开右闭的区间),作出如图所示的频率分布直方图.若同一组数据用该区间的中点值作代表,则这批学员技能考核测试成绩的平均数的估计值是()A .79.0B .79.5C .81.0D .82.5【答案】B【详解】根据题意可得,平均数的估计值为:()550.005650.015750.025850.04950.0151079.5⨯+⨯+⨯+⨯+⨯⨯=故选:B4.(2022春·贵州)某校高一年级一次数学考试成绩(单位:分)的频率分布直方图如图所示,估计该次考试成绩的众数为()A .65B .75C .85D .95【答案】C【分析】根据众数的定义求解即可【详解】由频率分布直方图可知考试成绩在80到90的最多,所以该次考试成绩的众数为85,故选:C5.(2021春·河北)为了更好地锻炼身体,某人记录了自己4月份(共30天)每天行走的步数,将每天行走的步数(单位:千步)进行如下分组:[)0,5,[)5,10,[)10,15,[)15,20,[)20,25,[]25,30,并作出如图所示的频率分布直方图.(1)由频率分布直方图估计此人每天行走步数(单位:千步)的众数是()A.10B.12.5C.15D.17.5(2)若按此锻炼习惯,估计此人未来30天中行走不少于2万步的天数是()A.3B.5C.6D.10(3)若同一组数据以这组区间的中点值作代表,估计此人该月平均每天行走的步数(单位:千步)是()A.13.5B.14.5C.15.5D.16.5【答案】(1)B(2)C(3)B【分析】(1)众数出现在频率最大的分组内,众数就是频率最高的分组中间值;(2)未来30天中行走不少于2万步的天数等于不少于2万步的频率×30;(3)该月平均每天行走的步数等于每组数值的中间值乘频率再相加.【详解】(1)每天行走的步数在区间[0,5)内的频率为0.01×5=0.05,在区间[5,10)内的频率为0.04×5=0.2,在区间[10,15)内的频率为0.06×5=0.3,在区间[15,20)内的频率为0.05×5=0.25,在区间[20,25)内的频率为0.03×5=0.15,在区间[25,30]内的频率为0.01×5=0.05.因为每天行走的步数在区间[10,15)内的频率最大,所以每天行走步数的众数在区间[10,15)内,所以每天行走步数的众数是12.5.故选:B.(2)由(1)知,因为每天行走不少于2万步的频率为0.15+0.05=0.2,所以估计此人未来30天中行走不少于2万步的天数是30×0.2=6.故选:C.(3)由(1)知,估计此人该月平均每天行走的步数为2.5×0.05+7.5×0.2+12.5×0.3+17.5×0.25+22.5×0.15+27.5×0.05=14.5.故选:B.6.(2023春·湖南)为了解中学生的体育锻炼情况,现从某学校随机抽取了部分学生,对他们每天的体育锻炼时间进行统计分析,得到如图所示的频率分布直方图,估计该校学生每天的体育锻炼时间的众数是分钟.【答案】45【分析】由频率分布直方图数据求解,【详解】由图可知人数最多的组别在4050-组,故众数的估计值为45,故答案为:45考点五:频率分布直方图1.(2022春·天津)从某校抽取100名学生进行一周课外阅读时间调查,发现他们的一周课外阅读时间都在0~18小时之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示.则在被调查的学生中,课外阅读时间落在区间[)10,12内的人数为()A .6B .8C .12D .25【答案】C 【分析】根据频率分布直方图,利用频率、频数与样本容量的关系进行解答即可.【详解】由题知,课外阅读时间落在区间[)10,12内的频率为0.06020.12⨯=,则课外阅读时间落在区间[)10,12内的人数为1000.1212⨯=.故选:C2.(2021春·天津)某学校的环保志愿者小组为了研究本校学生家庭用电情况,在全校学生家庭中抽取了100户进行调查,发现他们的用电量都在50~400kW h ⋅之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示.则在被调查的用户中,用电量落在区间[)250,300内的户数为()A .28B .16C .14D .7【答案】C 【分析】由频率分布直方图求出频率,即可计算出频数.【详解】由频率分布直方图可知用电量落在[)250,300的频率为0.0028500.14⨯=,所以用电量落在[)250,300内的户数为1000.1414⨯=.故选:C3.(2021秋·青海)现对某类文物进行某种物性指标检测,从1000件中随机抽取了200件,测得了它的物性指标值,得到如下频率分布直方图,据此估计这1000件文物中物性指标值不小于95的件数为()A .34B .67C .340D .670【答案】D 【分析】由频率分布直方图得文物中物性指标值不小于95的频率即可.【详解】由频率分布直方图得文物中物性指标值不小于95的频率为:()0.0330.0240.0080.002100.67+++⨯=,所以这1000件文物中物性指标值不小于95的件数为10000.67670⨯=.故选:D4.(2021春·贵州)某校初二年级学生一次数学考试成绩(单位:分)的频率分布直方图如图所示,则该图中a 的值为()A .110B .150C .1100D .1200【答案】D【分析】根据所有小矩形的面积之和为1,列出方程,从而可得出答案.【详解】解:根据频率分布直方图可得:()1047621a a a a a ++++=,解得1200a =.故选:D.5.(2023·云南)从某校随机抽取100名学生进行参加社区服务的次数调查,发现他们的次数都在10~30次之间,进行适当的分组后,绘制如图所示的频率分布直方图,则直方图中a 的值为.【答案】0.1/110【分析】根据频率分布直方图中各小矩形面积和为1,列式计算作答.【详解】由频率分布直方图知,(0.050.030.02)51a +++⨯=,解得0.1a =,所以直方图中a 的值为0.1.故答案为:0.16.(2021·吉林)在学校组织的一次知识竞赛中,某班学生考试成绩的频率分布直方图如图所示,若低于60分的有12人,则该班学生人数是【答案】40【解析】先利用频率分布直方图得到低于60分的学生的频率,再利用120.3即可得出答案.【详解】由频率分布直方图可得低于60分的学生的频率为:()0.0050.01200.3+⨯=,则该班学生人数是12400.3=.故答案为:40.7.(2022·山西)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用比例分配的分层随机抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[)20,30,[)30,40,⋅⋅⋅,[]80,90,并整理得到如下频率分布直方图:(1)根据频率分布直方图估计分数的样本数据的70%分位数;(2)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中女生的人数.【答案】(1)77.5;(2)160(人).【分析】(1)根据分位数的概念,结合题给频率分布直方图计算得出结果即可;(2)根据频率分布直方图计算出样本中分数不小于70的人数,进而计算出样本中男生及女生的人数,最后求出总体中女生的人数.【详解】(1)由频率分布直方图可知,样本中分数不小于70的频率为()0.020.04100.6+⨯=,从而有:样本中分数小于70的频率为10.60.4-=,又由频率分布直方图可得:样本中分数小于80的频率为0.8,所以样本数据的70%分位数必定位于[)70,80之间.计算为:0.70.4701077.50.80.4-+⨯=-所以其分数的样本数据的70%分位数估计值为77.5.(2)由题知,样本中分数不小于70的学生人数为()0.020.041010060+⨯⨯=,从而有,样本中分数不小于70的男生人数为160302⨯=,进而得,样本中的男生人数为30260⨯=,女生人数为1006040-=,所以总体中女生人数为40400160100⨯=(人).8.(2022春·浙江)在某市的一次数学测试中,为了解学生的测试情况,从中随机抽取100名学生的测试成绩,被抽取成绩全部介于40分到100分之间(满分100分),将统计结果按如下方式分成六组:第一组[)40,50,第二组[)50,60,L ,第六组[]90,100,画出频率分布直方图如图所示.(1)求第三组[)60,70的频率;(2)估计该市学生这次测试成绩的平均值(同一组中的数据用该组区间的中点值为代表)和第25百分位数.【答案】(1)0.2(2)平均值为73.8,第25百分位数为64.5【分析】(1)利用频率分布直方图求解;(2)利用平均数和第25百分位数的定义求解.【详解】(1)由频率分布直方图知,第三组的频率为0.020100.2⨯=.(2)平均值450.00410550.01210650.02010750.03010850.02410x =⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯950.0101073.8+⨯⨯=,因为()0.0040.012100.16+⨯=,()0.0040.0120.020100.36++⨯=,所以第25百分位数为0.250.16601064.50.2-+⨯=.9.(2022秋·福建)某校高三年级共有学生1000名.该校为调查高三学生的某项体育技能水平,从中随机抽取了100名学生进行测试,记录他们的成绩,并将数据分成6组:[)[)[]40,50,50,60,,90,100 ,整理得到频率分布直方图,如图.(1)若0.002,0.006a b ==,估计该校高三学生这项体育技能的平均成绩;(2)如果所抽取的100名学生中成绩分布在区间[)60,70内的有8人,估计该校高三学生这项体育技能成绩低于60分的人数.【答案】(1)80.4(2)20【分析】(1)根据直方图所给出的数据求平均数即可;(2)根据直方图面积等于1,求出a ,再将频率作为概率计算即可.【详解】(1)由直方图可知:平均成绩450.02550.02650.06750.4850.3950.280.4x =⨯+⨯+⨯+⨯+⨯+⨯=,即平均成绩为80.4;(2)由于在[)60,70内有8人,0.008b ∴=,∴a =0.001,低于60分的人数约为20.00110100020⨯⨯⨯=人;综上,平均成绩约为80.4分,低于60分的人数约为20人.10.(2021秋·河南)从某部门参加职业技能测试的2000名员工中抽取100名员工,将其成绩(满分100分)按照[20,40),[40,60),60.80[),[80,100]分成4组,得到如图所示的频率分布直方图.(1)估计该部门参加测试员工的成绩的中位数;(2)估计该部门参加测试员工的平均成绩.【答案】(1)中位数为70分.(2)平均成绩为68分.【分析】(1)频率分布直方图中中位数把频率等分,即在频率分布直方图中中位数对应的点(过此点与x 轴垂直的直线)把矩形的面积等分,由此可计算中位数;(2)用各组中点值作为这组的估计值乘以频率的相加.【详解】解:(1)设中位数为x 分.因为前2组频率之和为0.10.20.30.5+=<,而前3组频率之和为0.10.20.4070.5++=>,所以6080x ≤<.由0.0260)0.50.10.2x -=-+(()解得70x =.故可估计该部门参加测试员工的成绩的中位数为70分.(2)抽取的100名员工的平均成绩300.1500.2700.4900.3x =⨯+⨯+⨯+⨯310282768=+++=.故可估计该部门参加测试员工的平均成绩为68分.11.(2021秋·广西)某中学组织学生到某电池厂开展研学实践活动,该厂主要生产型号为2号的干电池.为了解2号干电池的使用寿命,在厂技术员的指导下,学生从某批次2号干电池中随机抽取50节进行测试,得到每一节电池的使用寿命(单位:h )数据,绘制成如下的统计表.请根据表中提供的信息解答下列问题.使用寿命分组/h 频数频率[)5,10a 0.08[)10,15140.28[)15,20200.40[)20,25b c []25,3040.08(1)求表中a ,b ,c 的值,并将如下频率分布直方图补充完整;(2)试估计该批次2号干电池的平均使用寿命.【答案】(1)4a =,8b =,0.16c =,频率分布直方图见解析(2)16.9h【分析】(1)根据:样本容量⨯频率=频数,结合频率和为1计算得到a ,b ,c 的值,并根据频率分布表画出频率分布直方图;(2)由每个小矩形底边中点的横坐标与小矩形的面积的乘积之和,即可求出平均寿命.【详解】(1)500.084a =⨯=,1(0.080.280.40.08)0.16c =-+++=,500.168b =⨯=,所以区间[)20,25对应的频率/组距为0.160.0325=,频率分布直方图如图所示:.(2)根据频率分布直方图,计算平均寿命为:7.50.016512.50.056517.50.08522.50.032527.50.0165⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯16.9=,所以该批次2号干电池的平均使用寿命为16.9h .考点六:方差1.(2021秋·河南)已知样本数据1x ,2x ,3x ,4x ,5x ,6x 的平均数为5,方差为2,则样本数据13x +,23x +,33x +,43x +,53x +,63x +的平均数和方差分别为()A .8和2B .8和5C .5和3D .5和8【答案】A【分析】由新数列与原数据之间的线性关系求均值和方差.【详解】样本数据1x ,2x ,3x ,4x ,5x ,6x 的平均数为5,方差为2,则样本数据13x +,23x +,33x +,43x +,53x +,63x +的平均数是538+=,方差是2122⨯=.故选:A .【点睛】本题考查均值和方差,掌握均值和方差的性质是解题关键.样本数据1x ,2x ,3x ,4x ,5x ,6x 的平均数是x ,方差是2s ,则新样本数据:12,,n ax b ax b ax b +++ ,的均值为ax b +,方差为22a s .2.(2021·贵州)甲,乙两人在相同条件下练习射击,每人打5发子弹,命中环数如下:甲68998乙107779则两人射击成绩的稳定程度是()A .甲稳定B .乙稳定C .一样稳定D .不能确定【答案】A 【分析】计算平均数,方差,通过比较方差的大小来确定谁更稳定.【详解】甲命中环数的平均数()16899885x =++++=甲,方差()()()()()22222216688898988855s ⎡⎤=-+-+-+-+-=⎣⎦甲.乙命中环数的平均数()11097385x =++⨯=乙,方差()()()()()222222181087878789855s ⎡⎤=-+-+-+-+-=⎣⎦乙.因为22s s >乙甲,所以甲比乙射击成绩稳定.故选:A.3.(2022·北京)某校举行演讲比赛,五位评委对甲、乙两位选手的评分如下:甲8.17.98.07.98.1乙7.98.08.18.57.5记五位评委对甲、乙两位选手评分数据的方差分别为22,s s 甲乙,则:2s 甲2s 乙(填“>”,“=”或“<”).【答案】<【分析】计算出22,s s 甲乙,由此确定正确答案.【详解】甲的得分平均值为8.17.98.07.98.18.05++++=,()2210.040.1455s =⨯=甲.乙的得分平均值为7.98.08.18.57.58.05++++=,()22210.520.120.5255s =⨯+⨯=乙,所以22s s <甲乙.故答案为:<4.(2022·山西)如图是甲、乙两人在射击测试中6次命中环数的折线图,下列说法正确的是.①若甲、乙射击成绩的平均数分别为12,x x ,则12x x <②若甲、乙射击成绩的方差分别为2212,s s ,则2212s s <③乙射击成绩的中位数小于甲射击成绩的中位数④乙比甲的射击成绩稳定【答案】③④【分析】从图中得到甲、乙的射击成绩进而求出其平均数、中位数,可以判断①错误,③正确;甲的成绩比较分散,而乙的成绩比较集中,所以甲的方差较大,可以判断②错误、④正确.【详解】由图可知甲的射击成绩为9、10、6、7、9、8,乙的射击成绩为6、7、5、5、7、7.甲、乙射击成绩的平均数分别12,x x ,则()1149910679866x =⨯+++++=,()213767557766x =⨯+++++=,所以12x x >,所以①错误;从甲、乙射击成绩看,甲的成绩比较分散,而乙的成绩比较集中,所以甲的方差较大,即2212s s >,所以②错误;甲的射击成绩从小到大排序为6、7、8、9、9、10,则中位数为8.5,乙的射击成绩从小到大排序为5、5、6、7、7、7,则中位数为6.5,所以乙射击成绩的中位数小于甲射击成绩的中位数,所以③正确;因为乙的成绩比较集中,所以乙比甲的射击成绩稳定,所以④正确.故答案为:③④5.(2023·北京)某校初一年级共有三个班,为了解课外阅读情况,随机抽取部分学生调查他们一周的课外阅读时长(单位:小时),整理数据得到下表:1班89101111152班7789911123班57999101421①设样本中1班数据的均值为1μ,2班数据的均值为2μ,则1μ2μ(填“>”或“<”);②设样本中2班数据的方差为22s ,3班数据的方差为23s ,则22s 23s (填“>”或“<”).【答案】><【分析】根据均值和方差的计算公式,分别计算1μ,2μ和22s ,23s ,再比较大小即可【详解】由表中数据得1132(8910111115)63μ=+++++=,21(778991112)97μ=++++++=,所以12μμ>;设样本中3班数据的均值为3μ,则31(579991014)97μ=++++++=,所以222222222122[(2)(2)(1)0023]77s =-+-+-++++=,222222223146[(4)(2)00015]77s =-+-+++++=,所以2223s s <,故答案为:①>;②<.6.(2023·广东)甲和乙射箭,两人比赛的分数结果如下:甲868659乙6778104求甲和乙分数的平均数和方差,并说明甲和乙发挥的情况.【答案】答案见解析【分析】根据平均数和方差公式可求得甲和乙分数的平均数和方差,结合平均数与方差的大小关系可得出结论.【详解】解:甲分数的平均数为86865976x +++++==甲,方差为()()()()()()222222287678767579726s -+-+-+-+-+-==甲,乙分数的平均数为677810476x +++++==乙,方差为()()()()()()222222267777787107471063s -+-+-+-+-+-==甲,所以,x x =乙甲,22s s <甲乙,故甲乙分数的平均数相同,但甲比乙发挥更为稳定.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
环球雅思教育学科教师讲义讲义编号: ______________ 副校长/组长签字:签字日期:【考纲说明】1、理解随机抽样的必要性和重要性,了解分布、样本数据标准差的意义和作用,理解用样本估计总体的思想。
2、会画频率分布直方图、频率折线图、茎叶图,会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题【趣味链接】U2合唱团在17分钟内得赶到演唱会场,途中必需跨过一座桥,四个人从桥的同一端出发,你得帮助他们到达另一端,天色很暗,而他们只有一只手电筒。
一次同时最多可以有两人一起过桥,而过桥的时候必须持有手电筒,所以就得有人把手电筒带来带去,来回桥两端。
手电筒是不能用丢的方式来传递的。
四个人的步行速度各不同,若两人同行则以较慢者的速度为准。
BONO需花1分钟过桥,EDGE需花2分钟过桥,ADAM需花5分钟过桥,LARRY需花10分钟过桥,他们要如何在17分钟内过桥呢?【知识梳理】一、抽样方法与总体分布的估计1、随机抽样(1)总体:在统计学中, 把研究对象的全体叫做总体,把每个研究对象叫做个体,把总体中个体的总数叫做总体容量.总体与个体之间的关系类似于集合与元素的关系.(2)样本:从总体中随机抽取一部分个体叫做总体的一个样本,样本中个体的数目称为样本的容量,样本和总体之间的关系类似于子集和集合之间的关系.(3)简单随机抽样:一般地,从元素个数为N 的总体中不放回地抽取容量为的样本,如果每一次抽取时总体中的各个个体被抽到的可能性是相同的,那么这种抽样方法叫简单随机抽样,这样抽取的样本,叫做简单随机样本. 常用的方法有抽签法和随机数表法.(4)系统抽样:当总体中的个体比较多时,将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分中抽取一个个体,得到所需要的样本,这样的抽样方法称为系统抽样,也称作等距抽样.(5)分层抽样:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,可将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样. 2、频率分布直方图与茎叶图(1)频率分布:样本中所有数据(或数据组)的频数和样本容量的比就是该数据的频率,所有数据(或数据组)的频率的分布变化规律叫做频率分布,可以用频率分布表、频率分布折线图、茎叶图、频率分布直方图来表示. (2)频率折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图。
(3)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光华曲线,即总体密度曲线。
(4)制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.茎叶图对于分布在0~99的容量较小的数据比较合适,此时,茎叶图比直方图更详尽地表示原始数据的信息. 在茎叶图中,茎也可以放两位,后面位数多可以四舍五入后再制图. 3、样本的数字特征(1)众数:出现次数最多的数叫做众数.(2)中位数:如果将一组数据按大小顺序依次排列,把处在最中间位置的一个数据或中间两个数据的平均是叫做这组数据的中位数.(3)平均数与加权平均数:如果有n 个数,,,,n x x x x ⋯⋯321那么12nx x x x n++⋅⋅⋅+=叫做这n 个数的平均数.如果在n 个数中,1x 出现次1f 次, 2x 出现次2f 次,……,k x 出现次2f 次,(这里),n f f f k =+⋯⋯++21那么11221()k k x x f x f x f n=++⋅⋅⋅+叫做这n 个数的加权平均数,其中k f f f ⋯⋯,,21叫做权.(4)标准差与方差:设一组数据123nx x x x ⋯,,,,的平均数为x ,则nx x x x x x s s n 222212)()()(-++-+-== ,其中2s 表示方差,s 表示标准差.【经典例题】【例1】(2009山东)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( ). A. 90 B.75 C. 60 D.45【例2】(2009上海)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”。
根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A. 甲地:总体均值为3,中位数为4B. 乙地:总体均值为1,总体方差大于0C. 丙地:中位数为2,众数为3D. 丁地:总体均值为2,总体方差为3【例3】(2009湖北)右图是样本容量为200的频率分布直方图。
根据样本的频率分布直方图估计,样本数据落在[6,10]内的频数为 ,数据落在(2,10)内的概率约为 . 【例4】(2008广东)为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为[)45,55,[)[)[)55,65,65,75,75,85,[)85,95由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在[)55,75的人数是 .【例5】(2009福建)点A 为周长等于3的圆周上的一个定点,若在该圆周上随机取一点B ,则劣弧AB 的长度小于1的概率为 .【例6】(2013江苏)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下表, 则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.【例7】(2011广东)在某次测验中,有6位同学的平均成绩为75分.用x n表示编号为n(n=1,2,…,6)的同学所得成绩,且前5位同学的成绩如下:(1)求第6位同学的成绩x6,及这6位同学成绩的标准差s;(2)从前5位同学中,随机地选2位同学,求恰有1位同学成绩在区间(68,75)中的概率.【例8】(2009广东)随机抽取某中学甲乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差(3)现从乙班这10名同学中随机抽取两名身高不低于173cm的同学,求身高为176cm的同学被抽中的概率.【例9】(2009山东)一汽车厂生产A,B,C三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):按类型分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A类轿车10辆.(1)求z的值.(2)用分层抽样的方法在C类轿车中抽取一个容量为5的样本.将该样本看成一个总体,从中任取2辆,求至少有1辆舒适型轿车的概率;(3)用随机抽样的方法从B类舒适型轿车中抽取8辆,经检测它们的得分如下:9.4, 8.6, 9.2, 9.6, 8.7, 9.3, 9.0, 8.2.把这8辆轿车的得分看作一个总体,从中任取一个数,求该数与样本平均数之差的绝对值不超过0.5的概率.【例10】(2011北京)以下茎叶图记录了甲、乙两组各四名同学的植树棵树。
乙组记录中有一个数据模糊,无法确认,在图中以X表示。
(1)如果X=8,求乙组同学植树棵树的平均数和方差;(2)如果X=9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵树Y 的分布列和数学期望。
(注:方差()()()2222121n s x x x x x x n ⎡⎤=-+-++-⎢⎥⎣⎦,其中x 为1x ,2x ,…… n x 的平均数)【课堂练习】1、(2008山东)右图是根据《山东统计年整2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为( ) A. 304.6 B. 303.6 C. 302.6 D. 301.62、(2009四川)设矩形的长为a ,宽为b ,其比满足b ∶a =618.0215≈-,这种矩形给人以美感,称为黄金矩形,黄金矩形常应用于工艺品设计中。
下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本: 甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是( ) A. 甲批次的总体平均数与标准值更接近 B. 乙批次的总体平均数与标准值更接近 C. 两个批次总体平均数与标准值接近程度相同 D. 两个批次总体平均数与标准值接近程度不能确定3、(2009福建)一个容量100的样本,其数据的分组与各组的频数如下表,则样本数据落在(10,40)上的频率为( )A. 0.13B. 0.39C. 0.52D. 0.644、(2010湖北)将参加夏令营的600名学生编号为:001,002,……600,采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495住在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数一次为A .26, 16, 8,B .25,17,8C .25,16,9D .24,17,95、(2009浙江)某个容量为100的样本的频率分布直方图如下,则在区间[4,5) 上的数据的频数..为 .6、(2008广东)某初级中学共有学生2000名,各年级男、女生人数如下表:已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19. (1)求x 的值;(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名? (3)已知y ≥245,z ≥245,求初三年级中女生比男生多的概率.【课后作业】1、(2011湖北)已知随机变量ξ服从正态分布()22N ,a ,且P(ξ<4)=0.8,则P(0<ξ<2)=( ).A .0.6B .0.4C .0.3D .0.22.(2010重庆)某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本. 若样本中的青年职工为7人,则样本容量为().A.7 B.15 C.25 D.353、某商场在国庆黄金周的促销活动中,对10月2日9时至14时的销售额进行统计,其频率分布直方图如图所示.已知9时至10时的销售额为2.5万元,则11时至12时的销售额为().A. 6万元B. 8万元C. 10万元D. 12万元4、(2010山东)在某项体育比赛中,七位裁判为一选手打出的分数如下:90、89、90、95、93、94、93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为().A.92 , 2 B.92 , 2.8 C. 93 , 2 D.93 , 2.85、某中学高三年级从甲、乙两个班级各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则x+y的值为().A. 7B. 8C. 9D. 106、某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表:(1)用分层抽样的方法在35~50岁年龄段的专业技术人员中抽取一个容量为5的样本,将该样本看成一个总体, 从中任取2人, 求至少有1人的学历为研究生的概率;(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N个人,其中35岁以下48人,50岁以上10人,再从这N个人中随机抽取出1人,此人的年龄为50岁以上的概率为539,求x、y的值.7、某校从高一年级学生中随机抽取40名学生,将他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成六段:[)50,40,[)60,50,…,[]100,90后得到如图的频率分布直方图.甲乙78961 1 y1 1 6 8 95 x06 2(1)求图中实数a 的值;(2)若该校高一年级共有学生640人,试估计该校高一年级期中考试数学成 绩不低于60分的人数;(3)若从数学成绩在[)40,50与[]90,100两个分数段内的学生中随机选取两 名学生,求这两名学生的数学成绩之差的绝对值不大于10的概率.8、(2009全国)某车间甲组有10名工人,其中有4名女工人;乙组有10名工人,其中有6名女工人。