高中数学必修三第二章统计复习 优质
人教版高中数学必修三第二章《统计》单元检测精选(含答案解析)
人教版高中数学必修三第二章《统计》单元检测精选(含答案解析)一、选择题(本大题共12小题,每小题5分,共60分)1.从某年级1 000名学生中抽取125名学生进行体重的统计分析,就这个问题来说,下列说法正确的是( ) A .1 000名学生是总体B .每个被抽查的学生是个体C .抽查的125名学生的体重是一个样本D .抽取的125名学生的体重是样本容量2.由小到大排列的一组数据x 1,x 2,x 3,x 4,x 5,其中每个数据都小于-1,那么对于样本1,x 1,-x 2,x 3,-x 4,x 5的中位数可以表示为( ) A.12(1+x 2) B.12(x 2-x 1) C.12(1+x 5) D.12(x 3-x 4) 3.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为36的样本,则老年人、中年人、青年人分别应抽取的人数是( )A .7,11,19B .6,12,18C .6,13,17D .7,12,174.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图2.由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关5.已知一组数据x 1,x 2,x 3,x 4,x 5的平均数是2,方差是13,那么另一组数3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数,方差分别是( )A .2,13 B .2,1C .4,23D .4,36.某学院有4个饲养房,分别养有18,54,24,48只白鼠供实验用.某项实验需抽取24只白鼠,你认为最合适的抽样方法是( ) A .在每个饲养房各抽取6只B .把所有白鼠都加上编有不同号码的颈圈,用随机抽样法确定24只C .从4个饲养房分别抽取3,9,4,8只D .先确定这4个饲养房应分别抽取3,9,4,8只,再由各饲养房自己加号码颈圈,用简单随机抽样的方法确定7.下列有关线性回归的说法,不正确的是( )A .相关关系的两个变量不一定是因果关系B .散点图能直观地反映数据的相关程度C .回归直线最能代表线性相关的两个变量之间的关系D .任一组数据都有回归直线方程8.已知施肥量与水稻产量之间的回归直线方程为y ^=4.75x +257,则施肥量x =30时,对产量y 的估计值为( )A .398.5B .399.5C .400D .400.59.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( ) A .甲地:总体均值为3,中位数为4 B .乙地:总体均值为1,总体方差大于0 C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为310.某高中在校学生2 000人,高一与高二人数相同并都比高三多1人.为了响应“阳光体育运动”号召,学校举行了“元旦”跑步和登山比赛活动.每人都参加而且只参与了其中一项比赛,其中a ∶b ∶c =2∶3∶5,全校参与登山的人数占总人数的25.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则高二参与跑步的学生中应抽取( ) A .36人 B .60人 C .24人 D .30人11.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们所有比赛得分的情况用如右图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为( )A .19,13B .13,19C .20,18D .18,2012A .30%B .70%C .60%D .50%二、填空题(本大题共4小题,每小题5分,共20分)13.已知一个回归直线方程为y ^=1.5x +45(x i ∈{1,5,7,13,19}),则y =________. 14.若a 1,a 2,…,a 20这20个数据的平均数为x ,方差为0.21,则a 1,a 2,…,a 20,x 这21个数据的方差为________.15.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.16.某公司有员工49人,其中30岁以上的员工有14人,没超过30岁的员工有35人,为了解员工的健康情况,用分层抽样方法抽一个容量为7的样本,其中30岁以上的员工应抽取________人.三、解答题(本大题共6小题,共70分)17.(10分)某产品的广告支出x(单位:万元)与销售收入y(单位:万元)之间有下表所对应的数据:(1)(2)求出y对x的回归直线方程;(3)若广告费为9万元,则销售收入约为多少万元?18.(12分)炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据如下表所示:(1)(2)求回归直线方程;(3)预测当钢水含碳量为160时,应冶炼多少分钟?19.(12分)甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.20.(12分)随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查了10个家庭,得数据如下:(1)(2)若二者线性相关,求回归直线方程.21.(12分)某工厂有工人1 000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层抽样方法(按A类,B类分二层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(生产能力指一天加工的零件数).(1)A类工人中和B类工人中各抽查多少工人?(2)从A类工人中的抽查结果和从B类工人中的抽查结果分别如下表1和表2.表1表2异程度与B类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)图1A类工人生产能力的频率分布直方图图2B类工人生产能力的频率分布直方图②分别估计A类工人和B类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).22.(12分)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10(1)y与x是否具有线性相关关系?(2)如果y与x具有线性相关关系,求回归直线方程;(3)根据求出的回归直线方程,预测加工200个零件所用的时间为多少?参考答案与解析1.C [在初中学过:“在统计中,所有考察对象的全体叫做总体,其中每一个所要考察的对象叫做个体,从总体中抽取的一部分个体叫做总体的一个样本,样本中个体的数目叫做样本容量.”因此题中所指的对象应是体重,故A 、B 错误,样本容量应为125,故D 错误.]2.C [由题意把样本从小到大排序为x 1,x 3,x 5,1,-x 4,-x 2,因此得中位数为12(1+x 5).]3.B [因27∶54∶81=1∶2∶3,16×36=6,26×36=12,36×36=18.]4.C [由点的分布知x 与y 负相关,u 与v 正相关.]5.D [因为数据x 1,x 2,x 3,x 4,x 5的平均数是2,方差是13,所以x =2,15∑5i =1 (x i -2)2=13, 因此数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数为: 15∑5i =1 (3x i -2)=3×15∑5i =1x i-2=4, 方差为:15∑5i =1 (3x i -2-x )2=15∑5i =1 (3x i -6)2=9×15∑5i =1 (x i -2)2=9×13=3.] 6.D [因为这24只白鼠要从4个饲养房中抽取,因此要用分层抽样决定各个饲养房应抽取的只数,再用简单随机抽样法从各个饲养房选出所需白鼠.C 虽然用了分层抽样,但在每个层中没有考虑到个体的差异,也就是说在各个饲养房中抽取样本时,没有表明是否具有随机性,故选D.]7.D [根据两个变量具有相关关系的概念,可知A 正确,散点图能直观地描述呈相关关系的两个变量的相关程度,且回归直线最能代表它们之间的相关关系,所以B 、C 正确.只有线性相关的数据才有回归直线方程,所以D 不正确.] 8.B [成线性相关关系的两个变量可以通过回归直线方程进行预测,本题中当x =30时,y ^=4.75×30+257=399.5.]9.D [由于甲地总体均值为3,中位数为4,即中间两个数(第5、6天)人数的平均数为4,因此后面的人数可以大于7,故甲地不符合.乙地中总体均值为1,因此这10天的感染人数总和为10,又由于方差大于0,故这10天中不可能每天都是1,可以有一天大于7,故乙地不符合.丙地中中位数为2,众数为3,3出现的最多,并且可以出现8,故丙地不符合.故丁地符合.]10.A [由题意知高一、高二、高三的人数分别为667,667,666. 设a =2k ,b =3k ,c =5k ,则a +b +c =35×2 000,即k =120.∴b =3×120=360.又2 000人中抽取200人的样本,即每10人中抽取一人,则360人中应抽取36人,故选A.]11.A [分别将甲、乙两名运动员的得分从小到大排列,中间位置的分数则为中位数.] 12.B [由数据分布表可知,质量不小于120克的苹果有10+3+1=14(个),占苹果总数的1420×100%=70%.]13.58.5解析 回归直线方程为y ^=1.5x +45经过点(x , y ),由x =9,知y =58.5. 14.0.215.0.030 3解析 因5个矩形面积之和为1,即(0.005+0.010+0.020+a +0.035)×10=1, ∴0.070×10+10a =1,∴a =0.030.由于三组内学生数的频率分别为:0.3,0.2,0.1,所以三组内学生的人数分别为30,20,10.因此从[140,150]内选取的人数为1060×18=3.16.217.解 (1)作出的散点图如图所示(2)易得x =52,y =692,所以b ^ =∑4i =1x i y i -4x y ∑4i =1x 2i -4x 2=418-4×52×69230-4×⎝⎛⎭⎫522=735,a ^ =y -b ^ x =692-735×52=-2.故y 对x 的回归直线方程为y ^ =735x -2.(3)当x =9时,y ^ =735×9-2=129.4.故当广告费为9万元时,销售收入约为129.4万元.18.解 (1)以x 轴表示含碳量,y 轴表示冶炼时间,可作散点图如图所示:从图中可以看出,各点散布在一条直线附近,即它们线性相关.设所求的回归直线方程为y =b x +a ,b ^ =∑10i =1x i y i -10x y ∑10i =1x 2i -10x 2≈1.267,a ^ =y -b ^ x ≈-30.47.所求回归直线方程为 y ^=1.267x -30.47.(3)当x =160时,y ^=1.267×160+(-30.47)=172.25.即当钢水含碳量为160时,应冶炼约172.25分钟.19.解 (1)由图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分.x 甲=10+13+12+14+165=13,x 乙=13+14+12+12+145=13,s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4, s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8. (2)由s 2甲>s 2乙可知乙的成绩较稳定. 从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高. 20.解 (1)作出散点图:观察发现各个数据对应的点都在一条直线附近,所以二者呈线性相关关系.(2)x =110(0.8+1.1+1.3+1.5+1.5+1.8+2.0+2.2+2.4+2.8)=1.74,y =110(0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7+2.0+2.5)=1.42,∑10i =1x i y i =27.51,∑10i =1x 2i =33.72, b ^=∑10i =1x i y i -10x y ∑10i =1x 2i -10x 2≈0.813 6,a ^ =1.42-1.74×0.813 6≈0.004 3,∴回归方程为y ^=0.813 6x +0.004 3.21.解 (1)A 类工人中和B 类工人中分别抽查25名和75名.(2)①由4+8+x +5+3=25,得x =5,6+y +36+18=75,得y =15. 频率分布直方图如下:图1 A 类工人生产能力的频率分布直方图图2 B 类工人生产能力的频率分布直方图从直方图可以判断:B 类工人中个体间的差异程度更小.②x A =425×105+825×115+525×125+525×135+325×145=123,x B =675×115+1575×125+3675×135+1875×145=133.8,x =25100×123+75100×133.8=131.1.A 类工人生产能力的平均数,B 类工人生产能力的平均数以及全厂工人生产能力的平均数的估计值分别为123,133.8和131.1. 22.解 (1)作出如下散点图:由图可知,y 与x 具有线性相关关系.x =55,y =91.7,∑10i =1x 2i =38 500,∑10i =1y 2i =87 777,∑10i =1x i y i =55 950, 设所求的回归直线方程为y ^ =b ^ x +a ^,则有b ^ =∑10i =1x i y i -10x y ∑10i =1x 2i -10x 2=55 950-10×55×91.738 500-10×552≈0.668,a ^ =y -b ^ x =91.7-0.668×55=54.96,因此,所求的回归直线方程为y ^ =0.668x +54.96.(3)这个回归直线方程的意义是当x 每增加1时,y 的值约增加0.668,而54.96是y 不随x 变化而变化的部分,因此,当x =200时,y 的估计值为y ^ =0.668×200+54.96=188.56≈189,因此,加工200个零件所用的时间约为189分.。
数学必修3第二章 统计复习
.
所以这组数据的方差为5.5,标准差为2.3 .
例4. 从甲、乙两名学生中选拔一人乘积射 击比赛,对他们的射击水平进行测试,两 人在相同的条件下各射击10次,命中环数 如下﹕ 甲﹕7,8,6,8,6,5,8,10,7,4; 乙﹕9,5,7,8,7,6,8,6,7,7. (1)计算甲、乙两人射击命中环数的平 均数和标准差; (2)比较两人的成绩,然后决定选择哪 一人参赛.
变量间的相关关系
最小二乘法
回归直线方程 y bx + a
n
n
(xi - x)( yi - y) xi yi - nx y
b i1 n
i1 n
, a y - bx
(xi - x)2
xi2 - nx 2
i1
i1
7.小王记录了产量x(吨)和能耗y(吨标准煤)对应
的四组数据,用最小二乘法求出了 yˆ 0.7x +,0不.3慎5 将
6. 2009年义乌小商品博览会共设国际标准展位5000个。 为了解展览期间成交状况,现从中抽取100展位的成交 额(万元),制成如下频率分布表和频率分布直方图:
频率/组距
分组 频 频率 频率/ 0.026
0.50
数
组距 0.022
[150,170) 4 0.04 0.002 0.018
0.36
[170,190)
5
0.05 0.0025 0.014
[190,210) 36 0.36 0.018
0.010
[210,230) 50 0.50 0.025
0.006
[230,250] 5 0.05 0.0025
0.04 0.05
0.05
0.002
国家课程校本化:高中数学必修三第二章 统计 课时训练
2.1.1简单随机抽样一、基础过关1.为了了解某种花的发芽天数,种植某种花的球根200个,进行调查发芽天数的试验,样本是() A.200个表示发芽天数的数值B.200个球根C.无数个球根发芽天数的数值集合D.无法确定2.某校有40个班,每班50人,要求每班随机选派3人参加“学生代表大会”.在这个问题中样本容量是() A.40 B.50 C.120 D.1503.用简单随机抽样方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性,“第二次被抽到”的可能性分别是()A.110,110 B.310,15C.15,310 D.310,3104.下列抽样实验中,用抽签法方便的是() A.从某厂生产的3 000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验C.从甲乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验D.从某厂生产的3 000件产品中抽取10件进行质量检验5.某总体共有60个个体,并且编号为00,01,…,59.现需从中抽取一个容量为8的样本,请从随机数表的倒数第5行(下表为随机数表的最后5行)第11、12列的18开始.依次向下读数,到最后一行后向右,直到取足样本为止(大于59及与前面重复的数字跳过),则抽取样本的号码是________.95 33 95 22 00 18 74 72 00 18 38 79 58 69 32 81 76 80 269282 80 84 25 3990 84 60 79 80 24 36 59 87 38 82 07 53 89 35 56 35 23 79 1805 98 90 07 3546 40 62 98 80 54 97 20 56 95 15 74 80 08 32 16 46 70 50 8067 72 16 42 7920 31 89 03 43 38 46 82 68 72 32 14 82 99 70 80 60 47 18 9763 49 30 21 3071 59 73 05 50 28 22 23 71 77 91 01 93 20 49 82 96 59 26 9466 39 67 98 606.为了了解参加运动会的2 000名运动员的年龄情况,从中抽取20名运动员的年龄进行统计分析.就这个问题,下列说法中正确的有________.①2 000名运动员是总体;②每个运动员是个体;③所抽取的20名运动员是一个样本;④样本容量为20;⑤这个抽样方法可采用随机数法抽样;⑥每个运动员被抽到的机会相等.7.要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,写出抽样过程.二、能力提升8.总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()9.从10个篮球中任取一个,检查其质量,用随机数法抽取样本,则应编号为() A.1,2,3,4,5,6,7,8,9,10;B.-5,-4,-3,-2,-1,0,1,2,3,4C.10,20,30,40,50,60,70,80,90,100;D.0,1,2,3,4,5,6,7,8,910.从一群游戏的小孩中随机抽出k人,一人分一个苹果,让他们返回继续游戏.过了一会儿,再从中任取m人,发现其中有n个小孩曾分过苹果,估计参加游戏的小孩的人数为________.11.现有一批编号为10,11,…,99,100,…,600的元件,打算从中抽取一个容量为6的样本进行质量检验.如何用随机数法设计抽样方案?12.学校举办元旦晚会,需要从每班选10名男生,8名女生参加合唱节目,某班有男生32名,女生28名,试用抽签法确定该班参加合唱的同学.三、探究与拓展13.某电视台举行颁奖典礼,邀请20名港台、内地艺人演出,其中从30名内地艺人中随机选出10人,从18名香港艺人中随机挑选6人,从10名台湾艺人中随机挑选4人.试用抽签法确定选中的艺人,并确定他们的表演顺序.2.1.2系统抽样一、基础过关1.为了了解某地参加计算机水平测试的5 008名学生的成绩,从中抽取了200名学生的成绩进行统计分析,运用系统抽样方法抽取样本时,每组的容量为()A.24 B.25 C.26 D.282.要从160名学生中抽取容量为20的样本,用系统抽样法将160名学生从1~160编号.按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组应抽出的号码为125,则第一组中按此抽签方法确定的号码是()A.7 B.5 C.4 D.33.下列问题中,最适合用系统抽样法抽样的是() A.从某厂生产的20个电子元件中随机抽取5个入样B.一个城市有210家超市,其中大型超市20家,中型超市40家,小型超市150家,为了掌握各超市的营业情况,要从中抽取一个容量为21的样本C.从参加竞赛的1 500名初中生中随机抽取100人分析试题作答情况D.从参加期末考试的2 400名高中生中随机抽取10人了解某些情况4.一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k小组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是()A.63 B.70 C.50 D.805.将参加夏令营的600名学生编号为001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为()A.26,16,8;B.25,17,8;C.25,16,9 D.24,17,96.采用系统抽样的方法,从个体数为1 003的总体中抽取一个容量为50的样本,则在抽样过程中,被剔除的个体数为________,抽样间隔为________.7.某学校有30个班级,每班50名学生,上级要到学校进行体育达标验收.需要抽取10%的学生进行体育项目的测验.请你制定一个简便易行的抽样方案(写出实施步骤).二、能力提升8.某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为()A.11 B.12 C.13 D.149.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( )A .7B .9C .10D .1510.采用系统抽样从含有8 000个个体的总体(编号为0000,0001,…,7999)中抽取一个容量为50的样本,则最后一段的编号为____________,已知最后一个入样编号是7894,则开头5个入样编号是__________________.11.某装订厂平均每小时大约装订图书362册,要求检验员每小时抽取40册图书,检验其质量状况,请你设计一个抽样方案.12.某工厂有工人1 021人,其中高级工程师20人,现抽取普通工人40人,高级工程师4人组成代表队去参加某项活动,应怎样抽样?三、探究与拓展13.下面给出某村委调查本村各户收入情况所作的抽样,阅读并回答问题:本村人口:1 200人,户数300,每户平均人口数4人; 应抽户数:30户; 抽样间隔:1 20030=40;确定随机数字:取一张人民币,编码的后两位数为12; 确定第一样本户:编码的后两位数为12的户为第一样本户; 确定第二样本户:12+40=52,52号为第二样本户; ……(1)该村委采用了何种抽样方法? (2)抽样过程中存在哪些问题,并修改. (3)何处是用简单随机抽样.2.1.3 分层抽样课时达标训练一、基础过关1.某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是() A.抽签法B.随机数法C.系统抽样法D.分层抽样法2.下列问题中,最适合用分层抽样抽取样本的是() A.从10名同学中抽取3人参加座谈会B.某社区有500个家庭,其中高收入的家庭125户,中等收入的家庭280户,低收入的家庭95户,为了了解生活购买力的某项指标,要从中抽取一个容量为100户的样本C.从1 000名工人中,抽取100人调查上班途中所用时间D.从生产流水线上,抽取样本检查产品质量3.具有A、B、C三种性质的总体,其容量为63,将A、B、C三种性质的个体按1∶2∶4的比例进行分层抽样调查,如果抽取的样本容量为21,则A、B、C三种元素分别抽取() A.12、6、3 B.12、3、6C.3、6、12 D.3、12、64.某校高三一班有学生54人,二班有学生42人,现在要用分层抽样的方法从两个班抽出16人参加军训表演,则一班和二班分别被抽取的人数是()A.8,8 B.10,6 C.9,7 D.12,45.某城区有农民、工人、知识分子家庭共计2 000家,其中农民家庭1 800户,工人家庭100户.现要从中抽取容量为40的样本,调查家庭收入情况,则在整个抽样过程中,可以用到下列抽样方法()①简单随机抽样;②系统抽样;③分层抽样.A.②③B.①③C.③D.①②③6.某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.7.某工厂有3条生产同一产品的流水线,每天生产的产品件数分别是3 000件,4 000件,8 000件.若要用分层抽样的方法抽取一个容量为150件产品的样本,应该如何抽样?二、能力提升8.某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生数是高一学生数的两倍,高二学生数比高一学生数多300人,现在按1100的抽样比用分层抽样的方法抽取样本,则应抽取高一学生数为()A.8 B.11 C.16 D.109.某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体状况,从他们中抽取容量为36的样本,最适合抽样本的方法是() A.简单随机抽样B.系统抽样C.先从中年人中剔除1人,再用分层抽样D.先从老年人中剔除1人,再用分层抽样10.某工厂生产A、B、C、D四种不同型号的产品,产品数量之比依次为2∶3∶5∶1.现用分层抽样方法抽出一个容量为n的样本,样本中A种型号有16件,那么此样本的容量n为________.11.一批产品有一级品100个,二级品60个,三级品40个,分别采用系统抽样和分层抽样,从这批产品中抽取一个容量为20的样本.12.某单位有技师18人,技术员12人,工程师6人,需要从这些人中抽取一个容量为n 的样本,如果采用系统抽样和分层抽样方法抽取,都不用剔除个体;如果样本容量增加1,则在采用系统抽样时,需要在总体中剔除1个个体,求样本容量n.三、探究与拓展13.某中学举行了为期3天的新世纪体育运动会,同时进行全校精神文明擂台赛.为了解这次活动在全校师生中产生的影响,分别在全校500名教职员工、3 000名初中生、4 000名高中生中作问卷调查,如果要在所有答卷中抽出120份用于评估.(1)采用哪种抽样方法才能得到比较客观的评价结论?教职员工、初中生、高中生中抽取的个体数各是什么?(2)要从3 000份初中生的答卷中抽取一个容量为48的样本,如果采用简单随机抽样,应如何操作?(3)为了从4 000份高中生的答卷中抽取一个容量为64的样本,如何使用系统抽样抽取到所需的样本?2.2.1用样本的频率分布估计总体分布(一)一、基础过关1.如图所示是一容量为100的样本的频率分布直方图,则由图形中的数据,样本落在[15,20)内的频数为()A.20B.30C.40D.502.容量为20的样本数据,分组后的频数如下表:A.0.35 B.0.45 C.0.55 D.0.653.某校为了了解高三学生的身体情况,抽取了100名女生的体重.将所得的数据整理后,画出了如图的频率分布直方图,则所抽取的女生中体重在40~45 kg的人数是() A.10B.2C.5D.154.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60)的同学有30人,若想在这n个人中抽取50个人,则在[50,60)之间应抽取的人数为()A.10B.15C.25D.305.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________. 6.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)直方图中x 的值为 __________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.7.某制造商在今年3月份生产了一批乒乓球,随机抽取100个进行检查,测得每个球的直径(单位:mm),将数据分组如下表:补充完成频率分布表(结果保留两位小数),并在上图中画出频率分布直方图.二、能力提升8.容量为100的样本数据按从小到大的顺序分为8组,如下表:第3( )A .14和0.14B .0.14和14 C.114和0.14D.13和1149.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588B.480C.450D.12010.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.11.某市共有5 000名高三学生参加联考,为了了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如下频率分布表:(1)根据上面的频率分布表,求①,②,③,④处的数值;(2)在所给的坐标系中画出区间[80,150]上的频率分布直方图.三、探究与拓展12.某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.2.2.1用样本的频率分布估计总体分布(二)一、基础过关1.在用样本频率分布估计总体分布的过程中,下列说法正确的是()A.总体容量越大,估计越精确;B.总体容量越小,估计越精确C.样本容量越大,估计越精确;D.样本容量越小,估计越精确2.从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图).设甲、乙两组数据的平均数分别为x甲、x乙,中位数分别为m甲、m乙,则()A.x甲<x乙,m甲>m乙B.x甲<x乙,m甲<m乙C.x甲>x乙,m甲>m乙D.x甲>x乙,m甲<m乙3.如图是根据《山东统计年鉴2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为()A.304.6B.303.6C.302.6D.301.64.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是() A.46,45,56B.46,45,53C.47,45,56D.45,47,535.对一个未知总体,我们常用样本的频率分布估计总体的分布,其中表示样本数据的频率分布的基本方法有________、________、________、________.6.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________,________.7.某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30 mm抽取一包产品,称其重量,分别记录抽查数据如下:甲:102,101,99,98,103,98,99乙:110,115,90,85,75,115,110将这两组数据用茎叶图表示,并根据茎叶图对两个车间的产品进行比较.二、能力提升8.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()9.如图是某赛季甲、乙两名篮球运动员参加的每场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数之和是()A.65 B.64 C.63 D.6210.在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22试画出这两组数据的茎叶图.11.参加CBA2013~2014赛季的甲、乙两支球队,统计两队队员的身高如下(单位:cm):甲队队员:194,187,199,207,203,205,209,199,183,215,219,206,201,208;乙队队员:179,192,218,223,187,194,205,207,185,197,199,209,214,189.(1)用茎叶图表示两队队员的身高;(2)根据茎叶图判断哪个队队员的身高更整齐一些.12.美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,5256,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.三、探究与拓展13.某市2010年4月1日-4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表.(2)作出频率分布直方图.(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.2.2.2用样本的数字特征估计总体的数字特征(一)一、基础过关1.已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有()A.a>b>c B.a>c>b C.c>a>b D.c>b>a2.某台机床加工的1 000只产品中次品数的频率分布如下表:) A.0,1.1 B.0,1C.4,1 D.0.5,23.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差等于() A.3.5 B.-3 C.3 D.-0.54.电池厂从某日生产的电池中抽取10个进行寿命测试,得数据如下(单位:小时):30,35,25,25,30,34,26,25,29,21,则该电池的平均寿命估计为______小时.5.某商店大米的价格是3.00元/千克,面粉的价格是3.60元/千克,大米与面粉的销量分别是1 000千克,500千克,则该商店出售的粮食的平均价格是______元/千克.6.已知一组数据的频率分布直方图如下.求众数、中位数、平均数.7.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30、0.40、0.15、0.10、0.05.求:(1)高一参赛学生的成绩的众数、中位数. (2)高一参赛学生的平均成绩.二、能力提升8.期中考试以后,班长算出了全班40个人数学成绩的平均分为M ,如果把M 当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均值为N ,那么M ∶N 为( ) A.4041B .1C.4140D .29.若有一个企业,70%的员工收入1万,25%的员工年收入3万,5%的员工年收入11万,则该企业员工的年收入的平均数是______万,中位数是____万,众数是____万. 10.有容量为100的样本,数据分组及各组的频数、频率如下:[12.5,14.5),6,0.06;[14.5,16.5),16,0.16;[16.5,18.5),18,0.18;[18.5,20.5),22,0.22;[20.5,22.5),20,0.20;[22.5,24.5),10,0.10;[24.5,26.5),8,0.08.估计总体的平均数为________. 11.高一(3)班有男同学27名,女同学21名,在一次语文测验中,男同学的平均分是82分,中位数是75分,女同学的平均分是80分,中位数是80分. (1)求这次测验全班平均分(精确到0.01);(2)估计全班成绩在80分以下(含80分)的同学至少有多少人?(3)分析男同学的平均分与中位数相差较大的主要原因是什么?12.为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5.(1)求第四小组的频率;(2)问参加这次测试的学生人数是多少?(3)问在这次测试中学生跳绳次数的中位数落在第几小组内?三、探究与拓展13.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.23.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.12.3 2.4服用B药的20位患者日平均增加的睡眠时间:3.2 1.7 1.90.80.9 2.4 1.2 2.6 1.31.4 1.60.5 1.80.6 2.1 1.1 2.5 1.22.70.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?2.2.2用样本的数字特征估计总体的数字特征(2)一、基础过关1.已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为() A.1 B. 2 C. 3 D.22.在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是() A.众数B.平均数C.中位数D.标准差3.若样本1+x1,1+x2,1+x3,…,1+x n的平均数是10,方差为2,则对于样本2+x1,2+x2,…,2+x n,下列结论正确的是()A.平均数是10,方差为2;B.平均数是11,方差为3C.平均数是11,方差为2;D.平均数是10,方差为34.下表是某班50名学生综合能力测试的成绩分布表,则该班成绩的方差为()A.345B.1.36 C.2 D.45.抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:6.已知样本9,10,11,x,y的平均数是10,方差是4,则xy=________.7.(1)已知一组数据x1,x2,…,x n的方差是a,求另一组数据x1-2,x2-2,…,x n-2的方差;(2)设一组数据x1,x2,…,x n的标准差为s x,另一组数据3x1+a,3x2+a,…,3x n+a的标准差为s y,求s x与s y的关系.二、能力提升8.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x A和x B,样本方差分别为s2A和s2B,则()A.x A>x B,s2A>s2BB.x A<x B,s2A>s2BC.x A>x B,s2A<s2BD.x A<x B,s2A<s2B9.如图是2012年某校举行的元旦诗歌朗诵比赛中,七位评委为某位选手打出的分数的茎叶图,去掉一个最高分和一个最低分,所剩数据的平均数和方差分别为() A.84,4.84 B.84,1.6C.85,1.6 D.85,0.410.为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________.11.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:(1)(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、极差、方差,并判断选谁参加比赛比较合适?12.为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如下表:(2)若定期更换,可选择多长时间统一更换合适?三、探究与拓展13.师大附中三年级一班40人随机平均分成两组,两组学生一次考试的成绩情况如下表:2.3 变量间的相关关系一、基础过关1.下列两个变量之间的关系,哪个不是函数关系( )A .匀速行驶车辆的行驶距离与时间;B .角度和它的正弦值C .等腰直角三角形的腰长与面积;D .在一定年龄段内,人的年龄与身高 2.下列有关线性回归的说法,不正确的是( )A .变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B .在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图C .回归方程最能代表观测值x 、y 之间的线性关系D .任何一组观测值都能得到具有代表意义的回归方程3.工人月工资(元)依劳动生产率(千元)变化的回归方程为y ^=60+90x ,下列判断正确的( )A .生产率为1千元时,工资为50元;B .生产率提高1千元时,工资提高150元C .生产率提高1千元时,工资约提高90元;D .生产率为1千元时,工资为90元 4.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程y =b x +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′B.b ^>b ′,a ^<a ′C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′5.若对某个地区人均工资x 与该地区人均消费y 进行调查统计得y 与x 具有相关关系,且回归方程为y ^=0.7x +2.1(单位:千元),若该地区人均消费水平为10.5,则估计该地区人均消费 额占人均工资收入的百分比约为________.6.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y 对总成绩x 的回归方程为y ^=6+0.4x .由此可以估计:若两个同学的总成绩相差50分,则他们的数学 成绩大约相差________分.7.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y ^=b ^x +a ^; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y ^ =b ^ x +a ^ 中,b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x ,其中x ,y 为样本平均值.二、能力提升8.设(x1,y1),(x2,y2),…,(x n,y n)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的回归直线(如图),以下结论中正确的是() A.x和y的相关系数为直线l的斜率B.x和y的相关系数在0到1之间C.当n为偶数时,分布在l两侧的样本点的个数一定相同D.直线l过点(x,y)9.若变量y与x之间的相关系数r=-0.936 2,则变量y与x之间() A.不具有线性相关关系;B.具有线性相关关系C.它们的线性相关关系还要进一步确定;D.不确定10.某工厂生产某种产品的产量x(吨)与相应的生产能耗y(吨标准煤)有如下几组样本数据:线的斜率为0.7,则这组样本数据的回归直线方程是________.11.某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm. 因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为___________cm.12.以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:(1)(2)求回归方程,并在散点图中加上回归直线.(3)据(2)的结果估计当房屋面积为150 m2时的销售价格.。
高中数学第二章统计23变量间的相关关系课件新人教A版必修3(2)
总费用y/万元 2.2 3.8 5.5 6.5 7.0
(1)根据表格数据,画出散点图;
(2)求线性回归方程y^=b^x+a^的系数a^,b^; (3)估计使用年限为 10 年时,车的使用总费用是多少?
【解题探究】(1)利用描点法作出散点图; (2)把数据代入公式,可得回归方程的系数; (3)把x=10代入回归方程得y值,即为总费用的估计 值.
【答案】A 【解析】在A中,若b确定,则a,b,c都是常数,Δ= b2-4ac也就唯一确定了,因此,这两者之间是确定性的函数 关系;一般来说,光照时间越长,果树亩产量越高;降雪量越 大,交通事故发生率越高;施肥量越多,粮食亩产量越高,所 以B,C,D是相关关系.故选A.
两个变量x与y相关关系的判断方法 1.散点图法:通过散点图,观察它们的分布是否存在 一定规律,直观地判断.如果发现点的分布从整体上看大致在 一条直线附近,那么这两个变量就是线性相关的,注意不要受 个别点的位置的影响. 2.表格、关系式法:结合表格或关系式进行判断. 3.经验法:借助积累的经验进行分析判断.
变量之间的相关关系的判断
【 例 1】 下 列 变 量 之 间 的 关 系 不 是 相 关 关 系 的 是 ()
A.二次函数y=ax2+bx+c中,a,c是已知常数,取b 为自变量,因变量是判别式Δ=b2-4ac
B.光照时间和果树亩产量 C.降雪量和交通事故发生率 D.每亩田施肥量和粮食亩产量
【解题探究】判断两个变量之间具有相关关系的关键是 什么?
①反映^y与 x 之间的函数关系;
②反映 y 与 x 之间的函数关系;
③表示^y与 x 之间的不确定关系;
④表示最接近 y 与 x 之间真实关系的一条直线.
A.①②
高中数学必修3第二章:统计2.3变量间的相关关系
Y 研考点·知规律
探究悟道 点拨技法
题型一 相关关系的判断 【例 1】 河北国欣农研会的科研人员在 7 块并排、形状大小 相同的试验田上对某棉花新品种进行施化肥量 x 对产量 y 影响的 试验,得到如下表所示的一组数据(单位:kg): 施化肥量 x 15 20 25 30 35 40 45 棉花产量 y 330 345 365 405 445 450 455
D 读教材·抓基础
回扣教材 扫除盲点
课本导读
1.两个变量的线性相关 (1)在散点图中,点散布在从 左下角 到 右上角的区域,对于 两个变量的这种相关关系,我们将它称为正相关. (2)在散点图中,点散布在从 左上角 到 右下角的区域,两个 变量的这种相关关系称为负相关. (3)如果散点图中点的分布在整体上看大致在一条直线附近 , 就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
() (A)她儿子10岁时的身高一定是145.83 cm (B)她儿子10岁时的身高在145.83 cm以上 (C)她儿子10岁时的身高在145.83 cm左右 (D)她儿子10岁时的身高在145.83 cm以下
2.经调查知,某品牌汽车的销售量y(辆)与广告费用x(万元)之 间的回归直线方程为 yˆ =250+4x,当广告费用为50万元时,预计 汽车销售量约为 ______辆.
2.回归方程 (1)最小二乘法:使得样本数据的点到回归直线的 距离的平方
和最小的方法叫最小二乘法.
(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,
^^ ^
y1)、(x2,y2),…,(xn,yn).其回归方程为y=bx+a,则
n
n
xi- x yi- y xiyi-n x y
高中数学 第二章 统计本章整合 新人教A版必修3(2021年最新整理)
高中数学第二章统计本章整合新人教A版必修3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第二章统计本章整合新人教A版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第二章统计本章整合新人教A版必修3的全部内容。
高中数学第二章统计本章整合新人教A版必修3 知识网络专题探究专题一三种抽样方法的比较简单随机抽样、系统抽样、分层抽样的比较如下表:类别共同点各自特点联系适用范围简单随机抽样抽样过程中每个个体被抽到的可能性相等;每次抽出个体后不再将它放回,即不从总体中逐个抽取总体中个体无差异且个数较少系统抽样将总体均分成几部分,按预先制定的规则在各部分中抽在第一组抽取样本时采用简单随机抽样总体中个体无差异且个数很多抽样方法抽取具有代表性的样本对整个统计问题起着至关重要的作用.高考中主要考查三种抽样方法的比较和辨析以及应用.错误!某高级中学有学生270人,其中一年级108人,二、三年级各81人.现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,270。
高中数学 第二章 统计模块复习课检测 新人教B版必修3-新人教B版高一必修3数学试题
第2课时统计课后篇巩固探究A组1.下列不具有相关关系的是()A.单产不为常数时,土地面积和总产量B.人的身高与体重C.季节与学生的学习成绩D.学生的学习态度与学习成绩.2.某中学采用系统抽样方法,从该校高一年级全体800名学生中抽取50名学生做牙齿健康检查.现将800名学生从1到800进行编号.已知从33~48这16个数中抽到的数是39,则在第1小组1~16中随机抽到的数是()A.5B.7C.11D.13k==16,即每16人抽取一个人.因为39=2×16+7,所以第1小组中抽取的数为7.3.在一次歌手大奖赛上,七位评委为某歌手打出的分数如下:9.48.49.49.99.69.49.7去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为()A.9.4,0.484B.9.4,0.016C.9.5,0.04D.9.5,0.016=9.5.方差s2=[(9.4-9.5)2+(9.4-9.5)2+(9.6-9.5)2+(9.4-9.5)2+(9.7-9.5)2]=0.016.4.某地区有300家商店,其中大型商店有30家,中型商店有75家,小型商店有195家,为了掌握各商店的营业情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的中型商店为() A.2家B.3家C.5家D.13家1:在整个抽样过程中,每个个体被抽到的可能性为,则抽取的中型商店为75×=5(家).方法2:因为大、中、小型商店数的比为30∶75∶195=2∶5∶13,所以抽取的中型商店为20×=5(家).答案:C5.某商场在五一促销活动中,对5月1日9时至14时的销售额进行统计,其频率分布直方图如图,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为()A.6万元B.8万元C.10万元D.12万元解析:由频率分布直方图可知,11时至12时的销售额占全部销售额的,即销售额为25×=10(万元).答案:C6.从一堆苹果中任取了20个,并得到它们的质量(单位:g)数据分布表如下:分组[90,100) [100,110) [110,120) [120,130) [130,140) [140,150)频数 1 2 3 10 1则这堆苹果中,质量不小于120 g的苹果数约占苹果总数的.解析:由表中可知这堆苹果中,质量不小于120 g的苹果数为20-1-2-3=14.故约占苹果总数的=0.70=70%.答案:70%7.某产品的广告费用x与销售额y的统计数据如下表:广告费用x/万元 4 2 3 5销售额y/万元49 26 39 54根据上表可得回归方程x+中的为9.4,据此模型预报广告费用为6万元时销售额约为元.解析:=3.5,=42,∴=42-9.4×3.5=9.1,∴回归方程为=9.4x+9.1,∴当x=6时,=9.4×6+9.1=65.5..58.现有同一型号的电脑96台,为了了解这种电脑每开机一次所产生的辐射情况,从中抽取10台在同一条件下做开机实验,测量开机一次所产生的辐射,得到如下数据:13.712.914.413.813.312.713.513.613.113.4(1)写出采用简单随机抽样抽取上述样本的过程;(2)根据样本,请估计总体平均数与总体标准差的情况.解:(1)利用随机数表法或抽签法.具体过程如下:方法一(抽签法):①将96台电脑随机编号为1~96;②将以上96个分别写在96X相同的小纸条上,揉成小球,制成号签;③把号签放入一个不透明的容器中,充分搅拌均匀;④从容器中逐个抽取10个号签,每次取完后再次搅拌均匀,并记录上面的;⑤找出和所得对应的10台电脑,组成样本.方法二(随机数表法):①将96台电脑随机编号,编号为00,01,02, (95)②在随机数表中任选一数作为开始,然后依次向右读,每次读两位,凡不在00~95中的数和前面已读过的数跳过不读,直到读出10个符合条件的数;③这10个数所对应的10台电脑即是我们所要抽取的样本.(2)=13.44;s2=≈0.461.故总体平均数为13.44,总体标准差约为0.461.9.对某班50人进行智力测验,其得分如下:48,64,52,86,71,48,64,41,86,79,71,68,82,84,68,64,62,68,81,57,90,52,74,73,56,78,47,66,5 5,64,56,88,69,40,73,97,68,56,67,59,70,52,79,44,55,69,62,58,32,58.(1)这次测试成绩的最大值和最小值各是多少?(2)将[30,100)平分成7个小区间,试画出该班学生智力测验成绩的频数分布图.(3)分析这个频数分布图,你能得出什么结论?解:(1)最小值是32,最大值是97.(2)7个区间分别是[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100),每个小区间的长度是10,统计出各小区间内的数据频数,列表如下:区间[30,40) [40,50) [50,60) [60,70) [70,80) [80,90) [90,100)频数 1 6 12 14 9 6 2频数分布图如下图所示.(3)可以看出,该班智力测验成绩大体上呈两头小、中间大、左右对称的钟形状态,说明该班学生智力特别好或特别差的是极少数,而智力一般的是多数,这是一种最常见的分布.10.导学号17504078已知学生的总成绩与数学成绩之间有线性相关关系,下表给出了5名同学在一次考试中的总成绩和数学成绩(单位:分).学生编号1 2 3 4 5成绩总成绩/x482 383 421 364 362数学成绩/y78 65 71 64 61(1)求数学成绩与总成绩的回归直线方程.(2)根据以上信息,如果一个学生的总成绩为450分,试估计这个学生的数学成绩;(3)如果另一位学生的数学成绩为92分,试估计其总成绩是多少?解:(1)列出下表,并进行有关计算.编号x y x2xy1 482 78 232 324 37 5962 383 65 146 689 24 8953 421 71 177 241 29 8914 364 64 132 496 23 2965 362 61 131 044 22 082合计 2 012 339 819 794 137 760由上表可得,可得≈0.132,-0.132×≈14.683.故数学成绩y对总成绩x的回归直线方程为=14.683+0.132x.(2)由(1)得当总成绩x为450分时,=14.683+0.132×450≈74(分),即数学成绩大约为74分.(3)若数学成绩为92分,将=92代入回归直线方程=14.683+0.132x中,得x≈586(分).故估计该生的总成绩在586分左右.B组1.设样本数据x1,x2,…,x10的均值和方差分别为1和4,若y i=x i+a(a为非零常数,i=1,2,…,10),则y1,y2,…,y10的均值和方差分别为()A.1+a,4B.1+a,4+aC.1,4D.1,4+a解析:=+a=1+a.s2===4.答案:A2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m e,众数为m o,平均值为,则()A.m e=m o=B.m e=m o<C.m e<m o<D.m o<m e<解析:由题目所给的统计图示可知,30个得分中,按大小顺序排好后,中间的两个得分为5,6,故中位数m e==5.5,又众数m o=5,平均值(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2)=,故m o<m e<.答案:D3.某市为加强教师基础素质建设,开展了“每月多读一本书,提高自身修养”的读书活动.设该市参加读书活动的教师平均每人每年读书的本数为x(单位:本),按读书本数分下列四种情况统计:①0~10本;②11~20本;③21~30本;④30本以上.现有10 000名教师参加了此项活动,如图是此次调查中某一项的程序框图,其输出的结果为6 200,则该市参加活动的教师中平均每年读书本数在0~20之间的频率是()A.3 800B.6 200C.0.38D.0.62解析:由程序框图知,当x>20时,S=S+1,故输出的S值应是10 000名教师中读书本数大于20的人数,故S=6 200,∴在0~20之间的频率为=0.38.答案:C4.(2017某某某某二中高三一模)某班级有50名学生,现要采取系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号1~50号,并分组,第一组1~5号,第二组6~10号,…,第十组46~50号,若在第三组中抽得为12的学生,则在第八组中抽得为的学生.解析:由题意得,在第八组中抽得为12+(8-3)×5=37.答案:375.某公司为改善职工的出行条件,随机抽取50名职工,调查他们的居住地与公司的距离d(单位:千米).若样本数据分组为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],由数据绘制的频率分布直方图如图所示,则样本中职工居住地与公司的距离不超过4千米的人数为.解析:样本中职工居住地与公司的距离不超过4千米的频率为(0.1+0.14)×2=0.48,所以样本中职工居住地与公司的距离不超过4千米的人数为50×0.48=24.答案:246.导学号17504079从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85) [85,95) [95,105) [105,115) [115,125)频数 6 26 38 22 8(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解:(1)(2)质量指标值的样本平均数为=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.7.导学号17504080某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x/元8 8.2 8.4 8.6 8.8 9销量y/件90 84 83 80 75 68(1)求回归直线方程x+,其中=-20,;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1)=8.5,=80.∵=-20,,∴=80+20×8.5=250.∴回归直线方程为=-20x+250.(2)设工厂获得的利润为L元,则L=x(-20x+250)-4(-20x+250)=-20(x-8.25)2+361.25,∴该产品的单价定为8.25元时,工厂获得的利润最大.。
人教A版高中数学必修3《二章 统计 小结》优质课教案_14
第二章统计复习教案一、教学目标:1、整合本章知识点,完善知识结构,体会知识之间的相关关系,能应用所学知识解决一些简单的统计问题。
2、在归纳总结知识的过程中完善知识结构。
3、让学生在学习中自觉应用类比,数形结合等数学思想方法帮助学习。
二、教学重难点重点:构建本章(统计)的知识结构,能应用所学知识解决简单的统计问题。
难点:应用所学知识解决简单的统计问题。
三、教学方法:归纳总结法,讲练结合法四、教学用时:1课时五、教学过程设计2、用样本估计总体(1)用样本估计总体的两种情况 ①用样本的频率分布估计总体的分布.②用样本的数字特征估计总体的数字特征. (2)绘制频率分布直方图的步骤 (3)频率分布折线图和总体密度曲线频率分布直方图――――――――→连接各小长方形上端的中点频率分布折线图 ――――――――――――→样本容量不断增大,频率折线图接近于一条光滑曲线总体密度曲线 (4)茎叶图的制作步骤 ①将数据分为茎和叶两部分;②将最大茎和最小茎之间数据按大小次序排成一列; ③将各个数据的“叶”按大小次序写在茎右(左)侧.(5)数字特征①众数:一组数据中重复出现次数最多的数.②中位数:把一组数据按从小到大的顺序排列,处在中间位置(或中间两个数的平均数)的数叫做这组数据的中位数.③平均数:如果n 个数x 1,x 2,…,x n ,那么x =1n (x 1+x 2+…+x n )叫做这n 个数的平均数.④标准差的计算公式: s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2 ⑤方差的计算公式:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],想一想:众数、中位数、平均数与频率分布直方图的关系。
3、两个变量的线性相关(1)散点图:将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形. (2)正相关与负相关:① 正相关:散点图中的点散布在从左下角到右上角的区域. ② 负相关:散点图中的点散布在从左上角到右下角的区域. (3)回归直线的方程① 回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.② 回归方程:回归直线对应的方程叫做回归直线的方程,简称回归方程.二、巩固练习1、要从已编号(1—60)的60枚最新研制的某型导弹中随机抽取6枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的枚导弹的编号可能是( ) A 、5,10,15,20,25,30 B 、3,13,23,33,43,53 C 、1,2,3,4,5,6 D 、2,4,8,16,32,482、某公司现有普通职员160人,中级管理人员30人,高级管理人员10人,要从其中抽取20个人进行身体健康检查,如果采用分层抽样的方法,则普通职员,中级管理人员和高级管理人员各应该抽取多少人( )A 、8,15,7B 、16,2,2C 、16,3,1D 、12,3,5 3、右图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中位数是( ) A 、161cm B 、162cmC 、163cm D 、164cm4、为了了解某地区高中学生的身体发育情况,抽查了该地区100名年龄在17.5~18岁的男生体重(单位:kg ),得到频率分布直方图如下: 求这100名学生中体重在56.5~64.5范围内的人数.5、某商场为了调查旅游鞋的销售情况,抽取了部分顾客购鞋的尺寸,将所得数据整理后,画出频率分布直方图如下,已知图中从左到右前3个小矩形的面积之比为1︰2︰3,第二小组的频数为10. (1)求样本容量;(2)估计购鞋尺寸在37.5~43.556.5 60.5 64.5 68.5 72.56、已知某人5次上班途中所花时间的平均数为10分钟,方差为2分钟,其中有三次上班途中所花时间分别为9分钟,10分钟和11分钟,求另两次上班途中所花的时间.7、随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查了10个家庭,得数据如下:(1)判断家庭平均收入与月平均生活支出是否相关? (2)若二者线性相关,求回归直线方程.8、某工厂经过技术改造后,生产某种产品的产量x 吨与相应的生产能耗y 吨标准煤有如下几组样本数据:(1)样本数据是否具有线性相关关系?若是,求出其回归方程; (2)预测生产100吨产品的生产能耗约需多少吨标准煤?三、课堂小结1、本章中统计的相关知识。
高中数学人教A版必修三习题第二章-用样本的数字特征估计总体的数字特征含答案
;x =
5
乙
5
=30,
2.所以-x 甲<-x 乙,s 甲>s 乙.
答案:B 二、填空题 6.甲、乙两位同学某学科连续五次的考试成绩用茎叶图表示如图所示,则平均分数较 高的是________,成绩较为稳定的是________.
解析:-x
甲=70,-x 乙
=68,s甲2
=1 5
×(22+12+12+22)=2,s乙2
11
= =6. 11
答案:A
2.甲、乙两同学在高考前各做了 5 次立定跳远测试,测得甲的成绩如下(单位:米):
2.20, 2.30, 2.30, 2.40, 2.30, 若 甲 、 乙 两 人 的 平 均 成 绩 相 同 , 乙 的 成 绩 的 方 差 是
0.005,那么甲、乙两人成绩较稳定的是________. 解析:求得甲的平均成绩为 2.30米,甲的成绩的方差是 0.004.由已知得甲、乙平均成
而 2(k1-3),2(k2-3),…,2(k6-3)的平均数为 2(k -3),则所求方差为
16[4(k1--k )2+4(k2--k )2+…+4(k6-
- k )2]=4×3=12.
答案:12
8.若有一个企业,70%的员工年收入 1 万元,25%的员工年收入 3 万元,5%的员工年收
入 11万元,则该企业员工的年收入的平均数是________万元,中位数是________万元,众
乙品种的样本平均数也为 10,样本方差为
[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2)+(9.8-10)2]÷5=0.24.
因为 0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.
高中数学人教A版必修三章节综合测评 第二章《统计》3 含解析
章末综合测评(三) 概率(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列事件中,随机事件的个数为( )①在学校明年召开的田径运动会上,学生张涛获得100米短跑冠军;②在体育课上,体育老师随机抽取一名学生去拿体育器材,抽到李凯;③从标有1,2,3,4的4张号签中任取一张,恰为1号签; ④在标准大气压下,水在4℃时结冰. A .1 B .2 C .3D .4【解析】 ①在明年运动会上,可能获冠军,也可能不获冠军.②李凯不一定被抽到.③任取一张不一定为1号签.④在标准大气压下水在4℃时不可能结冰,故①②③是随机事件,④是不可能事件.【答案】 C2.下列说法正确的是( )A .甲、乙二人比赛,甲胜的概率为35,则比赛5场,甲胜3场 B .某医院治疗一种疾病的治愈率为10%,前9个病人没有治愈,则第10个病人一定治愈C .随机试验的频率与概率相等D .天气预报中,预报明天降水概率为90%,是指降水的可能性是90%【解析】 概率只是说明事件发生的可能性大小,其发生具有随机性.故选D.【答案】 D3.(2016·开封高一检测)给甲、乙、丙三人打电话,若打电话的顺序是任意的,则第一个打电话给甲的概率是( )A.16 B .13 C.12D .23【解析】 给三人打电话的不同顺序有6种可能,其中第一个给甲打电话的可能有2种,故所求概率为P =26=13.故选B.【答案】 B4.在区间[-2,1]上随机取一个数x ,则x ∈[0,1]的概率为( ) A.13 B .14 C.12D .23【解析】 由几何概型的概率计算公式可知x ∈[0,1]的概率P =1-01-(-2)=13.故选A. 【答案】 A5.1升水中有1只微生物,任取0.1升化验,则有微生物的概率为()A.0.1 B.0.2C.0.3 D.0.4【解析】本题考查的是体积型几何概型.【答案】 A6.(2016·天水高一检测)从一批产品中取出三件产品,设A=“三件产品全不是次品”,B=“三件产品全是次品”,C=“三件产品不全是次品”,则下列结论正确的是()A.A与C互斥B.B与C互斥C.任何两个均互斥D.任何两个均不互斥【解析】互斥事件是不可能同时发生的事件,所以B与C互斥.【答案】 B7.某人从甲地去乙地共走了500 m,途中要过一条宽为x m的河流,他不小心把一件物品丢在途中,若物品掉在河里就找不到,若物品不掉在河里,则能找到,已知该物品能找到的概率为45,则河宽为()A.100 m B.80 m C.50 m D.40 m【解析】设河宽为x m,则1-x500=45,所以x=100.【答案】 A8.从一批羽毛球中任取一个,如果其质量小于4.8 g 的概率是0.3,质量不小于4.85 g 的概率是0.32,那么质量在[4.8,4.85)范围内的概率是( )A .0.62B .0.38C .0.70D .0.68【解析】 记“取到质量小于4.8 g ”为事件A ,“取到质量不小于4.85 g ”为事件B ,“取到质量在[4.8,4.85)范围内”为事件C .易知事件A ,B ,C 互斥,且A ∪B ∪C 为必然事件.所以P (A ∪B ∪C )=P (A )+P (B )+P (C )=0.3+0.32+P (C )=1,即P (C )=1-0.3-0.32=0.38.【答案】 B9.如图1,矩形ABCD 中,点E 为边CD 的中点,若在矩形ABCD 内部随机取一个点Q ,则点Q 取自△ABE 内部的概率等于( ) 【导学号:28750071】图1A.14 B .13 C.12D .23【解析】 点E 为边CD 的中点,故所求的概率P =△ABE 的面积矩形ABCD 的面积=12.【答案】 C10.将区间[0,1]内的均匀随机数x 1转化为区间[-2,2]内的均匀随机数x ,需要实施的变换为( )A .x =x 1*2B .x =x 1*4C .x =x 1*2-2D .x =x 1*4-2【解析】 由题意可知x =x 1*(2+2)-2=4x 1-2. 【答案】 D11.先后抛掷两颗骰子,设出现的点数之和是12,11,10的概率依次是P 1,P 2,P 3,则( )A .P 1=P 2<P 3B .P 1<P 2<P 3C .P 1<P 2=P 3D .P 3=P 2<P 1【解析】 先后抛掷两颗骰子的点数共有36个基本事件:(1,1),(1,2),(1,3),…,(6,6),并且每个基本事件都是等可能发生的.而点数之和为12的只有1个:(6,6);点数之和为11的有2个:(5,6),(6,5);点数之和为10的有3个:(4,6),(5,5),(6,4),故P 1<P 2<P 3.【答案】 B12.在5件产品中,有3件一等品和2件二等品,从中任取2件,则下列选项中以710为概率的事件是( )A .恰有1件一等品B .至少有一件一等品C .至多有一件一等品D .都不是一等品【解析】 将3件一等品编号为1,2,3,2件二等品编号为4,5,从中任取2件有10种取法:(1,2),(1,3),(1,4),(1,5),(2,3),(2,4),(2,5),(3,4),(3,5),(4,5).其中恰含有1件一等品的取法有:(1,4),(1,5),(2,4),(2,5),(3,4),(3,5),恰有1件一等品的概率为P 1=610,恰有2件一等品的取法有:(1,2),(1,3),(2,3).故恰有2件一等品的概率为P 2=310,其对立事件是“至多有一件一等品”,概率为P 3=1-P 2=1-310=710.【答案】 C二、填空题(本大题共4小题,每小题5分,共20分,把答案填在题中横线上).13.一个袋子中有5个红球,3个白球,4个绿球,8个黑球,如果随机地摸出一个球,记A ={摸出黑球},B ={摸出白球},C ={摸出绿球},D ={摸出红球},则P (A )=________;P (B )=________;P (C ∪D )=________.【解析】 由古典概型的算法可得P (A )=820=25,P (B )=320,P (C ∪D )=P (C )+P (D )=420+520=920.【答案】 25 320 92014.在区间(0,1)内任取一个数a ,能使方程x 2+2ax +12=0有两个相异实根的概率为________.【解析】 方程有两个相异实根的条件是Δ=(2a )2-4×1×12=4a 2-2>0,解得|a |>22,又a ∈(0,1),所以22<a <1,区间⎝ ⎛⎭⎪⎫22,1的长度为1-22,而区间(0,1)的长度为1,所以方程有两个相异实根的概率为1-221=2-22.【答案】 2-2215.甲、乙两组各有三名同学,他们在一次测验中的成绩的茎叶图如图2所示,如果分别从甲、乙两组中各随机选取一名同学,则这两名同学的成绩相同的概率是________.图2【解析】 由题意可知从甲、乙两组中各随机选取一名同学,共有9种选法,其中这两名同学的成绩相同的选法只有1种,故所求概率P =19.【答案】 1916.(2016·合肥高一检测)甲乙两人玩猜数字游戏,先由甲心中任想一个数字记为a ,再由乙猜甲刚才想的数字,把乙猜的数字记为b ,且a、b∈{0,1,2,…,9}.若|a-b|≤1,则称甲乙“心有灵犀”.现任意找两人玩这个游戏,则二人“心有灵犀”的概率为________.【解析】此题可化为任意从0~9中取两数(可重复)共有10×10=100种取法.若|a-b|≤1分两类,当甲取0或9时,乙只能猜0、1或8、9共4种,当甲取2~8中的任一数字时,分别有3种选择,共3×8=24种,所以P=24+410×10=725.【答案】7 25三、解答题(本大题共6小题,共70分,解答应写出文字说明、证明过程或演算步骤)17.(本小题满分10分)(2015·陕西高考)随机抽取一个年份,对西安市该年4月份的天气情况进行统计,结果如下:(1)在4月份任取一天,估计西安市在该天不下雨...的概率;(2)西安市某学校拟从4月份的一个晴天..开始举行连续2天的运动会,估计运动会期间不下雨...的概率. 【解】 (1)在容量为30的样本中,不下雨的天数是26,以频率估计概率,4月份任选一天,西安市不下雨的概率为2630=1315.(2)称相邻的两个日期为“互邻日期对”(如,1日与2日,2日与3日等).这样,在4月份中,前一天为晴天的互邻日期对有16个,其中后一天不下雨的有14个,所以晴天的次日不下雨的频率为78.以频率估计概率,运动会期间不下雨的概率为78.18.(本小题满分12分)对某班一次测验成绩进行统计,如下表所示:(1)求该班成绩在[80,100]内的概率; (2)求该班成绩在[60,100]内的概率.【解】 记该班的测试成绩在[60,70),[70,80),[80,90),[90,100]内依次为事件A ,B ,C ,D ,由题意知事件A ,B ,C ,D 是彼此互斥的.(1)该班成绩在[80,100]内的概率是P (C ∪D )=P (C )+P (D )=0.25+0.15=0.4.(2)该班成绩在[60,100]内的概率是P (A ∪B ∪C ∪D )=P (A )+P (B )+P (C )+P (D )=0.17+0.36+0.25+0.15=0.93.19.(本小题满分12分)小王、小李两位同学玩掷骰子(骰子质地均匀)游戏,规则:小王先掷一枚骰子,向上的点数记为x;小李后掷一枚骰子,向上的点数记为y.(1)在直角坐标系xOy中,以(x,y)为坐标的点共有几个?(2)规定:若x+y≥10,则小王赢;若x+y≤4,则小李赢,其他情况不分输赢.试问这个游戏规则公平吗?请说明理由. 【导学号:28750072】【解】(1)由于x,y取值为1,2,3,4,5,6,则以(x,y)为坐标的点有:(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,2),(2,3),(2,4),(2,5),(2,6),(3,1),(3,2),(3,3),(3,4),(3,5),(3,6),(4,1),(4,2),(4,3),(4,4),(4,5),(4,6),(5,1),(5,2),(5,3),(5,4),(5,5),(5,6),(6,1),(6,2),(6,3),(6,4),(6,5),(6,6),共有36个,即以(x,y)为坐标的点共有36个.(2)满足x+y≥10的点有:(4,6),(5,5),(5,6),(6,4),(6,5),(6,6),共6个,所以小王赢的概率是636=1 6,满足x+y≤4的点有:(1,1),(1,2),(1,3),(2,1),(2,2),(3,1),共6个,所以小李赢的概率是636=1 6,则小王赢的概率等于小李赢的概率,所以这个游戏规则公平.20.(本小题满分12分)(2014·天津高考)某校夏令营有3名男同学A,B,C和3名女同学X,Y,Z,其年级情况如下表:现从这6名同学中随机选出2人参加知识竞赛(每人被选到的可能性相同).(1)用表中字母列举出所有可能的结果;(2)设M为事件“选出的2人来自不同年级且恰有1名男同学和1名女同学”,求事件M发生的概率.【解】(1)从6名同学中随机选出2人参加知识竞赛的所有可能结果为{A,B},{A,C},{A,X},{A,Y},{A,Z},{B,C},{B,X},{B,Y},{B,Z},{C,X},{C,Y},{C,Z},{X,Y},{X,Z},{Y,Z},共15种.(2)选出的2人来自不同年级且恰有1名男同学和1名女同学的所有可能结果为{A,Y},{A,Z},{B,X},{B,Z},{C,X},{C,Y},共6种.因此,事件M发生的概率P(M)=615=25.21.(本小题满分12分)(2014·四川高考)一个盒子里装有三张卡片,分别标记有数字1,2,3,这三张卡片除标记的数字外完全相同.随机有放回地抽取3次,每次抽取1张,将抽取的卡片上的数字依次记为a,b,c.(1)求“抽取的卡片上的数字满足a +b =c ”的概率;(2)求“抽取的卡片上的数字a ,b ,c 不完全相同”的概率.【解】 (1)由题意知,(a ,b ,c )所有的可能为(1,1,1),(1,1,2),(1,1,3),(1,2,1),(1,2,2),(1,2,3),(1,3,1),(1,3,2),(1,3,3),(2,1,1),(2,1,2),(2,1,3),(2,2,1),(2,2,2),(2,2,3),(2,3,1),(2,3,2),(2,3,3),(3,1,1),(3,1,2),(3,1,3),(3,2,1),(3,2,2),(3,2,3),(3,3,1),(3,3,2),(3,3,3),共27种.设“抽取的卡片上的数字满足a +b =c ”为事件A ,则事件A 包括(1,1,2),(1,2,3),(2,1,3),共3种.所以P (A )=327=19.因此,“抽取的卡片上的数字满足a +b =c ”的概率为19.(2)设“抽取的卡片上的数字a ,b ,c 不完全相同”为事件B ,则事件B 包括(1,1,1),(2,2,2),(3,3,3),共3种.所以P (B )=1-P (B )=1-327=89.因此,“抽取的卡片上的数字a ,b ,c 不完全相同”的概率为89.22.(本小题满分12分)把参加某次铅球投掷的同学的成绩(单位:米)进行整理,分成以下6个小组:[5.25,6.15),[6.15,7.05),[7.05,7.95),[7.95,8.85),[8.85,9.75),[9.75,10.65],并绘制出频率分布直方图,如图3所示是这个频率分布直方图的一部分.已知从左到右前5个小组的频率分别为0.04,0.10,0.14,0.28,0.30,第6小组的频数是7.规定:投掷成绩不小于7.95米的为合格.图3(1)求这次铅球投掷成绩合格的人数;(2)你认为这次铅球投掷的同学的成绩的中位数在第几组?请说明理由;(3)若参加这次铅球投掷的学生中,有5人的成绩为优秀,现在要从成绩优秀的学生中,随机选出2人参加相关部门组织的经验交流会,已知a、b两位同学的成绩均为优秀,求a、b两位同学中至少有1人被选到的概率.【解】(1)∵第6小组的频率为1-(0.04+0.10+0.14+0.28+0.30)=0.14.∴参加这次铅球投掷的总人数为70.14=50.根据规定,第4、5、6组的成绩均为合格,人数为(0.28+0.30+0.14)×50=36.(2)∵成绩在第1、2、3组的人数为(0.04+0.10+0.14)×50=14,成绩在第5、6组的人数为(0.30+0.14)×50=22,参加这次铅球投掷的总人数为50,∴这次铅球投掷的同学的成绩的中位数在[7.95,8.85)内,即第4组.(3)设这次铅球投掷成绩优秀的5人分别为a、b、c、d、e,则选出2人的所有可能的情况为:ab,ac,ad,ae,bc,bd,be,cd,ce,de,共10种,其中a、b至少有1人的情况为:ab,ac,ad,ae,bc,bd,be,共有7种,∴a、b两位同学中至少有1人被选到的概率为P=7 10.。
高中数学 第二章 统计小结与复习教案 新人教A版必修3-新人教A版高一必修3数学教案
第二章统计教学目标重点:会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的问题.难点:能通过对数据的分析,为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异.能力点:如何利用样本对总体的分布规律、整体水平、稳定程度及相关关系等特性进行估计和预测.教育点:提高学生的认知水平,为学生塑造良好的数学认识结构.自主探究点:例题及变式的解题思路的探寻.易错点:由于学生运算能力差,因此求回归直线方程涉及的运算学生容易出错.学法与教具1.学法:讲授法、讨论法.2.教具:学案导学.(1)作样本频率分布直方图的步骤:注意:频率分布直方图纵坐标表示:____________.(2)茎叶图作图步骤:(3)直方图与茎叶图的优缺点:3.用样本的数据特征估计总体的数据特征(1)利用频率直方图中估计众数、平均数、中位数的值:估计众数______________________________________.估计平均数____________________________________.估计中位数____________________________________.(2)标准差与方差的公式:标准差____________________s=.方差2_____________________s=.(3)标准差与方差的作用:4.变量间的相关关系(1)两变量间的关系有:________________和________________.(2)两变量相关关系的确定方法:____________________________________.(3)用最小二乘法求回归直线方程的步骤:(二)基础检测1.某社区有500个家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户,为了调查社会购买力的某项指标,要从中抽取1个容量为100户的样本,记做①;某学校高一年级有12名女排运动员,要从中选出3个调查学习负担情况,记做②.那么完成上述2项调查应采用的抽样方法分别是________________.答案:分层抽样,简单随机抽样.2.一个总体的60个个体的编号为0,1,2,…,59,现要从中抽取一个容量为10的样本,请根据编号按被6样本,则抽取的样本号码是_______________.答案:3,9,15,21,27,33,39,45,51,3.(12山东文高考) 右图是根据部分城市某年6气温(单位:℃)数据得到的样本频率分布直方图气温的范围是[20.5,26.5],样本数据的分组为[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为_________.答案:9./第3题图4.(10山东理)样本中共有五个个体,其值分别为a ,0,1,2,3, 若该样本的平均值为1,则样本方差为_______________. 答案:2.5.(11辽宁)调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 和年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:0.2540.321y x =+.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_______________万元.答案:0.254. 三、【范例导航】例1.一汽车厂生产A ,B ,C 三类轿车,每类轿车均有舒适型和标A 类轿车10辆.(1)求z 的值; (2)B 类,C 类轿车各应抽取多少? (3)在C 类轿车中,按型号分层抽样,应各抽取多少?【分析】按类分层或者是按型号分层,抽样比是相同的.【解答】(1)设该厂这个月共生产轿车n 辆,则由题意得5010,100300n =+所以2000n =, 则2000(100300)150450600400z =-+---=.(2)B 类轿车共有150+450=600(辆).按抽样比10400抽取,则应抽取1060015400⨯=(辆). 同理,C 类应抽取10(400600)25400+⨯=(辆).(3)在C 类轿车中,按型号抽样时抽样比仍为140.则舒适型应抽取14001040⨯=(辆);标准型应抽取16001540⨯=(辆).【点评】通过本题的具体计算可看出,无论是按类抽取还是按型号抽取,每个个体入样的概率都是140. 变式训练:为了了解参加某种知识竞赛的1000名学生的成绩,要从中抽取50名学生的成绩,采用什么抽样方法比较恰当?简述抽样过程. 答案:适宜选用系统抽样,抽样过程如下:(1)随机地将这1000名学生编号为1,2,3,,1000;(2)将总体按编号顺序均分成50部分,每部分包括20个个体; (3)在第一部分的个体编号1,2,3,,20中,利用简单随机抽样抽取一个号码,比如是18;(4) 以18为起始号码,每间隔20抽取一个号码,这样得到一个容量为50的样本:18,38,58,, 998. 小结:1.三种抽样方法的共同特点是在抽样过程中每个个体被抽取的机会相同,体现了这些抽样方法的客观性和公平性.2.当总体中的个体数较少时,常采用简单随机抽样;当总体中的个体数较多时,常采用系统抽样;当总体中的个体有明显的层次差异,层次分明时,常采用分层抽样.3.系统抽样时要注意所得样本号码的特点,而分层抽样要正确确定抽样的比例.例2.为了了解高二学生的体能情况,我校抽取部分高二学生进行一分钟跳绳次数测试,将所得数据整理后,图所示,图中左到右各小长方型的面积之比为小组频数为12.问:(1)(2)(3)求一分钟跳绳的众数,中位数和平均数.(4)若一分钟跳绳次数在110次以上(含110试估计该校全体高一学生的达标率是多少?【分析】(1)考查频率分布折线图与频率分布直方图的关系; (2)根据从左到右各小长方形的面积之比为 2:4:17:15:9:3,第二小组频数为12,用比值做出样本容量.做出的样本容量和第二小组的频率.(3)在频率分布直方图中最高的小长方形的底边的中点就是这组数据的众数的估计值,处在把频率分布直方图所有的小长方形的面积分成两部分的一条垂直与横轴的线对应的横标就是中位数的估计值,平均数的估计值是频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(4)根据上面做出的样本容量和前两个小长方形所占的比例,用所0.034 0.0180.03有的符合条件的样本个数之和,除以样本容量得到概率. 【解答】(1)如图所示(2)∵从左到右各小长方形的面积之比为 2:4:17:15:9:3,第二小组频数为12.∴样本容量是(24171593)121504+++++⨯=∴第二小组的频率是 120.08150=.(3)由图可知众数为1101201152+=,又∵前三个小矩形的面积之和为0.46.∴设中位数为120+x ,则0.460.030.5x +⨯=,得x =43,∴中位数为3643,而平均数为0.04950.081050.341150.31250.181350.06145121.8⨯+⨯+⨯+⨯+⨯+⨯=.(4)∵次数在110次以上(含110次)为达标,∴在这组数据中达标的个体数一共有17+15+9+3, ∴全体学生的达标率估计是1715930.8850+++=.【点评】本题考查频率分步直方图的应用,是一个基础题,这种题目解题的关键是看清图中所给的条件,知道小长方形的面积就是这组数据的频率. 变式训练:1.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图为如图(1)根据茎叶图判断哪个班的平均身高较高;用茎叶图分析数据的好处?(2)分别计算甲班、乙班的样本平均数及方差;(3)根据计算结果对两班的身高用其稳定性进行比较,写出统计结论. 答案:(1)由茎叶图不难看出乙班的平均身高较高;用茎叶图处理现有的数据不但可以看出数据的分布情况, 而且可以看出每组中的具体数据.(2)由茎叶图,得甲班的10名同学的身高分别为182 179 179 171 170 168 168 163 162 158甲班 乙班 18171615 3 73 6 8 9 2 5 8 99 9 1 0 2 8 8 3 2 8183 187 173 176 178 179 162 165 168 159, 得他们的平均身高为2173x cm =,22277.2s cm =.(3)由(2)的计算结果可以发现甲班的平均身高为170cm ,乙班的平均身高为173cm .由此可知乙班的平均身高比甲班的平均身高高,但乙班的身高不够稳定,而甲班的身高比较集中在平均身高附近. 2.某次数学考试中,高一(20)班有20人成绩记录如下:(单位:分)125 121 123 125 127 129 125 128 130 129 126 124 125 127 126 122 124 125 126 128王老师想做出以上数据的频率分布直方图,他把这些数据分成5组,分组情况为[120.5,122.5),[122.5,124.5),[124.5,126.5),[126.5,128.5),[128.5,130.5].(1)请你帮他完成频率分布直方图;(2)根据画出的直方图,求这组数据的众数、中位数、平均数. 答案:(1)略. (2) 众数为125.5,中位数为125.75,平均数为125.8. 小结:1.用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行列表、作图处理,列表与作图时要注意其方法步骤;对于茎叶图要正确画图,能够根据图中所给的数据进行分析.2.在频率分布直方图中能够正确估计样本数据的众数、中位数、平均数,并且知道它们给分析数据带来的不同影响,不同的数字特征代表着不同的信息.由于需要不同信息而选择不同的数字特征,对同一组数据的评价可能会相差很大.3.会计算样本数据的方差、标准差,知道它们的作用;在实际应用中当所得数据平均数不同时,须先分析平均水平,再计算标准差(方差)分析稳定情况.例3.假设关于某设备的使用年限x 和所支出的维修费用y (万元)(1)性回归方程y bx a =+的回归系数 b ,a ;(2)估计使用年限为10年时的维修费用.【分析】(1)利用散点图可直接判断两变量是否线性相关;再利用公式1122211()(),()n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑a y bx =-来计算回归系数.有时为了计算方便常制表对应求出2,,i i i x y x ,以利于求和.(2)获得线性回归方程后,取x =10即得所求. 【解答】(1)散点图如图所示: 由散点图可知两变量线性相关.于是有2112.3 1.23905410b -===-⨯,5 1.2340.08a y bx =-=-⨯=.(2)回归直线方程是 1.230.08y x =+,当x =10(年)时,1.23100.0812.38y =⨯+=(万元),即估计使用10年时维修费用是12.38万元. 【点评】判断两变量是否线性相关一种简便可行的方法就是绘制散点图.根据散点图可以很容易看出两个变量是否具有相关关系.只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测. 变式训练:1.小王记录了产量x (吨)和能耗y (吨标准煤)对应的四组数据,用最小二乘法求出了0.70.35y x =+,不慎将一滴墨水滴于表内,表中第二行第四列的数据已无法看清,据您判断这个数据应该是多少?答案:2.某数学老师身高176cm ,他爷爷、父亲和儿子的身高分别是173cm 、170cm 和182cm .因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高是多少cm ?答案:185cm . 小结:求线性回归直线方程应注意:先画散点图判断两变量是否线性相关;若线性相关,再利用公式计算,a b 的值,进而求出回归直线方程,但要注意运算顺序;然后就可以利用回归方程进行估计和预测. 四、【解法小结】1.对于随机抽样问题:掌握三种抽样方法的区别与联系,系统抽样的样本号码的特点以及分层抽样的比例的确定.2.应用频率分布直方图时,需明确纵轴表示的是频率/组距,进而进行相关计算.3.对于标准差、方差记准公式,知道其作用.4.掌握用最小二乘法求回归直线方程的步骤,注意运算顺序. 五、【布置作业】 必做题:1.(2012山东理高考)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为 1,2,,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间 [1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为_______________.2. (2012湖北文高考)一支田径运动队有男运动员56人,女运动员42人.现用分层抽样的方法抽取若干人,若抽取的男运动员有8人,则抽取的女运动员有_______________人.3.(2013山东文高考)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91分.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则7个剩余分数的方差是_______________.4.(2011广东高考)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x法,预测小李该月6号打6小时篮球的投篮命中率为___________. 5.(2012广东文高考)某校100位学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是8 9 7 74 0 1 0 x 9 10.04 0.03 0.02[70,80),[80,90),[90,100]. (1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分; (3)若这100名学生的语文成绩某些分数段的人数x 与数学成绩 相应分数段的人数y 之比如下表所示,求数学成绩在[50,90) 之外的人数.6.某学校高一(3)班甲、乙两名同学的最近5次(1)(2)分别用平均数和中位数分析甲、乙两位同学中,哪位同学成绩较好;(3)(单位:分)如下:并说明理由.必做题答案:1.10 2. 6 3.3674. 0.5, 0.535. (1) a =0.005 (2)73 (3)106.(1)甲的平均分、中位数分别为90、95,乙的平均分、中位数分别为86、98;(2)从平均分看,甲的平均分高,甲的成绩较好;从中位数看,乙的中位数大,乙的成绩较好.(3)丙的平均数、中位数、方差分别为90、90、44.4,甲的方差为158.8.由于两人的平均分相同,所以从平均分看,甲、丙成绩同样好;从中位数看,甲的中位数高,甲的成绩高;从方差看,丙的方差小,丙的成绩较稳定,所以丙的成绩好. 选做题:(2012山西模拟)如下图,图甲是某市有关部门根据对当地干部的月收入情况调查后画出的样本频率分布直方图,已知图甲中从左向右第一组的频数为4000.在样本中记月收入在[1000,1500),[1500,2000),[2000,2500),[2500,3000),[3000,3500),[3500,4000)的人数依次为A1,A2,…,A6.图乙是统计图中月工资收入在一定范围内的人数的程序框图,图乙输出的S=______________.(用数字作答).0.00080.00040.00030.000250.000150.0001。
高中数学必修3(人教A版)第二章统计2.1知识点总结含同步练习及答案
⑤确定样本:从总体中找出与号签上的号码对应的个体,组成样本.
随机数表法是随机数表由数字 0 ,1 ,2,3,⋯,9 这 10 个数字组成,并且每个数字在表中 各个位置上出现的机会都是一样的,通过随机数表,根据实际需要和方便使用的原则,将几个数
组成一组,然后通过随机数表抽取样本.随机数表的优点是简单易行,它很好的解决了当总体中
样.因为 50 名官兵是从中挑出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单 随机抽样中“等可能抽样”的要求.(3)是简单随机抽样.因为总体中的个体数是有限的,并且
是从总体中逐个进行抽取的,是不放回、等可能的抽取.
2013年第27届世界大学生运动会在俄罗斯举行,为了支持这次运动会,某大学从报名的 20 名大 三学生中选取 6 人组成志愿小组,请用抽签法设计抽样方案. 解:(1)将 20 名志愿者编号,编号为 1,2,3,4,⋯,20; (2)将 20 个号码分别写在 20 张形状相同的卡片上,制成号签; (3)将 20 张卡片放入一个不透明的盒子里,搅拌均匀; (4)从盒子中逐个不放回地抽取 6 个号签,并记录上面的号码;
A.2
B.3
C.6
D.7
解:C
间隔相等,所以 126 − 8 × 15 = 6.
4.分层抽样
描述: 将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在 总体中所占比例进行简单随机抽样或系统抽样,这种抽样的方法叫做分层抽样.当总体由明显差 别的几部分组成时,为了使抽取样本更好地反映总体的情况,常采用分层抽样.
③简单随机抽样是一种不放回抽样.
④简单随机抽样是一种等可能的抽样,每个个体被抽取到的可能性均为
n N
.
常用的简单随机抽样方法有抽签法和随机数表法.
2020届高中数学分册同步讲义(必修3) 第2章 专题突破一 例析频率分布直方图中的统计问题
专题突破一例析频率分布直方图中的统计问题一、求样本中限制条件下的个体所占频率例1观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在[2 700,3 000)的频率为()A.0.001 B.0.1C.0.2 D.0.3思维切入求对应区间上的小矩形的面积.答案 D解析由直方图的意义可知,在区间[2 700,3 000)内取值的频率为(3 000-2 700)×0.001=0.3. 点评频率为直方图中相应小长方形的面积,即频率=纵坐标×横坐标差的绝对值.跟踪训练1某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分),现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图如下图所示.已知图中从左到右的第一、三、四、五小组的频率分别为0.30,0.15,0.10,0.05,而第二小组的频数是40,则参赛的人数是________,成绩优秀的频率是________. 答案 100 0.15解析 设参赛的人数为n ,第二小组的频率为1-(0.30+0.15+0.10+0.05)=0.4, 依题意40n=0.4,∴n =100,优秀的频率是0.10+0.05=0.15. 二、求样本中限制条件下的个体的频数例2 某市高三数学抽样考试中,对90分以上的成绩进行统计,其频率分布如图所示.若130~140分数段的人数为90,则90~100分数段的人数为________.思维切入 对应区间上的频数即为对应区间的频率×样本总体. 答案 810解析 由于90分以上的考试人数是样本总体,则图中5个分数段的频率之和等于1,设130~140分数段的频率为p ,则0.45+0.25+0.15+0.10+p =1,即0.95+p =1,则p =0.05,设该样本总体共有n 个学生的分数,且设90~100分数段的人数为x ,则由频率概念得⎩⎪⎨⎪⎧ 0.05×n =90,0.45×n =x ,解得⎩⎪⎨⎪⎧n =1 800,x =810,故90~100分数段的人数为810. 点评 本题是频率分布条形图.由于各分数段的人数与频率成正比,则可由x 90=0.450.05,求出x ;题设条形图的纵坐标是“频率”这是有别于常规的,在审题时不能混淆.跟踪训练2 为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.答案 12解析 志愿者的总人数为20(0.24+0.16)×1=50,所以第三组人数为50×0.36×1=18, 所以有疗效的人数为18-6=12. 三、求频率分布直方图中的参数问题例3 为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力,得到频率分布直方图,如图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a ,视力在4.6到5.0之间的学生数为b ,则a ,b 的值分别为( )A .0.27,78B .0.27,83C .2.7,78D .2.7,83思维切入 根据频率分布直方图的性质列方程求解. 答案 A解析 注意到纵轴表示频率组距,由图象可知,前4组的公比为3,最大频率a =0.1×33×0.1=0.27, 设后6组公差为d ,则0.01+0.03+0.09+0.27×6+5×62·d =1,解得d =-0.05,即后6组频率的公差为-0.05, 所以,视力在4.6到5.0之间的学生数为 (0.27+0.22+0.17+0.12)×100=78, 故选A.点评 解答本题关键是要利用频率分布直方图中残缺不全的数据,分析它们之间存在的内在关系.跟踪训练3 某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图所示),其中上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100]. (1)求频率分布直方图中x 的值;(2)如果上学所需时间不少于1小时的学生可申请在学校住宿,请估计学校600名新生中有多少名学生可以申请住宿.解(1)由频率分布直方图可得20×x+0.025×20+0.006 5×20+0.003×2×20=1,所以x=0.012 5.(2)由频率分布直方图可知,新生上学所需时间不少于1小时的频率为0.003×2×20=0.12.因为600×0.12=72,所以估计600名新生中有72名学生可以申请住宿.四、频率分布直方图中的数字特征例4从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).(1)由图中数据求a的值;(2)若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为多少?(3)估计这所小学的小学生身高的众数、中位数(保留两位小数)及平均数.思维切入众数即为出现次数最多的数,所以它的频率最大,在最高的小矩形中.中位数即为从小到大中间的数(或中间两数的平均数).解(1)因为直方图中的各个矩形的面积之和为1,所以10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030.(2)由直方图知,身高在[120,130),[130,140),[140,150]三组的学生总数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]的学生人数为10,所以从身高在[140,150]内选取的学生人数为1860×10=3.(3)根据频率分布直方图知,身高在[110,120)的小矩形最高,所以这所小学的小学生身高的众数为110+1202=115(cm).又0.005×10+0.035×10=0.4<0.5,0.4+0.030×10=0.7>0.5,所以中位数在[120,130)内,可设为x,则(x-120)×0.030+0.4=0.5,解得x≈123.33,所以中位数为123.33 cm.根据频率分布直方图,计算平均数为105×0.05+115×0.35+125×0.3+135×0.2+145×0.1=124.5(cm).点评用频率分布直方图求得的众数、中位数不一定是样本中的具体数.跟踪训练4某工厂对一批新产品的长度(单位:mm)进行检测,如图是检测结果的频率分布直方图,据此估计这批产品的中位数为()A.20 B.25 C.22.5 D.22.75答案 C解析产品的中位数出现在频率是0.5的地方.自左至右各小矩形的面积依次为0.1,0.2,0.4,0.15,0.15,设中位数是x,则由0.1+0.2+0.08×(x-20)=0.5,得x=22.5,故选C.1.统计某校1 000名学生的数学水平测试成绩,得到样本的频率分布直方图如图所示.若满分为100分,规定不低于60分为及格,则及格率是()A.20% B.25% C.60% D.80%答案 D2.在中秋的促销活动中,某商场对9月14日9时到14时的销售额进行统计,其频率分布直方图如图所示,已知12时到14时的销售额为7万元,则10时到11时的销售额为()A.1万元B.2万元C.3万元D.4万元答案 C3.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.答案94.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(元)月收入段应抽出________人.答案25解析由频率分布直方图可得[2 500,3 000)(元)月收入段共有10 000×0.000 5×500=2500(人),按分层抽样应抽出2 500×10010 000=25(人).5.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.估计居民月均用水量的中位数.解由(0.08+0.16+a+0.42+0.50+a+0.12+0.08+0.04)×0.5=1,解得a=0.30.设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.6.某市居民用水拟实行阶梯水价.每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如图所示的频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/方立米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.解(1)由用水量的频率分布直方图知,该市居民该月用水量在区间[0.5,1),[1,1.5),[1.5,2),[2,2.5),[2.5,3)内的频率依次为0.1,0.15,0.2,0.25,0.15.所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,w至少定为3.(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:根据题意,该市居民该月的人均水费估计为4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).一、选择题1.从向阳小区抽取100户居民进行月用电量调查,为制定阶梯电价提供数据,发现其月用电量都在50到350度之间,制作频率分布直方图(如图所示)的工作人员粗心大意,位置t处未标明数据,则t等于()A.0.004 1 B.0.004 2C.0.004 3 D.0.004 4答案 D解析由题意得50×(0.006+t+0.003 6+0.002 4×2+0.001 2)=1,故t=0.004 4.故选D. 2.有一容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12]内的频数为()A.18 B.36 C.54 D.72答案 B解析易得样本数据落在区间[10,12]内的频率为0.18,则样本数据落在区间[10,12]内的频数为36.3.测量某地新生婴儿的体重,得到其频率分布直方图如图所示,则新生婴儿的体重(单位:g)在[2 700,3 000)的频率为()A.0.001 B.0.1 C.0.2 D.0.3答案 D解析由频率分布直方图可知,所求频率为0.001×300=0.3.4.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据频率分布直方图可知,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56 B.60 C.120 D.140答案 D解析设所求人数为N,则N=2.5×(0.16+0.08+0.04)×200=140,故选D.5.如图是某班50名学生身高的频率分布直方图,那么身高(单位:cm)在区间[150,170)内的学生人数为()A.16 B.20 C.22 D.26答案 B解析根据频率分布直方图可知身高在区间[150,170)内的频率为(0.01+0.03)×10=0.4,所以身高在区间[150,170)内的学生人数为50×0.4=20,故选B.6.某学校对高二年级一次考试进行抽样分析,如图是根据抽样分析后的考试成绩绘制的频率分布直方图,其中抽样成绩的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中成绩小于100分的人数是36.则样本中成绩大于或等于98分且小于104分的人数是()A.90 B.75 C.60 D.45答案 A解析因为样本中成绩小于100分的人数是36,其对应频率之和为0.050×2+0.100×2=0.3,所以样本总数为36÷0.3=120,所以样本中成绩大于或等于98分且小于104分的人数为120×2×(0.100+0.150+0.125)=90,故选A.7.如图是某校高一一次数学考试成绩的样本频率分布直方图(样本容量n=200),若成绩不低于60分为及格,则样本中的及格人数是()A.6 B.36 C.60 D.120答案 D解析由题中频率分布直方图得,成绩不低于60分的人数为(0.012+0.018)×20×200=120.8.为了解学生在课外活动方面的支出情况,抽取了n 个同学进行调查,结果显示这些学生的支出金额(单位:元)都在[10,50]内,其中支出金额在[30,50]内的学生有117人,频率分布直方图如图所示,则n 等于( )A .180B .160C .150D .200 答案 A解析 [30,50]对应的概率为1-()0.01+0.025×10=0.65,所以n =1170.65=180. 二、填空题9.为了解某一段公路汽车通过时的车速情况,现随机抽测了通过这段公路的200辆汽车的时速,所得数据均在区间[40,80]中,其频率分布直方图如图所示,则在抽测的200辆汽车中,时速在区间[40,60)内的汽车有________辆.答案 80解析 由频率分布直方图得:时速在区间[40,60)内的汽车的频率为(0.01+0.03)×10=0.4.∴时速在区间[40,60)内的汽车有0.4×200=80(辆).10.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用的时间的条形图(如图所示)根据条形图可得这50名学生这一天平均每人的课外阅读时间为________.答案0.9解析这50名学生这一天平均每人的课外阅读时间为(0×5+0.5×20+1.0×10+1.5×10+2.0×5)÷50=0.9(小时).故选B.三、解答题11.为了了解小学生的体能情况,抽取某校一个年级的部分学生进行一分钟跳绳次数的测试,将数据整理后,画出频率分布直方图如图所示.已知图中从左到右前三个小组的频率分别为0.1,0.3,0.4,且第一小组的频数为5.(1)求第四小组的频率;(2)求参加这次测试的学生的人数;(3)若一分钟跳绳次数在75次以上(含75次)为达标,试估计该年级学生跳绳测试的达标率.解(1)第四小组的频率为1-0.1-0.3-0.4=0.2.(2)设参加这次测试的学生有x人,则0.1x=5,解得x=50,故参加这次测试的学生有50人.(3)由题意及频率分布直方图知,样本数据的达标率约为0.3+0.4+0.2=0.9,∴可估计该年级学生跳绳测试的达标率为90%.12.为组织好“市九运会”,组委会征集了800名志愿者,现对他们的年龄调查统计后,得到如图所示的频率分布直方图,但是年龄在[25,30)内的数据不慎丢失,依据此图可得:(1)年龄分组[25,30)对应小长方形的高度为________.(2)这800名志愿者中年龄在[25,35)内的人数为________.答案(1)0.04(2)440解析(1)因为各个小长方形的面积之和为1,所以年龄分组[25,30)对应小长方形的高度为1-(5×0.01+5×0.07+5×0.06+5×0.02)5=0.04.(2)年龄在[25,35)内的频率为0.04×5+0.07×5=0.55,人数为0.55×800=440.13.某校100名学生的期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)若这100名学生的语文成绩在某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.解 (1)由频率分布直方图知(2a +0.02+0.03+0.04)×10=1,解得a =0.005.(2)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)分数段的人数依次为0.005×10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20. 由题中给出的比例关系知数学成绩在上述分数段的人数依次为 5,40×12=20,30×43=40,20×54=25.故数学成绩在[50,90)之外的人数为100-(5+20+40+25)=10.。
【公开课】高中数学必修3第二章《统计》小结与复习课件
标准差:s s2 ( x1 x)2 ( xn x)2 n
12
分析样本的分布情况可用 样本的频率分布表
样本的频率分布直方图
频率分布直方图的特征: (1)从频率分布直方图可以清楚的看出数据分布的
总体趋势。 (2)从频率分布直方图得不出原始的数据内容,每
个小矩形的面积等于此项的概率,所有面积和为1.
9
4.分层抽样步骤:
(1) 将总体按一定标准分层; (2) 计算各层的个体数与总体的个体数的
比;抽样比k=n/N (3) 按比例确定各层应抽取的样本数目 (4) 在每一层进行抽样(可用简单随机抽样
或系统抽样)
10
类别 抽样方式 使用范围 共同点 相互联系
简单随机 从总体中逐 总体中个体
抽样
个抽取
20
2
总体、个体、样本、样本容量
总体:在统计中,所有考察对象的全体。 个体:总体中的每一个考察对象。 样本:从总体中抽取的一部分个体叫做 这个总体的一个样本。 样本容量:样本中个体的数目。
3
抽样方法:
(1)简单随机抽样 (抽签法、随机数法) (2)系统抽样 (3)分层抽样
4
1、抽签法步骤
(1)先将总体中的所有个体(共有N个) 编号(号码可从0到N-1). (2)把号码写在形状、大小相同的号签上, 号签可用小球、卡片、纸条等制作。 (3)将这些号签放在同一个容器中,搅拌均 匀。 (4)抽签时,每次从中抽出一个号签,连续 抽取n次。 (5)抽出样本。
人数
5
8
10
22
33
20
区间界限 [146,150) [150,154) [154,158)
人数
11
6
5
高中数学 第二章 统计 2.1 随机抽样教材习题点拨 新人教B版必修3-新人教B版高中必修3数学试题
高中数学第二章统计 2.1 随机抽样教材习题点拨新人教B版必修3练习A1.什么是简单随机抽样?解:一般地,从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.2.在一般“调查”时,为什么要进行抽样调查?解:做一般“调查”最好是对每一个个体逐一进行“调查”,但这样做有时费时、费力,有时根本无法实现,一个行之有效的办法就是在每一个个体被抽取的机会均等的前提下从总体中抽取部分个体,进行抽样调查.3.如果想了解你所在班上同学喜欢听数学课的比例,计划抽取8名同学做调查.请你用抽签法抽取一个样本.解:(1)将班内60名同学的学号1,2,…,60分别写在相同的60X纸片上.(2)将60X纸片放在一个容器里均匀搅拌之后,就可以抽样.(3)抽出一X纸片,记下上面的,然后均匀搅拌,继续抽取第2X纸片,记下这个,重复这个过程,直到取得8个时终止.(4)于是,和这8个对应的同学就构成了一个简单随机样本.练习B1.某居民区有730户居民,居委会计划从中抽取25户调查其家庭收入状况,你能帮助居委会抽出一个简单随机样本吗?解:随机数表法:(用教材第87页的随机数表)(1)将730户居民编号为001,002, (730)(2)给出的随机数表是5个数一组,使用各个5位数组的后3位,从各个数组中任选一个后3位小于或等于730的数作为起始,如从第2行的第6组开始,取出572作为25户中的第1个代号;(3)继续向右读,每组后3位符合要求的数取出,前面已经取出的跳过,到行末转下一行从左向右继续读,得数据:572,483,459,073,242,372,048,088,600,636,171,247,303,422,421,183,546,385,120,042 ,320,500,219,225,059.编号为以上所选的25个的居户被选中.2.使用计算器或计算机制作一X1 000个一位数的随机数表,并检查0~9这10个数在表中出现的可能性是否相同?解:相同.练习A1.什么是系统抽样?系统抽样有什么优点?解:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样.系统抽样的优点:它很好地解决了当总体容量和样本容量都较大时,用简单随机抽样不方便的问题.2.从编号为1~900的总体中用系统抽样的办法抽取一个容量为9的样本.解:按编号顺序分成9组,每组100个号,先在第一组用简单随机抽样方式抽出k(1≤k≤100)号,其余的k+100n(n=1,2,…,8)也被抽到,即可得所需样本.练习B1.某批产品共有1 563件,产品按出厂顺序编号,为从1~1 563.检测员要从中抽取15件产品作检测,请你给出一个系统抽样方案.解:S1 将产品的调整为0001,0002,0003, (1563)S2 从总体中剔除3件产品(剔除方法可用随机数表法),将剩下的1 560件产品重新编号(分别为0001,0002,…,1560),并分成15段;S3 在第一段0001,0002,...,0104,这104个编号中用简单随机抽样抽出一个(如0003)作为起始,则各段对应编号分别为0003,0107,0211, (1459)S4 将编号为0003,0107,0211,…,1459的个体抽出,即得到一个容量为15的样本.2.要考察某商场2003年的日销售额,从一年时间中抽取52天的销售额作为样本,请给出你的系统抽样方案.并说说你的抽样方案的优点和不足.解:S1 用随机数表法从365天中随机剔除1天;S2 将其余的364天编号,为001,002,003,…,364,并将依次分为52段;S3 在第一段001,002,…,007这7个中用抽签法选取一个,如002;S4 将为002,009,016,…,359的日期找出,组成样本.该抽样方案的优点是:抽取的样本能代表总体;缺点是:所抽取的日期与日常用的日期相比规律性差,不便于该方案的操作.练习A1.某校高一学生共500名,经调查,喜欢数学的学生占全体学生的30%,不喜欢数学的人数占40%,介于两者之间的学生占30%.为了考查学生的期中考试的数学成绩,如何用分层抽样抽取一个容量为50的样本.解:由题意知喜欢数学的学生有150人,不喜欢数学的有200人,介于两者之间的有150人.三个层次的学生人数之比为3∶4∶3.所以应抽喜欢数学的学生15人,不喜欢数学的学生20人,介于两者之间的学生15人.用随机数表法抽样分别从对应的部分抽取相应的人数即可.2.某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人.为了调查员工的身体健康状况,从中抽取100名员工,用分层抽样应当怎样抽取?解:S1 确定抽样比100500=15,所以不到35岁的应抽取125÷5=25(人),35~49岁的应抽取280÷5=56(人),50岁以上的应抽取95÷5=19(人);S2 用简单随机抽样法或系统抽样法分别抽取不到35岁的25人,35~49岁的56人;50岁以上的19人.这些人便组成了我们要抽取的样本.3.某大学就餐中心为了了解新生的饮食习惯,以分层抽样的方式从1 500名新生中抽取200名进行调查,新生中的南方学生有500名,北方学生有800名,西部地区的学生有200名,应如何抽取?解:由题意知南方学生有500名,北方学生有800名,西部地区的学生有200名.样本容量与总体容量的比为200∶1 500=2∶15.所以应抽取南方学生约67名,北方学生约106名,西部地区的学生约27名.用分层抽样法分别从对应的部分抽取相应的人数即可.练习B某市电视台在因特网上征集电视节目的现场参与观众,报名的共有12 000人,分别来自4个城区,其中东城区2 400人,西城区4 605人,南城区3 795人,北城区1 200人.用分层抽样的方式从中抽取60人参加现场节目,应当如何抽取?解:从12 000人中抽取60人,抽取比例为12 000∶60=200∶1,所以应在东城区抽取 2 400÷200=12(人),在西城区抽取 4 605÷200≈23(人),在南城区抽取 3 795÷200≈19(人),在北城区抽取1 200÷200=6(人).用系统抽样法分别从对应的部分抽取相应的数即可.练习A1.想一想怎样可以得到你所在班级同学的身高数据.解:设计调查问卷请每位同学填写自己的身高,然后汇总即可.2.你还能想到哪些可以得到数据资料的途径?解:如:教材或教材提供的数据;课堂数据(它们是在教室中收集的,主要与班上的学生有关,而不问结论是否对于更大的群体也成立).练习B为了了解中学生如何度过课余时间,请你设计一份关于中学生课余活动的调查问卷,实际调查后写出调查分析报告.解:提示:在设计调查问卷时,设计的题目意思要明确,覆盖面要广,不要有答题倾向即可.习题2-1A1.为了考察某地10 000名高一学生的体重情况,从中抽出了200名学生做调查.这里的总体、个体、样本、样本容量各指什么?为什么我们一般要从总体中抽取一个样本,通过样本来研究总体?解:统计的总体是指该地10 000名高一学生的体重;个体是指这10 000名学生中每一名学生的体重;样本是指这10 000名学生中抽出的200名学生的体重;样本容量为200.若对每一个个体逐一进行“调查”,有时费时、费力,有时根本无法实现,一个行之有效的办法就是在每一个个体被抽取机会均等的前提下从总体中抽取部分个体,进行抽样调查.2.要从编号为1~100的100道选择题中随机抽取20道题组成一份考卷,请你用抽签法给出考题的编号.解:(1)编号1~100;(2)制作大小相同的号签,并写上;(3)放入一个大容器,均匀搅拌;(4)依次抽取20个签(注意每次都要均匀搅拌),具有这20个编号的题组成一份考卷.3.某商店有590件货物,要从中选出50件货物做质量检查,请你用随机数表法给出一个抽样方案.解:(1)将590件货物编号为001,002, (590)(2)给出的随机数表是5个数一组,使用各个5位数组的中间3位,从各个数组中任选中间3位小于或等于590的数作为起始,如从第3行的第4列数037开始,取出037作为590件货物中的第1个代号;(3)继续向右读,将每组中间3位符合要求的数取出,已取出重复的跳过,到行末转下一行从左向右继续读,得数据:037,104,460,463,317,290,030,042,142,237,318,154,038,212,404,132,…,编号为以上所选的50个的货物被选中,即得到一个容量为50的样本.4.故宫博物院某天接待游客10 000人(假设把他们编号为0~9 999),如果要从这些游客中随机选出10名幸运游客,请你用系统抽样的方式给出幸运游客的编号.解:按编号顺序分成10组,每组1 000个号,先在第1组用简单随机抽样方式取出k(0≤k≤999)号,其余的k+1 000n(n=1,2,…,9)也被抽到,即可得到所需样本.5.一支田径队中有男运动员56人,女运动员42人,用分层抽样的方式从全队中抽取28名运动员.解:从男运动员中抽16人,女运动员中抽12人.6.某市有210家百货商店,其中大型商店有20家,中型商店有40家,小型商店有150家.为了了解商店的销售情况,要从中抽取21家商店进行调查,请你用分层抽样的方式进行抽取.解:大型商店、中型商店、小型商店分别抽取2家、4家、15家.习题2-1B1.某公园为了考察每天游览的人数,从一年中要抽取30天进行统计,请你分别用随机数表法、系统抽样法、分层抽样法给出样本,并根据样本比较这3种抽样方式.解:方法1:随机数表法S1 将一年的365天编号为001,002, (365)S2 在教材第一节提供的随机数表中任选一数作为开始,任选一方向作为读数方向,比如,选第1行第6个数“5”,向右读;S3 从数“5”开始,向右读,每次读取3位,凡不在001~365中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到30个符合要求的;S4 以上对应的日期就是抽取的对象.方法2:系统抽样法S1 将365天用随机方式编号;S2 从总体中剔除5天(剔除方法可用随机数表法),将剩下的360天重新编号(分别为001,…,360),并分成30段;S3 在第一段001,…,012这12个编号中用简单随机抽样抽出一个(如003)作为起始;S4 将编号为003,015,027,…,351的日期抽出,组成样本.方法3:分层抽样法S1 将一年分为春、夏、秋、冬四个层次;S2 在每个层次中用随机数表法抽取8天;S3 4×8=32,再用抽签法剔除2天,剩下的30天组成样本.点拨:3种抽样方法的共同点是每个个体被抽到的可能性均相等.2.随着互联网络的发展与普及,网络调查方式的使用越来越多.你能比较一下传统的调查方式与网络调查方式的优劣吗?解:网络调查省时、省力,但有时也不具备代表性.如调查农业方面的问题,应该调查农民,但农民上网的人数很少;传统调查方式虽费时、费力,但针对性强.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
当总体容量大或检测具有一定的破坏性时,可以从总体 中抽取适当的样本,通过对样本的分析、研究,得到对总体 的估计,这就是统计分析的基本过程.而用样本估计总体就 是统计思想的本质. 要准确估计总体,必须合理地选择样本,我们学习的是 最常用的三种抽样方法.获取样本数据后,将其用频率分布 表、频率直方图、频率折线图或茎叶图表示后,蕴含于数据 之中的规律得到直观的揭示.运用样本的平均数可以对总体 水平作出估计,用样本的极差、方差(标准差)可以估计总 体的稳定程度. 对两个变量的样本数据进行相关性分析,可发现存在于 现实世界中的回归现象.用最小二乘法研究回归现象,得到 的线性回归方程可用于预测和估计,为决策提供依据. 总之,统计的基本思想是从样本数据中发现统计规律, 实现对总体的估计.
到大依次分成
50 段,每段 10 人;
定首号 S3:在第一段1~10号中用的 简单随机抽样 的方法
抽取一个号码,比如3;
取余号 S4:依次抽取 3,13,23,33,
……这50个号码。
这样就得到了一个容量为50的样本。
2.1 抽样方法
(2).随机数表法:
将总体中的N个个体编号时可以从0开始,例如当N=100时, 编号可以是00,01,02, …,99.这样,总体中的所有个体均可用两位 数字号码表示,便于使用随机数表. 当随机地选定开始的数后,读数的方向可以向右,也可以向 左、向上、向下等.由此可见,用随机数表法抽取样本的步骤是:
2.1 抽样方法 1.简单随机抽样
(1)抽签法 1.将总体中的所有个体编号(号码可以从1到 N); 2.将1到N 这N 个号码写在形状、大小相同的号签上 (号签可以用小球、卡片、纸条等制作); 3.将号签放在同一箱中,并搅拌均匀; 4.从箱中每次抽出1个号签,并记录其编号,连续抽 取k次; 5.从总体中将与抽到的签的编号相一致的个体取出.
人教A版必修③
第二章 统计复习
本章回顾 本章介绍了从总体中抽取样本的常用方法,并通过 实例,研究了如何利用样本对总体的分布规律、整体 水平、稳定程度及相关关系等特性进行估计和预测. 总体 抽样 简 单 随 机 抽 样 系 统 抽 样 分 层 抽 样 分析 样 本 分 布
估计 样 本 特 征 数
总 体 分 布 总 体 特 征 数
第8行
16 22 77 94 39 84 42 17 53 31 63 01 63 78 59 33 21 12 34 29 57 60 86 32 44 49 54 43 54 82 57 24 55 06 88 16 95 55 67 19 78 64 56 07 82 09 47 27 96 54 17 37 93 23 78 77 04 74 47 67 98 10 50 71 75 52 42 07 44 38 49 17 46 09 62 87 35 20 96 43 21 76 33 50 25 12 86 73 58 07 15 51 00 13 42 90 52 84 77 27 84 26 34 91 64 83 92 12 06 76 44 39 52 38 79 99 66 02 79 54 08 02 73 43 28
(1)对总体中的个体进行编号(每个号码位数一致); (2)在随机数表中任选一个数作为开始; (3)从选定的数开始按一定的方向读下去,得到的数码 若不在编号中,则跳过;若在编号中,则取出;如果得到 的号码前面已经取出,也跳过;如此继续下去,直到取满 为止; (4)根据选定的号码抽取样本.
例子:
下面我们用随机数表法求解本节开头的问题. (1)对50个同学进行编号,编号分别为01,02,03,…,50; (2)在随机数表中随机地确定一个数作为开始,如第8行第29列的 数7开始.为便于说明,我们将附表中的第6行至第10行摘录如下: 第29列
2.系统抽样:
系统抽样的步骤为: (1)采用随机的方式将总体中的个体编号; (2)将整个的编号按一定的间隔(设为k)分段, N 当 n (N为总体中的个体数,n为样本容量)是整数 N N 时,k= n ;当 n 不是整数时,从总体中剔除一些个 体,使剩下的总体中个体的个数N′能被n 整除,这 N 时k= n ,并将剩下的总体重新编号; (3)在第一段中用简单随机抽样确定起始的个体编 号l ; (4)将编号为l , l +k,l +2k,…, l +(n-1)k的个 体抽出.
(1)对总体中的个体进行编号(每个号码位数一致); (2)在随机数表中任选一个数作为开始; (3)从选定的数开始按一定的方向读下去,得到的数码 若不在编号中,则跳过;若在编号中,则取出;如果得到 的号码前面已经取出,也跳过;如此继续下去,直到取满 为止; (4)根据选定的号码抽取样本.
将总体中的N个个体编号时可以从0开始,例如当N=100时, 编号可以是00,01,02, …,99.这样,总体中的所有个体均可用两位 数字号码表示,便于使用随机数表. 当随机地选定开始的数后,读数的方向可以向右,也可以向 左、向上、向下等.由此可见,用随机数表法抽取样本的步骤是:
(3)从数7开始向右读下去,每次读两位,凡不在01到50中的数跳过 去不读,遇到已经读过的数也跳过去,便可依次得到
12,07,44,39,38,33,21,34,29,42
这10个号码,就是所要抽取的10个样本个体的号码.
小结:
1.抽样无放回; 2.抽样公平性; 3.抽签法,随机数表法—简单的随机抽样.
1
例; 某单位在岗职工共624人,为了调查工人用于上班途 中的时间,决定抽取10%的工人进行调查.如何采用系统 抽样方法完成这一抽样?
说明: 1.抽样公平性原则—等概率—随机性;
2.抽签法适用与总体中个数N不大的情形.
例题 1 系统抽样(等距抽样) 例子—— . 为了解高一年级 500名同学的视力情况,试用系 统抽样从中抽取50名同学进行检查。 编号 分段
S1:把50Leabharlann 人从1到500编号;500 S2:计算分段间隔为 k= 50 =10 人。把编号从小