高中数学必修2统计知识点讲义
14.3统计图表 讲义-2021-2022学年高一下学期数学苏教版(2019)必修第二册
029 14.3目标要求1、理解并掌握扇形统计图、折线统计图、频率直方图和画频率直方图的步骤.2、理解并掌握扇形统计图、折线统计图、频率直方图的简单综合应用.3、理解并掌握频率直方图的画法.4、理解并掌握频率直方图的应用.学科素养目标数据能够帮助人们认识世界、作出决策和预测,而统计正是与数据打交道的科学,用一句话来概括统计:统计是用以“收集数据、整理数据、分析数据、由数据得出结论”的概念、法则和方法.由此可以看出,学习统计学有助于学生适应现代社会的需要,有助于培养学生形成数据意识以及运用数据进行推断的思考方式,有助于学生形成以数学的眼光看世界的习惯,增强学生运用数学分析问题、解决问题的能力.在学习运用样本估计总体的过程中,要通过对具体数据的分析,使学生体会到由于样本数据具有随机性,样本所提供的信息在一定程度上反映了总体的有关特征,但与总体有一定的偏差.但是,如果抽样的方法比较合理,样本信息可以比较好地反映总体的信息,从而为人们合理地决策提供依据.由此使学生认识统计思维的特点和作用,体会统计思维与确定性思维的差异.重点难点重点:频率直方图的画法;难点:频率直方图的应用.教学过程基础知识点1.扇形统计图、折线统计图、频数直方图(1)扇形统计图扇形统计图可以形象地表示出各部分数据在全部数据中所占的________情况.扇形统计图中,每一个扇形的___________以及弧长,都与这一部分表示的数据大小成正比.(2)折线统计图一般地,如果数据是随时间变化的,可将数据用折线图来表示.(3)频数直方图频数直方图(也称为条形图)可以直观描述不同类别或分组数据的频数.【思考】(1)统计图表对于数据分析能够起到什么作用?(2)扇形统计图、折线统计图、频数直方图这三种统计图中,哪些可以从图中看出原始数据?2.画频率直方图的步骤(1)求极差:极差是一组数据中___________与___________的差;(2)决定组距与组数:当样本容量不超过100时,常分成___________组,为了方便起见,一般取等长组距,并且组距应力求“取整”.(3)将数据分组.(4)列频率分布表:一般分四列:分组、________、频率、_________.其中频数合计应是样本容量,频率合计是_______.(5)画频率直方图:横轴表示分组,纵轴表示_______.小长方形的面积=组距×_____=______.各小长方形的面积和等于1.【思考】(1)画频率直方图为什么要对样本数据进行分组?(2)频数直方图与频率直方图有什么不同?【课前小题演练】题1.为了解学生在“弘扬传统文化,品读经典文学”月的阅读情况,现从全校学生中随机抽取了部分学生,并统计了他们的阅读时间(阅读时间t∈[0,50]),分组整理数据得到如图所示的频率分布直方图.则图中a的值为( )A.0.028 B.0.030 C.0.280 D.0.300题2.某校200名学生数学竞赛成绩的频率分布直方图如图所示,成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则该次数学成绩在[50,60)内的人数为( )A.20 B.15 C.10 D.5题3.统计某校n名学生的某次数学同步练习成绩(满分150分),根据成绩分数分成六组:[90,100),[100,110),[110,120),[120,130),[130,140),[140,150],绘制频率分布直方图如图所示,若已知不低于140分的人数为110,则n的值是( )A.800 B.900 C.1 200 D.1 000题4.从2021年参加奥运知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如图所示.观察图形,估计这次奥运知识竞赛的及格率(大于或等于60分为及格)为________.题5.某超市对某种产品每天的销售量(单位:件)进行为期一个月(按30天计算)的数据统计分析,并得出了这种产品该月销售量的频率分布直方图(如图).假设用直方图中所得的频率来估计相应事件发生的概率.(1)求频率分布直方图中a的值;(2)若该超市在一天的销售量不低于25件,则上级商企会给超市赠送100元的礼金,估计该超市在一年内获得的礼金数.【当堂巩固训练】题6.某中学统计了初中毕业班一次模拟考试后学生的数学成绩,所得频率分布直方图结果如图所示,若已知83%的学生的数学成绩不高于x分,则x的估计值为( )A.84 B.86 C.88 D.90题7.为落实《国家学生体质健康标准》达标测试工作,全面提升学生的体质健康水平,某校高二年级体育组教师在高二年级随机抽取部分男生,测试了立定跳远项目,依据测试数据绘制了如图所示的频率直方图.已知立定跳远200 cm以上成绩为及格,255 cm以上成绩为优秀,根据图中的数据估计该校高二年级男生立定跳远项目的优秀率和图中的a分别是( )A.3%,0.010 B.3%,0.012C.6%,0.010 D.6%,0.012题8. 2020年10月1日是中秋节和国庆节双节同庆,很多人外出旅行或回家探亲,因此交通比较拥堵.某交通部门为了解从A城到B城实际通行所需时间,随机抽取了n台车辆进行统计,结果显示这些车辆的通行时间(单位:分钟)都在[30,55]内,按通行时间分为[30,35),[35,40),[40,45),[45,50),[50,55]五组,频率分布直方图如图所示,其中通行时间在[30,35)内的车辆有235台,则通行时间在[45,50)内的车辆台数是( )A.450 B.325 C.470 D.500题9.某班同学进行社会实践,对[25,55]岁的人群随机抽取n人进行了生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念的称为“低碳族”,否则称为“非低碳族”,得到如下统计表和各年龄段人数频率分布直方图,则图表中的p,a的值分别为( )组数分组低碳族的人数占本组的频率第一组[25,30) 120 0.6第二组[30,35) 195 p第三组[35,40) 100 0.5第四组[40,45) a0.4第五组[45,50) 30 0.3第六组[50,55] 15 0.30.7920 0.19540C.0.65,60 D.0.975,80题10.学校为了解新课程标准中提升阅读要求对学生阅读兴趣的影响情况,随机抽取100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示.将阅读时间不低于30 min的学生称为阅读霸,则下列结果正确的是( )A.抽样表明,该校约有一半学生为阅读霸B.抽取的100名学生中有50名学生为阅读霸C.该校学生中有50名学生不是阅读霸D.抽样表明,该校有50名学生为阅读霸题11.某学校为了调查学生在一周生活方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60]元的学生有60人,则下列说法正确的是( )A.样本中支出在[50,60]元的频率为0.03B.样本中支出不少于40元的人数为132C.n的值为200D.若该校有2000名学生,则定有600人支出在[50,60]元题12.每年六月二十六日是国际禁毒日.为了让同学们“珍惜生命,远离毒品”,六盘水市某学校组织全校学生参加了禁毒知识网络竞赛,通过统计,得到学生成绩的频率分布直方图,如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若该校的学生总人数为2000,则成绩超过80分的学生人数大约为________.题13.某中学为了了解高三年级女生的体重(单位:千克)情况,从中随机抽测了100名女生的体重,所得数据均在区间[48,58]中,其频率分布直方图如图所示,则在抽测的100名女生中,体重在区间[50,56)的女生数为________.题14.某城市100户居民的月平均用电量(单位:千瓦时),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图所示.(1)求直方图中x的值;(2)在月平均用电量为[220,240),[240,260),[260,280)的三组用户中,用分层抽样的方法抽取10户居民,则月平均用电量在[240,260)的用户中应抽取多少户?【综合突破拔高】题15.为了改善市民的生活环境,某沿江城市决定对本市的1 000家中小型化工企业进行污染情况摸排,并把污染情况综合折算成标准分100分,如图为该市被调查的化工企业的污染情况标准分的频率分布直方图,根据该图可估计本市标准分不低于50分的企业数为( )A.400 B.500 C.600 D.800题16.在一次期末考试中,随机抽取200名学生的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成5组:[50,60),[60,70),[70,80),[80,90),[90,100].据此绘制了如下图所示的频率分200A.30名B.40名C.50名D.60名题17.某市举行“中学生诗词大赛”,分初赛和复赛两个阶段进行,规定:初赛成绩大于90分的具有复赛资格,某校有800名学生参加了初赛,所有学生的成绩均在区间[30,150]内,其频率分布直方图如图.则获得复赛资格的人数为( )A.640 B.520 C.280 D.240题18.为了解某市居民用水情况,通过抽样,获得了100位居民某年的月均用水量(单位:吨),将该数据按照[0,0.5),[0.5,1),…,[4.4.5]分成9组,绘制了如图所示的频率分布直方图,政府要试行居民用水定额管理,制定了一个用水量标准a,使88%的居民用水量不超过a(假设a为整数),按平价收水费,超出a的部分按议价收费,则a的最小值为________.题19.某中学有初中学生1800人,高中学生1200人.为了解学生本学期课外阅读情况,现采用分层随机抽样的方法,从中抽取了100名学生,先统计了他们的课外阅读时间,然后按初中学生和高中学生分为两组,再将每组学生的阅读时间(单位:h)分为5组:[1,10),[10,20),[20,30),[30,40),[40,50],并分别加以统计,得到如图所示的频率分布直方图,试估计该校所有学生中,阅读时间不小于30 h的学生人数为________.题20.某学校现有学生3000人,为了解学生的体质健康情况,对学生进行了体质测评,得分分布在[50,100]之间,按[50,60),[60,70),[70,80),[80,90),[90,100]分组,得到的频率分布直方图如图所示:(1)求a的值;(2)估计该校学生体质测评分数在[70,90)的人数.题21.某制造商为运动会生产一批直径为40 mm的乒乓球,现随机抽样检查20只,测得每只球的直径(单位:mm,保留两位小数)如下:40.02 40.00 39.98 40.00 39.9940.00 39.98 40.01 39.98 39.9940.00 39.99 39.95 40.01 40.0239.98 40.00 39.99 40.00 39.96(1)完成下面的频率分布表,并补全图中频率分布直方图和频率分布折线图.分组频数频率频率组距[39.95,39.97) 2 0.10 5 [39.97,39.99) 4 10[39.99,40.01) 10 0.50[40.01,40.03) 4 0.20 10合计20 1.00 50(2)假定乒乓球的直径误差不超过0.02 mm为合格品,若这批乒乓球的总数为10000只,试根据抽样检查结果估计这批产品的合格只数.029 14.3目标要求1、理解并掌握扇形统计图、折线统计图、频率直方图和画频率直方图的步骤.2、理解并掌握扇形统计图、折线统计图、频率直方图的简单综合应用.3、理解并掌握频率直方图的画法.4、理解并掌握频率直方图的应用.学科素养目标数据能够帮助人们认识世界、作出决策和预测,而统计正是与数据打交道的科学,用一句话来概括统计:统计是用以“收集数据、整理数据、分析数据、由数据得出结论”的概念、法则和方法.由此可以看出,学习统计学有助于学生适应现代社会的需要,有助于培养学生形成数据意识以及运用数据进行推断的思考方式,有助于学生形成以数学的眼光看世界的习惯,增强学生运用数学分析问题、解决问题的能力. 在学习运用样本估计总体的过程中,要通过对具体数据的分析,使学生体会到由于样本数据具有随机性,样本所提供的信息在一定程度上反映了总体的有关特征,但与总体有一定的偏差.但是,如果抽样的方法比较合理,样本信息可以比较好地反映总体的信息,从而为人们合理地决策提供依据.由此使学生认识统计思维的特点和作用,体会统计思维与确定性思维的差异.重点难点重点:频率直方图的画法; 难点:频率直方图的应用.教学过程基础知识点1.扇形统计图、折线统计图、频数直方图 (1)扇形统计图扇形统计图可以形象地表示出各部分数据在全部数据中所占的__比例___情况.扇形统计图中,每一个扇形的____圆心角___以及弧长,都与这一部分表示的数据大小成正比. (2)折线统计图一般地,如果数据是随时间变化的,可将数据用折线图来表示. (3)频数直方图频数直方图(也称为条形图)可以直观描述不同类别或分组数据的频数. 【思考】(1)统计图表对于数据分析能够起到什么作用? 提示:①从数据中获取有用的信息; ②直观、准确地理解相关的结果.(2)扇形统计图、折线统计图、频数直方图这三种统计图中,哪些可以从图中看出原始数据?提示:扇形统计图适合表示总体的各个部分所占比例的问题,折线统计图能看到原始数据,频数直方图只能看到每组中数据的个数,但不是原始数据. 2.画频率直方图的步骤(1)求极差:极差是一组数据中___最大值____与___最小值____的差;(2)决定组距与组数:当样本容量不超过100时,常分成___5~12___组,为了方便起见, 一般取等长组距,并且组距应力求“取整”. (3)将数据分组.(4)列频率分布表:一般分四列:分组、__频数___、频率、 频率组距.其中频数合计应是 样本容量,频率合计是_1_.(5)画频率直方图:横轴表示分组,纵轴表示频率组距.小长方形的面积=组距× 频率组距=__频率___.各小长方形的面积和等于1.【思考】(1)画频率直方图为什么要对样本数据进行分组?提示:不分组很难看出样本中的数字所包含的信息,分组后,计算出频率,从而估计总体的分布特征. (2)频数直方图与频率直方图有什么不同?提示:频数直方图能使我们清楚地知道数据分布在各个小组的个数,而频率直方图则是从各个小组数据在样本容量中所占比例大小的角度来表示数据分布的规律. 【课前小题演练】题1.为了解学生在“弘扬传统文化,品读经典文学”月的阅读情况,现从全校学生中随机抽取了部分学生,并统计了他们的阅读时间(阅读时间t ∈[0,50]),分组整理数据得到如图所示的频率分布直方图.则图中a 的值为( )A .0.028B .0.030C .0.280D .0.300【解析】选A .由(0.006+a +0.040+0.020+0.006)×10=1得a =0.028.题2.某校200名学生数学竞赛成绩的频率分布直方图如图所示,成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则该次数学成绩在[50,60)内的人数为( )A .20B .15C .10D .5【解析】选C .由频率分布直方图得,该次数学成绩在[50,60)内的频率为:12 (1-0.04×10-0.03×10-0.02×10)=0.05,所以该次数学成绩在[50,60)内的人数为200×0.05=10.题3.统计某校n 名学生的某次数学同步练习成绩(满分150分),根据成绩分数分成六组:[90,100),[100,110),[110,120),[120,130),[130,140),[140,150],绘制频率分布直方图如图所示,若已知不低于140分的人数为110,则n 的值是( )A.800 B.900 C.1 200 D.1 000【解析】选D.由频率分布直方图的性质得:10(0.031+0.020+0.016+0.016+m+0.006)=1,解得m=0.011.因为不低于140分的频率为0.011×10=0.11,所以n=1100.11=1 000.题4.从2021年参加奥运知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如图所示.观察图形,估计这次奥运知识竞赛的及格率(大于或等于60分为及格)为________.【解析】1-0.1-0.15=0.75.答案:0.75题5.某超市对某种产品每天的销售量(单位:件)进行为期一个月(按30天计算)的数据统计分析,并得出了这种产品该月销售量的频率分布直方图(如图).假设用直方图中所得的频率来估计相应事件发生的概率.(1)求频率分布直方图中a的值;(2)若该超市在一天的销售量不低于25件,则上级商企会给超市赠送100元的礼金,估计该超市在一年内获得的礼金数.【解析】(1)由题意可得a=15[1-(0.01+0.06+0.07+0.04)×5]=0.02.(2)根据频率分布直方图知,日销售量不低于25件的天数为:(0.04+0.02)×5×30=9(天),一个月可获得的礼金数为9×100=900(元),依此可以估计该超市一年内获得的礼金数为900×12=10 800元.【当堂巩固训练】6已知83%的学生的数学成绩不高于x分,则x的估计值为( )A.84 B.86 C.88 D.90【解析】选A.由频率分布直方图知(2a+0.02+0.03+0.04)×10=1,解得a=0.005.因为前三组的频率之和为(0.005+0.04+0.03)×10=0.75<0.83,而前四组的频率之和为(0.005+0.04+0.03+0.02)×10=0.95>0.83,所以由(x-80)×0.02=0.83-0.75,解得x=84,即x的估计值为84. 题7.为落实《国家学生体质健康标准》达标测试工作,全面提升学生的体质健康水平,某校高二年级体育组教师在高二年级随机抽取部分男生,测试了立定跳远项目,依据测试数据绘制了如图所示的频率直方图.已知立定跳远200 cm以上成绩为及格,255 cm以上成绩为优秀,根据图中的数据估计该校高二年级男生立定跳远项目的优秀率和图中的a分别是( )A.3%,0.010 B.3%,0.012C.6%,0.010 D.6%,0.012【解析】选C.由频率分布直方图可得,优秀率为0.003×20×100%=6%;由(0.003+0.014+0.020+a+0.003)×20=1,解得a=0.010.题8. 2020年10月1日是中秋节和国庆节双节同庆,很多人外出旅行或回家探亲,因此交通比较拥堵.某交通部门为了解从A城到B城实际通行所需时间,随机抽取了n台车辆进行统计,结果显示这些车辆的通行时间(单位:分钟)都在[30,55]内,按通行时间分为[30,35),[35,40),[40,45),[45,50),[50,55]五组,频率分布直方图如图所示,其中通行时间在[30,35)内的车辆有235台,则通行时间在[45,50)内的车辆台数是( )A.450 B.325 C.470 D.5000.10.250.40.05,所以通行时间在[45,50)内的频率是1-0.1-0.25-0.4-0.05=0.2,通过的车辆台数是235×2=470. 题9.某班同学进行社会实践,对[25,55]岁的人群随机抽取n 人进行了生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念的称为“低碳族”,否则称为“非低碳族”,得到如下统计表和各年龄段人数频率分布直方图,则图表中的p ,a 的值分别为( )组数 分组 低碳族的人数占本组的频率第一组 [25,30) 120 0.6 第二组 [30,35) 195 p 第三组 [35,40) 100 0.5 第四组 [40,45) a 0.4 第五组 [45,50) 30 0.3 第六组[50,55]150.3A .0.79,20B .0.195,40C .0.65,60D .0.975,80【解析】选C .第一组人数为120÷0.6=200人,由频率分布直方图可得第一组频率为5×0.04=0.2, 所以n =2000.2 =1 000,所以第三组200人,第四组5×0.03×1 000=150人,第五组100人,第六组50人,所以第二组300人,p =195300=0.65,a =150×0.4=60.题10.学校为了解新课程标准中提升阅读要求对学生阅读兴趣的影响情况,随机抽取100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示.将阅读时间不低于30 min 的学生称为阅读霸,则下列结果正确的是( )A .抽样表明,该校约有一半学生为阅读霸B .抽取的100名学生中有50名学生为阅读霸50 D .抽样表明,该校有50名学生为阅读霸 【解析】选AB .根据频率分布直方图可列下表:阅读时间/min [0,10) [10,20) [20,30) [30,40) [40,50) [50,60]抽样人数/名10182225205抽取的100名学生中有50名为阅读霸,据此可判断该校约有一半学生为阅读霸.题11.某学校为了调查学生在一周生活方面的支出情况,抽出了一个容量为n 的样本,其频率分布直方图如图所示,其中支出在[50,60]元的学生有60人,则下列说法正确的是( )A .样本中支出在[50,60]元的频率为0.03B .样本中支出不少于40元的人数为132C .n 的值为200D .若该校有2000名学生,则定有600人支出在[50,60]元【解析】选BC .样本中支出在[50,60]元的频率为1-(0.01+0.024+0.036)×10=0.3,故A 错误; 样本中支出不少于40元的人数为0.0360.03 ×60+60=132,故B 正确;n =600.3 =200,故n 的值为200,故C 正确;若该校有2000名学生,则可能有0.3×2000=600人支出在[50,60]元,故D 错误.题12.每年六月二十六日是国际禁毒日.为了让同学们“珍惜生命,远离毒品”,六盘水市某学校组织全校学生参加了禁毒知识网络竞赛,通过统计,得到学生成绩的频率分布直方图,如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若该校的学生总人数为2000,则成绩超过80分的学生人数大约为________.【解析】由题意,该校成绩超过80分的学生人数大约为2000×0.015×20=600. 答案:600题13.某中学为了了解高三年级女生的体重(单位:千克)情况,从中随机抽测了100名女生的体重,所得数据均在区间[48,58]中,其频率分布直方图如图所示,则在抽测的100名女生中,体重在区间[50,56)的女生数为________.【解析】由频率分布直方图可知,体重在区间[50,56)的频率为2×(0.100+0.150+0.125)=0.75,所以体重在区间[50,56)的女生数为0.75×100=75. 答案:75题14.某城市100户居民的月平均用电量(单位:千瓦时),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图所示.(1)求直方图中x 的值;(2)在月平均用电量为[220,240),[240,260),[260,280)的三组用户中,用分层抽样的方法抽取10户居民,则月平均用电量在[240,260)的用户中应抽取多少户?【解析】(1)由频率分布直方图得:(0.002+0.0095+0.011+x +0.0075+0.005+0.0025)×20=1, 解得x =0.0125.(2)月平均用电量在[220,240)的用户有0.0125×20×100=25(户),月用电量在[240,260)的用户有0.0075×20×100=15(户)月平均用电量在[260,280)的用户有0.005×20×100=10(户),抽取比例为:1025+15+10 =15 ,所以月平均用电量在[240,260)的用户中应该抽取:15×15 =3(户).【综合突破拔高】题15.为了改善市民的生活环境,某沿江城市决定对本市的1 000家中小型化工企业进行污染情况摸排,并把污染情况综合折算成标准分100分,如图为该市被调查的化工企业的污染情况标准分的频率分布直方图,根据该图可估计本市标准分不低于50分的企业数为( ).400 500 600 800【解析】选B.根据频率分布直方图经计算得50分以上的频率为1-(0.005×20+0.0125×20+0.015×10)=0.50,所以本市标准分不低于50分的企业数为500家.题16.在一次期末考试中,随机抽取200名学生的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成5组:[50,60),[60,70),[70,80),[80,90),[90,100].据此绘制了如下图所示的频率分布直方图.则这200名学生中成绩在[80,90)中的学生有( )A.30名B.40名C.50名D.60名【解析】选B.由题知,成绩在[80,90)内的学生所占的频率为1-(0.005×2+0.025+0.045)×10=0.2,所以这200名同学中成绩大于等于80分且小于90分的学生有200×0.2=40名.题17.某市举行“中学生诗词大赛”,分初赛和复赛两个阶段进行,规定:初赛成绩大于90分的具有复赛资格,某校有800名学生参加了初赛,所有学生的成绩均在区间[30,150]内,其频率分布直方图如图.则获得复赛资格的人数为( )A.640 B.520 C.280 D.240【解析】选B.初赛成绩大于90分的具有复赛资格,某校有800名学生参加了初赛,所有学生的成绩均在区间[30,150]内,由频率分布直方图得到初赛成绩大于90分的频率为:1-(0.0025+0.0075+0.0075)×20=0.65.所以获得复赛资格的人数为:0.65×800=520.题18.为了解某市居民用水情况,通过抽样,获得了100位居民某年的月均用水量(单位:吨),将该数据按照[0,0.5),[0.5,1),…,[4.4.5]分成9组,绘制了如图所示的频率分布直方图,政府要试行居民用水定额管理,制定了一个用水量标准a,使88%的居民用水量不超过a(假设a为整数),按平价收水费,超出a的部分按议价收费,则a的最小值为________.【解析】[0,0.5)的频数为0.08×0.5×100=4,[0.5,1)的频数为0.16×0.5×100=8,[1,1.5)的频数为0.30×0.5×100=15,[1.5,2)的频数为0.44×0.5×100=22,[2,2.5)的频数为0.5×0.5×100=25,[2.5,3)的频数为0.28×0.5×100=14.[3,3.5)的频数为0.12×0.5×100=6,[3.5,4)的频数为0.08×0.5×100=4,[4,4.5]的频数为0.04×0.5×100=2,4+8+15+22+25+14=88,所以前6组占88%,a为3吨.答案:3吨题19.某中学有初中学生1800人,高中学生1200人.为了解学生本学期课外阅读情况,现采用分层随机抽样的方法,从中抽取了100名学生,先统计了他们的课外阅读时间,然后按初中学生和高中学生分为两组,再将每组学生的阅读时间(单位:h)分为5组:[1,10),[10,20),[20,30),[30,40),[40,50],并分别加以统计,得到如图所示的频率分布直方图,试估计该校所有学生中,阅读时间不小于30 h的学生人数为________.【解析】由分层随机抽样,知抽取的初中生有60名,高中生有40名.因为初中学生中阅读时间不小于30 h的频率为(0.02+0.005)×10=0.25,所以该校所有的初中学生中,阅读时间不小于30 h的学生人数约为0.25×1800=450,同理,高中学生中阅读时间不小于30 h的频率为(0.03+0.005)×10=0.35,故该校所有的高中学生中,阅读时间不小于30 h的学生人数约为0.35×1 200=420.所以该校所有学生中,阅读时间不小于30 h的学生人数约为450+420=870.答案:870题20.某学校现有学生3000人,为了解学生的体质健康情况,对学生进行了体质测评,得分分布在[50,100]之间,按[50,60),[60,70),[70,80),[80,90),[90,100]分组,得到的频率分布直方图如图(1)求a的值;(2)估计该校学生体质测评分数在[70,90)的人数.【解析】(1)由频率分布直方图可得:(0.01+0.015+0.035+a+0.01)×10=1,解得:a=0.03;(2)由频率分布直方图可得,样本中该校学生体质测评分数在[70,90)的频率为(0.035+0.03)×10=0.65,因此该校学生体质测评分数在[70,90)的人数为3 000×0.65=1 950.题21.某制造商为运动会生产一批直径为40 mm的乒乓球,现随机抽样检查20只,测得每只球的直径(单位:mm,保留两位小数)如下:40.02 40.00 39.98 40.00 39.9940.00 39.98 40.01 39.98 39.9940.00 39.99 39.95 40.01 40.0239.98 40.00 39.99 40.00 39.96(1)完成下面的频率分布表,并补全图中频率分布直方图和频率分布折线图.分组频数频率频率组距[39.95,39.97) 2 0.10 5[39.97,39.99) 4 10[39.99,40.01) 10 0.50[40.01,40.03) 4 0.20 10合计20 1.00 50(2)假定乒乓球的直径误差不超过0.02 mm为合格品,若这批乒乓球的总数为10000只,试根据抽样检查结果估计这批产品的合格只数.【解析】(1)频率分布表如下:分组 频数 频率 频率组距 [39.95,39.97) 2 0.10 5 [39.97,39.99) 4 0.20 10 [39.99,40.01) 10 0.50 25 [40.01,40.03)4 0.20 10 合计201.0050频率分布直方图、频率分布折线图如图所示.(2)因为抽样的20只产品中在[39.98,40.02]范围内的有18只,所以合格率为1820 ×100%=90%.所以根据抽样检查结果,可以估计这批产品的合格只数为9000.。
人教B版高中数学必修第二册教学课件:第五章5.4统计与概率的应用
员工 项目 子女教育 继续教育 大病医疗 住房贷款利息 住房租金 供养老人
A
B
C
D
E
F
○
○
×
○
×
○
×
×
○
×
○
○
×
×
×
○
×
×
○
○
×
×
○
○
×
×
○
×
×
×
○
○
×
×
×
○
【解题提示】 (1)按比例分配进行分层抽样。 (2)按照字典排序法列举出所有的抽取结果和事件M的所有基本 事件,然后利用基本事件个数计算概率。
6
6
(3)设第1组抽取的2人为A1,A2,第3组抽取的3人为B1,B2,B3,第4组抽取的1人为C,则从这6人
中随机抽取2人有(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A1,C),(A2,B1),(A2,
B2),(A2,B3),(A2,C),(B1,B2),(B1,B3),(B1,C),(B2,B3),(B2,C),(B3,
估算,其p%分位数即为频率分布直方图中使左侧小矩形面积之和等于p%的分点值. ②某校100名学生的数学测试成绩的频率分布直方图如图:
由此可估计其80%分位数.
首先求分数在130以下的学生所占比例为5%+18%+30%+22% =75%.在140以下的学生所占比例为75%+15%=90%.
因此,80%分位数一定位于[130,140)内,
织了一场PK赛,A,B两队各由4名选手组成,每局两队各派一名选手PK,比赛四局.除第三局胜者
得2分外,其余各局胜者均得1分,每局的负者得0分.假设每局比赛A队选手获胜的概率均为 2 ,
(完整版)高中数学必修2《统计》知识点讲义
第二章统计一、三种抽样方法1、统计的的基本思想是:用样本的某个量去估计总体的某个量总体:在统计中,所有考察对象的全体。
个体:总体中的每一个考察对象。
样本:从总体中抽取的一部分个体叫做这个总体的一个样本。
样本容量:样本中个体的数目。
2、抽样方法:要求:总体中每个个体被抽取的机会相等(1)简单随机抽样:抽签法和随机数表法简单随机抽样的特点是:不放回、等可能.抽签法步骤(1)先将总体中的所有个体(共有N个)编号(号码可从1到N)(2)把号码写在形状、大小相同的号签上,号签可用小球、卡片、纸条等制作(3)将这些号签放在同一个箱子里,进行均匀搅拌(4)抽签时,每次从中抽出一个号签,连续抽取n次(5)抽出样本随机数表法步骤(1)将总体中的个体编号(编号时位数要统一);(2)选定开始的数字;(3)按照一定的规则读取号码;(4)取出样本(2)系统抽样系统抽样特点:容量大、等距、等可能.步骤:1.编号,随机剔除多余个体,重新编号2.分组 (段数等于样本容量),确定间隔长度 k=N/n3.抽取第一个个体编号为i4.依预定的规则抽取余下的个体编号为i+k, i+2k, …(3)分层抽样分层抽样特点:总体差异明显、按所占比例抽取、等可能.步骤:1.将总体按一定标准分层;2.计算各层的个体数与总体的个体数的比;3.按比例确定各层应抽取的样本数目4.在每一层进行抽样 (可用简单随机抽样或系统抽样)二、用样本估计总体1、用样本的频率分布估计总体的分布①作样本频率分布直方图的步骤:(1)求极差;(2)决定组距与组数; (组数=极差/组距)(3)将数据分组;(4)列频率分布表(分组,频数,频率);(5)画频率分布直方图。
根据频率分布表做频率分布直方图应注意两点:频率⑴纵轴的意义:组距⑵横轴的意义:样本内容(每个矩形下面是组距).例1、为了了解中学生的身高情况,对育才中学同龄的50名男学生的身高进行了测量,结果如下:(单位:cm)175 168 180 176 167 181 162 173 171 177171 171 174 173 174 175 177 166 163 160166 166 163 169 174 165 175 165 170 158174 172 166 172 167 172 175 161 173 167170 172 165 157 172 173 166 177 169 181列出样本的频率分布表,画出频率分布直方图.解:在这个样本中,最大值为181,最小值为157,它们的差是24,可以取组距为4,分成7组,根据题意列出样本的频率分布表如下:频率分布直方图(略)②茎叶图作图步骤:1.将每个数据分为茎(高位)和叶(低位)两部分.2.将最小茎和最大茎之间的数按大小顺序排成一列,写在左(右)侧;3.将各个数据的叶按大小次序写在其右(左)侧.例、某中学高二(2)班甲、乙两名同学自高中以来每场数学考试成绩如下:甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,130,98,114,98,79,101.画出两人数学成绩茎叶图,请根据茎叶图对两人的成绩进行比较.解:甲、乙两人数学成绩的茎叶图如下图:甲乙5 65 6 1 7 98 9 6 1 8 6 3 84 15 9 3 9 8 87 10 3 10 11 4从这个茎叶图上可看出,乙同学的得分情况是大致对称的,中位数是99;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是89.因此乙同学发挥比较稳定,总体得分情况比甲同学好.2、用样本的数据特征估计总体的数据特征(1)、在频率直方图中计算众数、平均数、中位数众数:在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。
高中数学必修二统计概率知识点总结
必修第二册第九章 统计知识点总结知识点一:简单随机抽样1. 全面调查和抽样调查2.简单随机抽样的概念放回简单随机抽样不放回简单随机抽样一般地,设一个总体含有N(N 为正整数)个个体,从中逐个抽取n (1≤n<N)个个体作为样本如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本3.抽签法先把总体中的个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌.最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的个体数.调查方式全面调查(普查)抽样调查定义对每一个调查对象都进行调查的方法,称为全面调查,又称普查根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为 抽样调查相关概念总体:在一个调查中,我们把调查对象的全体称为总体.个体:组成总体的每一个调查对象称为个体样本:把从总体中抽取的那部分个体 称为样本.样本量:样本中包含的个体数称为 样本量4.随机数法(1)定义:先把总体中的个体编号,用随机数工具产生已编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本,重复上述过程,直到抽足样本所需要的个体数.(2)产生随机数的方法:(i)用随机试验生成随机数;(ii)用信息技术生成随机数.5.总体均值和样本均值(1)总体均值:一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,Y N,则称Y=Y1+Y2+⋯+Y NN =1N∑i=1NY i为总体均值,又称总体平均数.(2)总体均值加权平均数的形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数f i(i=1,2,…,k),则总体均值还可以写成加权平均数的形式Y=1N ∑i=1kf i Y i.(3)如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,y n,则称y=y1+y2+⋯+y nn =1n∑i=1ny i为样本均值,又称样本平均数.6.分层随机抽样的相关概念(1)分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.(2)比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.(3)进行分层随机抽样的相关计算时,常用到的关系①样本容量n总体容量N =该层抽取的个体数该层的个体数;②总体中某两层的个体数之比等于样本中这两层抽取的个体数之比;③样本的平均数和各层的样本平均数的关系:w=mm+n x+nm+ny=MM+Nx+NM+Ny.1.画频率分布直方图的步骤(1)求极差:极差为一组数据中最大值与最小值的差;(2)决定组距与组数:当样本容量不超过100时,常分成5-12组,为方便起见,一般取等长组距,并且组距应力求“取整”;(3)将数据分组;(4)列频率分布表:一般分四列:分组、频数累计、频数、频率.其中频数合计应是样本容量,频率合计是⑥1;.(5)画频率分布直方图:横轴表示分组,纵轴表示频率组距=频率,各小长方形的面积的总和等于1.小长方形的面积=组距×频率组距2.其他统计图表统计图表主要应用扇形图直观描述各部分数据在全部数据中所占的比例条形图和直方图直观描述不同类别或分组数据的频数和频率反映统计对象在不同时间(或其他合适情形)的发展折线图变化情况1.第p百分位数:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.2.计算一组n个数据的第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.3.四分位数:第25百分位数,第50百分位数,第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.知识点四:总体集中趋势的估计1.众数、中位数和平均数的定义(1)众数:一组数据中出现次数最多的数.(2)中位数:一组数据按大小顺序排列后,处于中间位置的数.如果这组数据是偶数个,则取中间两个数据的平均数.(3)平均数:一组数据的和除以数据个数所得到的数.2.众数、中位数、平均数与频率分布直方图的关系(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(3)众数:众数是最高小矩形底边的中点所对应的数据.2.众数、中位数、平均数与频率分布直方图的关系众数众数是最高小长方形底边的中点所对应的数据,表示样本数据的中心值中位数①在频率分布直方图中,中位数左边和右边的直方图面积相等,由此可以估计中位数的值,但是有偏差;②表示样本数据所占频率的等分线平均数①平均数等于每个小长方形的面积乘小长方形底边中点的横坐标之和;②平均数是频率分布直方图的重心,是频率分布直方图的平衡点1.一组数据x1,x2,…,x n的方差和标准差数据x1,x2,…,x n的方差为1n ∑i=1n(x i-x)2=1n∑i=1nx i2-x2,标准差为√1n∑i=1n(x i-x)2.2.总体方差和总体标准差(1)总体方差和标准差:如果总体中所有个体的变量值分别为Y1,Y2,…,Y N,总体的平均数为Y,则称S2= 1N ∑i=1N(Y i-Y)2为总体方差,S=√S2为总体标准差.(2)总体方差的加权形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数为f i(i=1,2,…,k),则总体方差为S2= 1N ∑i=1kf i(Y i-Y)2.3.样本方差和样本标准差如果一个样本中个体的变量值分别为y1,y2,…,y n,样本平均数为y,则称s2= 1n ∑i=1n(y i-y)2为样本方差,s=√s2为样本标准差.4.标准差的意义标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.5.分层随机抽样的方差设样本容量为n,平均数为x,其中两层的个体数量分别为n1,n2,两层的平均数分别为x1,x2,方差分别为s12,s22,则这个样本的方差为s2=n1n [s12+(x1-x)2]+n2n[s22+(x2-x)2].必修第二册第十章概率知识点总结知识点一:有限样本空间与随机事件1.随机试验的概念和特点(1)随机试验:我们把对随机现象的实现和对它的观察称为随机试验,简称试验,常用字母E表示.(2)随机试验的特点:(i)试验可以在相同条件下重复进行;(ii)试验的所有可能结果是明确可知的,并且不止一个;(iii)每次试验总是恰好出现这些可能结果中的一个,但事先不能确定出现哪一个结果.2.样本点和样本空间定义字母表示样本点我们把随机试验E的每个可能的基本结果称为样本点用ω表示样本点样本空间全体样本点的集合称为试验E的样本空间用Ω表示样本空间有限样本空间如果一个随机试验有n个可能结果ω1,ω2,…,ωn,则称样本空间Ω={ω1,ω2,…,ωn}为有限样本空间Ω={ω1,ω2,…,ωn}3.事件的类型我们将样本空间Ω的子集称为随机事件,简称事件,并把只包含一个样本点的事件称为基本事件.随机事件一般用大写字母A,B,C,…表示.在每次试验中,当且仅当A中某个样本点出现时,称为事件A发生.Ω作为自身的子集,包含了所有的样本点,在每次试验中总有一个样本点发生,所以Ω总会发生,我们称Ω为必然事件.而空集⌀不包含任何样本点,在每次试验中都不会发生,我们称⌀为不可能事件.必然事件与不可能事件不具有随机性.为了方便统一处理,将必然事件和不可能事件作为随机事件的两个极端情形.这样,每个事件都是样本空间Ω的一个子集.知识点二:事件的关系和运算1.包含关系定义一般地,若事件A 发生,则事件B 一定发生,我们就称事件B 包含事件A(或事件A 包含于事件B)含义 A 发生导致B 发生 符号表示B ⊇A(或A ⊆B)图形表示特殊情形如果事件B 包含事件A,事件A 也包含事件B,即B ⊇A 且A ⊇B,则称事件A 与事件B 相等,记作A=B2.并事件(和事件)定义一般地,事件A 与事件B 至少有一个发生,这样的一个事件中的样本点或者在事件A 中,或者在事件B 中,我们称这个事件为事件A 与事件B 的并事件(或 和事件)含义 A 与B 至少有一个发生符号表示A ∪B(或A+B)图形表示3.交事件(积事件)定义一般地,事件A 与事件B 同时发生,这样的一个事件中的样本点既在事件A中,也在事件B 中,我们称这样的一个事件为事件A 与事件B 的交事件(或积 事件)含义 A 与B 同时发生 符号表示A ∩B(或AB)图形表示4.互斥(互不相容)一般地,如果事件A与事件B不能同时发生,也就是说A∩B是一个不可能定义事件,即A∩B=⌀,则称事件A与事件B互斥(或互不相容)含义A与B不能同时发生符号表示A∩B=⌀图形表示5.互为对立一般地,如果事件A与事件B在任何一次试验中有且仅有一个发生,即A∪B=定义Ω,且A∩B=⌀,那么称事件A与事件B互为对立.事件A的对立事件记为A 含义A与B有且仅有一个发生符号表示A∩B=⌀,且A∪B=Ω图形表示6.清楚随机事件的运算与集合运算的对应关系有助于解决此类问题.符号事件的运算集合的运算A 随机事件集合A A的对立事件A的补集AB 事件A与B的交事件集合A与B的交集A∪B 事件A与B的并事件集合A与B的并集知识点三:古典概型1.古典概型的定义试验具有如下共同特征:(1)有限性:样本空间的样本点只有有限个;(2)等可能性:每个样本点发生的可能性相等.我们将具有以上两个特征的试验称为古典概型试验,其数学模型称为古典概率模型,简称古典概型.2.古典概型的概率计算公式一般地,设试验E是古典概型,样本空间Ω包含n个样本点,事件A包含其中的k个样本点,则定义事件A的概率P(A)= kn =n(A)n(Ω),其中n(A)和n(Ω)分别表示事件A和样本空间Ω包含的样本点个数.知识点四:概率的基本性质1.概率的基本性质性质1 对任意的事件A,都有P(A)≥0.性质2 必然事件的概率为1,不可能事件的概率为0,即P(Ω)=1,P(⌀)=0.性质3 如果事件A与事件B互斥,那么P(A∪B)=P(A)+P(B).性质4 如果事件A与事件B互为对立事件,那么P(B)=1-P(A),P(A)=1-P(B).性质5 如果A⊆B,那么P(A)≤P(B).性质6 设A,B是一个随机试验中的两个事件,我们有P(A∪B)=P(A)+P(B)-P(A∩B).知识点五:事件的相互独立性1.相互独立事件的定义:对任意两个事件A与B,如果P(AB)=P(A)P(B)成立,则称事件A 与事件B相互独立,简称为独立.2.相互独立事件的性质:当事件A,B相互独立时,则事件A与事件B相互独立,事件A与事件B相互独立,事件A与事件B相互独立.【提示】公式P(AB)=P(A)P(B)可以推广到一般情形:如果事件A1,A2,…,A n相互独立,那么这n个事件同时发生的概率等于每个事件发生的概率的积,即P(A1A2·…·A n)=P(A1)P(A2)·…·P(A n).3. 两个事件是否相互独立的判断方法(1)直接法:由事件本身的性质直接判定两个事件发生是否相互影响.(2)公式法:若P(AB)=P(A)P(B),则事件A,B为相互独立事件.4.求相互独立事件同时发生的概率的步骤:①首先确定各事件之间是相互独立的.②求出每个事件的概率,再求积.5.事件间的独立性关系已知两个事件A,B相互独立,它们的概率分别为P(A),P(B),则有事件表示概率A,B同时发生AB P(A)P(B)A,B都不发生A B P(A)P(B)A,B恰有一个发生(A B)∪(A B) P(A)P(B)+P(A)P(B)A,B中至少有一个发生(A B)∪(A B)∪(AB) P(A)P(B)+P(A)P(B)+P(A)P(B)A,B中至多有一个发生(A B)∪(A B)∪(A B) P(A)P(B)+P(A)P(B)+P(A)P(B)。
高一必修二数学统计与概率
高一必修二数学统计与概率高一必修二数学《统计与概率》是一门非常重要的数学课程,它涉及到统计和概率两个方面的知识。
统计学是指通过对数据的收集、整理、分析和解释来描述和达到对现象、问题及事物的认识,而概率学则是研究随机事件发生的可能性及其规律。
下面我将分别介绍统计和概率的相关内容。
统计学是一门有关数据的科学。
它的主要任务是通过收集数据,对其进行整理、分析和解释,来达到对问题的认识和解决。
在统计学中最基本的数据处理方法是数据的收集和整理。
收集数据可以通过设计实验证明、抽取样本、调查问卷等方法进行。
整理数据则是对收集到的数据进行汇总、分类,计算统计量等。
通过对数据的整理处理,我们可以得到一些重要的统计指标,比如均值、中位数、众数等,这些统计指标能够帮助我们更好地了解数据的分布和集中趋势,从而更准确地描述和分析问题。
在高一必修二的统计学中,我们还需要学习概率的相关知识。
概率学是研究随机事件发生的可能性及其规律的数学分支。
在概率学中,我们经常使用事件的发生概率这个概念。
概率可以通过实验、理论推导和统计调查等方法进行确定。
不同的事件有不同的发生概率,在概率学中,我们用一个介于0和1之间的数值来表示事件发生的可能性大小。
同时,概率还具有一些重要的性质,比如概率的加法定理和乘法定理等,这些性质可以帮助我们计算复杂事件的概率。
除此之外,在高一必修二的统计学中,我们还需要学习一些与概率相关的概念和方法,比如随机变量和概率分布。
随机变量是指在某个随机试验中可能出现的结果,它可以是离散型的,也可以是连续型的。
在对随机变量进行研究时,我们通常会构建其概率分布,通过观察随机事件的规律和性质,来描述和解释随机变量的特点。
总结来说,高一必修二数学《统计与概率》是一门重要且实用的课程。
它通过对大量的数据进行收集、整理、分析和解释,帮助我们更准确地了解问题的本质。
同时,概率的研究也能够帮助我们预测和计算随机事件的可能性,并为决策提供科学的依据。
人教B版高中数学必修二课件 《统计与概率的应用》统计与概率名师优秀课件
第五章 统计与概率
考点 统计与概 率的意义 统计与概 率的应用
学习目标 通过实例进一步理解统计与 概率的意义及应用 能用统计与概率的知识解决 实际生活中的问题
核心素养 数学抽象 数学抽象、 数学运算
判断正误(正确的打“√”,错误的打“×”) (1)事件 A 发生的概率很小时,该事件为不可能事件.( × ) (2)某医院治愈某种病的概率为 0.8,则 10 个人去治疗,一定有 8 人能治愈.( × ) (3)平时的多次比赛中,小明获胜的次数比小华的高,所以这次 比赛应选小明参加.( √ )
解:可以提出如下 2 个方案(答案不唯一). (方案 1)在箱内放置 100 个乒乓球,其中 1 个为黄球,99 个为 白球.顾客一次摸出一个乒乓球,摸到黄球为中大奖,否则中 小奖. (方案 2)在箱内放置 25 个乒乓球,其中 3 个为黄球,22 个为白 球,顾客一次摸出 2 个乒乓球,摸到 2 个黄球中大奖,否则中 小奖.
的概率是多少?
【解】 用 A 表示事件“对这次调整表示反对”,B 表示“对 这次调整不发表看法”,由互斥事件的概率加法公式,得 P(A∪B)=P(A)+P(B)=13070+13060=17030=0.73,因此随机选取 一个被调查者,他对这次调整表示反对或不发表看法的概率是 0.73.
概率在决策问题中的应用 (1)由于概率反映了随机事件发生的可能性的大小,概率是频率 的近似值与稳定值,所以可以用样本出现的频率近似地估计总 体中该结果出现的概率. (2)实际生活与生产中常常用随机事件发生的概率来估计某个 生物种群中个别生物种类的数量、某批次的产品中不合格产品 的数量等.
概率在决策中的应用
某地政府准备对当地的农村产业结构进行调整,为此政
人教高中数学必修二B版《概率》统计与概率教学说课(事件之间的关系与运算)
(2)互斥事件是指事件A与事件B在任何一次试验中都不会同时发
生,具体包括三种不同情形:①事件A发生且事件B不发生;②事件A
不发生且事件B发生;③事件A与事件B均不发生.
(3)在一次试验中,事件A和它的对立事件只能发生其中之一,并且
必然发生其中之一,不可能两个都不发生.
探究二
探究三
探究四
思维辨析
当堂检测
延伸探究你能否求出小明在数学考试中取得70分以下成绩的概
率?
解:小明在数学考试中取得70分以下成绩的概率
课堂篇探究学习
探究一
探究二
探究三
探究四
思维辨析
当堂检测
对立事件的概率
例4(2018全国卷Ⅲ)若某群体中的成员只用现金支付的概率为
0.45,既用现金支付也用非现金支付的概率为0.15,则不用现金支付
派出人数
≤2
3
4
5
≥6
概率
0.1
0.46
0.3
0.1
0.04
(1)求有4人或5人外出家访的概率;
(2)求至少有3人外出家访的概率.
解:(1)设派出2人及以下为事件A,3人为事件B,4人为事件C,5人为
事件D,6人及以上为事件E,则有4人或5人外出家访的事件为事件C
或事件D,C,D为互斥事件,根据互斥事件概率的加法公式可知,
方法点睛(1)对于一个较复杂的事件,一般将其分解成几个简单的
事件,当这些事件彼此互斥时,原事件的概率等于这些事件概率的
和.互斥事件的概率加法公式可以推广为
(2)“正难则反”是解决问题的一种很好的方法,应注意掌握,如本
例中的第(2)问,直接求解比较麻烦,则可考虑求其对立事件的概率,
新教材高中数学第五章统计与概率5-1统计-数据的收集课件新人教B版必修第二册
题型2 简单随机抽样的应用[经典例题] 例2 (1)要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请 选择合适的抽样方法,写出抽样过程; (2)某车间工人加工了一批零件共40件.为了了解这批零件的质量情 况,要从中抽取10件进行检验,如何采用随机数表法抽取样本,写出 抽样步骤.
(2)在随机数表法抽样的过程中要注意: ①编号要求位数相同,读数时应结合编号特点进行读取,如:编号 为两位,则两位、两位地读取;编号为三位,则三位、三位地读取. ②第一个数字的抽取是随机的. ③读数的方向是任意的,且事先定好.
跟踪训练2 (1)第十三届中国(徐州)国际园林博览会于2021年9月开 幕.为做好徐州园博园运营管理工作,2022年春节期间,还需要从30 名大学生中随机抽取8人作为志愿者,请写出抽取样本的过程;
A.100 B.150 C.200 D.250
答案:A
解析:方法一:由题意可得 70 =3
n−70 1
550000,解得n=100,故选A.
方法二:由题意,抽样比为
3
75000=510,总体容量为3
500+1
500=5
000,故n=
5 000×510=100.
4.甲校有3 600名学生,乙校有5 400名学生,丙校有1 800名学生,
新知初探·自主学习
教材要点
知识点一 总体与样本 所 考 察 问 题 涉 及 的 对 象 全 体 是 ___总_体____ , 总 体 中 每 个 对 象 都 是 ___个__体___,抽取的部分对象组成总体的一个样本,一个样本中包含的 个体数目是__样__本____容量. 知识点二 简单随机抽样 1.简单随机抽样的意义:一般地,简单随机抽样(也称为纯随机抽 样)就是从总体中不加任何分组、划类、排队等,完全随机地抽取个 体.简单随机抽样是其它各种抽样形式的基础.通常只是在总体单位
(完整版)高中数学必修2《统计》知识点讲义.docx
第二章统计一、三种抽样方法1、的的基本思想是:用本的某个量去估体的某个量体:在中,所有考察象的全体。
个体:体中的每一个考察象。
本:从体中抽取的一部分个体叫做个体的一个本。
本容量:本中个体的数目。
2、抽方法:要求:体中每个个体被抽取的机会相等(1)随机抽:抽法和随机数表法随机抽的特点是:不放回、等可能.抽法步( 1)先将体中的所有个体(共有N 个)号(号可从 1 到 N)( 2)把号写在形状、大小相同的号上,号可用小球、卡片、条等制作( 3)将些号放在同一个箱子里,行均匀拌(4)抽,每次从中抽出一个号,抽取n 次(5)抽出本随机数表法步(1)将体中的个体号 ( 号位数要一 ) ;( 2)定开始的数字;( 3)按照一定的取号;( 4)取出本(2)系抽系抽特点:容量大、等距、等可能.步 :1.号 , 随机剔除多余个体 , 重新号2.分 ( 段数等于本容量 ), 确定隔度 k=N/n3.抽取第一个个体号 i4. 依定的抽取余下的个体号i+k, i +2k, ⋯(3)分抽分抽特点:体差异明、按所占比例抽取、等可能.步: 1. 将体按一定准分 ;2.算各的个体数与体的个体数的比;3.按比例确定各抽取的本数目4.在每一行抽 ( 可用随机抽或系抽 )二、用样本估计总体1、用样本的频率分布估计总体的分布①作样本频率分布直方图的步骤:(1)求极差;(2)决定组距与组数 ; ( 组数=极差 / 组距 )(3)将数据分组;(4)列频率分布表(分组,频数,频率);(5)画频率分布直方图。
根据频率分布表做频率分布直方图应注意两点:频率⑴纵轴的意义:组距⑵横轴的意义:样本内容(每个矩形下面是组距).例 1、为了了解中学生的身高情况, 对育才中学同龄的50名男学生的身高进行了测量, 结果如下:(单位: cm)175168180176167181162173171177171171174173174175177166163160166166163169174165175165170158174172166172167172175161173167170172165157172173166177169181列出样本的频率分布表, 画出频率分布直方图.解:在这个样本中, 最大值为 181, 最小值为 157, 它们的差是24, 可以取组距为4, 分成 7 组 , 根据题意列出样本的频率分布表如下:分组频数频率156.5 ~ 160.530.06160.5 ~ 164.540.08164.5 ~ 168.5120.24168.5 ~ 172.5120.24172.5 ~ 176.5130.26176.5 ~ 180.540.08180.5 ~ 184.520.04合计50 1.00频率分布直方图( 略 )②茎叶图作图步骤:1.将每个数据分为茎 ( 高位 ) 和叶 ( 低位 ) 两部分 .2. 将最小茎和最大茎之间的数按大小顺序排成一列, 写在左 ( 右 ) 侧;3.将各个数据的叶按大小次序写在其右( 左 ) 侧.例、某中学高二(2) 班甲、乙两名同学自高中以来每场数学考试成绩如下:甲的得分: 95,81,75,91,86,89,71,65,76,88,94,110,107;乙的得分: 83,86,93,99,88,130,98,114,98,79,101.画出两人数学成绩茎叶图, 请根据茎叶图对两人的成绩进行比较.解:甲、乙两人数学成绩的茎叶图如下图:甲乙565 6 1 798 9 6 1 8 6 3 84 15 9 3 9 8 87 10 310 114从这个茎叶图上可看出, 乙同学的得分情况是大致对称的, 中位数是99;甲同学的得分情况除一个特殊得分外,也大致对称, 中位数是89. 因此乙同学发挥比较稳定, 总体得分情况比甲同学好.2、用样本的数据特征估计总体的数据特征( 1)、在频率直方图中计算众数、平均数、中位数众数:在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。
新教材苏教版高中数学必修第二册第14章统计 知识点考点重点难点解题规律归纳总结
第14章统计14.1获取数据的基本途径及相关概念....................................................................... - 1 -14.2抽样 ...................................................................................................................... - 3 -14.2.1简单随机抽样............................................................................................ - 3 -14.2.2分层抽样 ................................................................................................... - 7 -14.3统计图表 ............................................................................................................ - 11 -14.3.1扇形统计图、折线统计图、频数直方图.............................................. - 11 -14.3.2频率直方图 ............................................................................................. - 15 -14.4用样本估计总体................................................................................................. - 19 -14.4.1用样本估计总体的集中趋势参数.......................................................... - 19 -14.4.2用样本估计总体的离散程度参数.......................................................... - 22 -14.4.3用频率直方图估计总体分布.................................................................. - 22 -14.4.4百分位数 ................................................................................................. - 28 -14.1获取数据的基本途径及相关概念知识点1获取数据的基本途径获取数据的基本途径适用类型注意问题通过调查获取数据对于有限总体问题,我们一般通过抽样调查或普查的方法获取数据要充分有效地利用背景信息选择或创建更好的抽样方法,并有效地避免抽样过程中的人为错误通过试验获取数据没有现存的数据可以查询严格控制试验环境,通过精心的设计安排试验,以提高数据质量通过观察获取数据自然现象要通过长久的持续观察获取数据通过查询获取数据众多专家研究过,其收集的数据有所存储必须根据问题背景知识“清洗”数据,去伪存真(1)利用统计报表和年鉴属于哪种获取数据的途径?(2)要了解一种新型灯管的寿命,能通过观察获取数据吗?[提示](1)属于通过查询获取数据的途径.(2)不能,应该通过试验获取数据.知识点2总体、个体、样本、样本容量的概念一般地,在获取数据时,我们把所考察对象(某一项指标的数据)的全体叫作总体,把组成总体的每一个考察对象叫作个体,从总体中所抽取的一部分个体叫作总体的一个样本,样本中个体的数目叫作样本容量.知识点3统计分析的基本步骤和基本思想(1)统计分析的基本步骤获取数据↓分析数据↓作出估计(2)统计分析的基本思想:抽取具有较好代表性的样本,由样本数据的特征、规律估计总体的状况.重点题型类型1获取数据途径的选择【例1】(1)下列数据一般是通过试验获取的是()A.2019年南京市的降雨量B.2019年新生儿人口数量C.某学校高一年级同学的数学测试成绩D.某种特效中成药的配方(2)“中国天眼”为500米口径球面射电望远镜(Five hundred meters Aperture Spherical Telescope,简称FAST),是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是()A.通过调查获取数据B.通过试验获取数据C.通过观察获取数据D.通过查询获得数据(1)D(2)C[(1)某种特效中成药的配方的数据只能通过试验获得.(2)“中国天眼”主要是通过观察获取数据.]选择获取数据途径的依据选择获取数据的途径主要是根据所要研究问题的类型,以及获取数据的难易程度.有的数据可以有多种途径获取,有的数据只能通过一种途径获取,选择合适的方法和途径能够更好地提高数据的可靠性.类型2获取数据途径的方法的设计【例2】为了缓解城市的交通拥堵情况,某市准备出台限制私家车的政策,为此要进行民意调查.某个调查小组调查了一些拥有私家车的市民,你认为这样的调查结果能很好地反映该市市民的意愿吗?[解](1)一个城市的交通状况的好坏将直接影响着生活在这个城市中的每个人,关系到每个人的利益.为了调查这个问题,在抽样时应当关注到各种人群,既要抽到拥有私家车的市民,也要抽到没有私家车的市民.(2)调查时,如果只对拥有私家车的市民进行调查,结果一定是片面的,不能代表所有市民的意愿.因此,在调查时,要对生活在该城市的所有市民进行随机地抽样调查,不要只关注到拥有私家车的市民.在统计活动中,尤其是大型的统计活动,为避免一些外界因素的干扰,通常需要确定调查的对象、调查的方法与策略,需要精心设计前期的准备工作和收集数据的方法,然后对数据进行分析,得出统计推断.14.2抽样14.2.1简单随机抽样知识点1简单随机抽样(1)简单随机抽样的概念一般地,从个体数为N的总体中逐步不放回地取出n个个体作为样本(n<N),如果每个个体都有相同的机会被取到,那么这样的抽样方法称为简单随机抽样.(2)常用的简单随机抽样方法有抽签法和随机数表法.知识点2抽签法抽取样本的步骤(1)将总体中的N个个体编号;(2)将这N个号码写在形状、大小相同的号签上;(3)将号签放在同一箱中,并搅拌均匀;(4)从箱中每次抽出1个号签,连续抽取k次;(5)将总体中与抽到的号签的编号一致的k个个体取出.采用抽签法抽取样本时,为什么将编号写在外观、质地等无差别的小纸片(也可以使用卡片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌?[提示]为了使每个号签被抽取的可能性相等,保证抽样的公平性.知识点3随机数表法抽取样本的步骤(1)对总体中的个体编号(每个号码位数一致);(2)在随机数表中任选一个数;(3)从选定的数开始按一定的方向读下去,若得到的号码在编号中,则取出;若得到的号码不在编号中或前面已经取出,则跳过,如此继续下去,直到取满为止;(4)根据选定的号码抽取样本.重点题型类型1简单随机抽样的判断【例1】下列5个抽样中,简单随机抽样的个数是()①一儿童从玩具箱的20件玩具中任意拿一件玩,玩后放回再拿一件,连续玩了5件;②仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查;③某班从50名同学中,选出5名数学成绩最优秀的同学代表本班参加数学竞赛;④一彩民选号,从装有33个大小、形状都相同的号签的盒子中无放回地抽出6个号签.A.0 B.1 C.2 D.3B[根据简单随机抽样的特点逐个判断.①不是简单随机抽样.因为一儿童从玩具箱的20件玩具中任意拿一件玩,玩后放回再拿一件,连续玩了5件它不是“逐个”抽取.②不是简单随机抽样.虽然“一次性抽取”和“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”.③不是简单随机抽样.因为5名同学是从中挑出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“等可能抽样”的要求.④是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,等可能的抽样.综上,只有④是简单随机抽样.]简单随机抽样必须具备的特点(1)被抽取样本的总体中的个体数N是有限的;(2)抽取的样本是从总体中逐个抽取的;(3)简单随机抽样是一种等可能的抽样.如果三个特征有一个不满足,就不是简单随机抽样.类型2抽签法的应用【例2】从20架钢琴中抽取5架进行质量检查,请用抽签法确定这5架钢琴.[解]第一步,将20架钢琴编号,号码是01,02, (20)第二步,将号码分别写在外观、质地等无差别的小纸片上作为号签.第三步,将小纸片放入一个不透明的盒里,充分搅匀.第四步,从盒中不放回地逐个抽取5个号签,使与号签上编号相同的钢琴进入样本.1.一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是个体之间差异不明显.2.应用抽签法时应注意的问题:(1)编号时,如果已有编号可不必重新编号;(2)号签要求大小、形状完全相同;(3)号签要均匀搅拌;(4)根据实际需要采用有放回或无放回抽取.类型3随机数表法及其综合应用【例3】某市质监局要检查某公司某个时间段生产的500克袋装牛奶的质量是否达标,现从500袋牛奶中抽取10袋进行检验.(1)利用随机数表法抽取样本时,应如何操作?(2)如果用随机试验生成部分随机数如下所示,据此写出应抽取的袋装牛奶的编号.162,277,943,949,545,354,821,737,932,354,873,520,964,384,263,491,648,642,175, 331,572,455,068,877,047,447,672,172,065,025,834,216,337,663,013,785,916,955,567, 199,810,507,175,128,673,580,667.(3)质监局对该公司生产的袋装牛奶检验的质量指标有两个:一是每袋牛奶的质量满足500±5g,二是10袋质量的平均数≥500g,同时满足这两个指标,才认为公司生产的牛奶为合格,否则为不合格.经过检测得到10袋袋装牛奶的质量(单位:g)为:502,500,499,497,503,499,501,500,498,499.计算这个样本的平均数,并按照以上标准判断牛奶质量是否合格.[解](1)第一步,将500袋牛奶编号为001,002, (500)第二步,用随机数工具产生001~500范围内的随机数.第三步,把产生的随机数作为抽中的编号,使编号对应的袋装牛奶进入样本.第四步,重复上述过程,直到产生不同的编号等于样本所需要的数量.(2)应抽取的袋装牛奶的编号为:162,277,354,384,263, 491,175,331,455,068.(3)y=502+500+499+497+503+499+501+500+498+49910=499.8<500,所以该公司的牛奶质量不合格.1.该公司对质监局的这种检验方法并不认可,公司自己质检部门抽取了100袋牛奶按照本例(3)检验标准,统计得到这100袋袋装牛奶的质量都满足500±5g,平均数为500.4g,你认为质监局和公司的检验结果哪一个更可靠?为什么?[解]该公司的质检部门的检验结果更可靠.因为质监局抽取的样本较少,不能很好地反映总体,该公司的质检部门抽取的样本量较大,一般来说,样本量大的会好于样本量小的.尤其是样本量不大时,增加样本量可以较好地提高估计的效果.2.为进一步加强公司生产牛奶的质量,规定袋装牛奶的质量变量值为Y i =⎩⎨⎧1,质量不低于500 g 0,质量低于500 g,质监局又抽取了一个容量为50的样本,其质量变量值如下:1 1 1 0 1 1 1 1 0 0 1 0 1 0 1 0 1 0 1 0 1 1 1 1 0 1 0 1 1 1 0 0 0 1 0 1 0 1 0 0 1 0 0 1 0 1 0 1 0 1据此估计该公司生产的袋装牛奶质量不低于500 g 的比例.[解] 由样本观测数据,计算可得样本平均数为y =0.56,据此估计该公司生产的袋装牛奶质量不低于500 g 的比例约为0.56.随机数表法的注意点(1)当总体容量较大,样本容量不大时,可用随机数表法抽取样本.(2)用随机数表法抽取样本,为了方便,在编号时需统一编号的位数.(3)掌握利用信息技术产生随机数的方法和规则.14.2.2 分层抽样知识点 分层抽样(1)分层抽样的概念当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几个部分,然后按各部分在总体中所占的比实施抽样,这样的抽样方法叫作分层抽样,所分成的各个部分称为层.分层抽样的总体具有什么特性?[提示] 分层抽样的总体按一个或多个变量划分成若干个子总体,并且每一个个体属于且仅属于一个子总体.(2)分层抽样的步骤①将总体按一定标准分层;②计算各层的个体数与总体的个体数的比;③按各层的个体数占总体的个体数的比确定各层应抽取的样本容量;④在每一层进行抽样(可用简单随机抽样).重点题型类型1对分层抽样概念的理解【例1】(1)某政府机关在编人员共100人,其中副处级以上干部10人,一般工作人员70人,后勤人员20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列方法最合适的是()A.抽签法B.随机数法C.简单随机抽样D.分层抽样(2)分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层抽样为保证每个个体等可能抽样,必须进行() A.每层等可能抽样B.每层可以不等可能抽样C.所有层按同一抽样比等可能抽样D.所有层抽取的个体数量相同(1)D(2)C[(1)总体由差异明显的三部分构成,应选用分层抽样.(2)保证每个个体等可能的被抽取是三种基本抽样方式的共同特征,为了保证这一点,分层抽样时必须在所有层都按同一抽样比等可能抽取.]1.使用分层抽样的前提分层抽样的总体按一个或多个变量划分成若干个子总体,并且每一个个体属于且仅属于一个子总体,而层内个体间差异较小.2.使用分层抽样应遵循的原则(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.类型2分层抽样的应用【例2】某学校有在职人员160人,其中行政人员有16人,教师有112人,后勤人员有32人.教育部门为了了解在职人员对学校机构改革的意见,要从中抽取一个容量为20的样本,请利用分层抽样的方法抽取,写出抽样过程.分层抽样中各层的样本容量如何确定?[解]第一步,确定抽样比,样本容量与总体容量的比为20160=18.第二步,确定分别从三类人员中抽取的人数,从行政人员中抽取16×18=2(人);从教师中抽取112×18=14(人);从后勤人员中抽取32×18=4(人).第三步,采用简单随机抽样的方法,抽取行政人员2人,教师人员14人,后勤人员4人.第四步,把抽取的个体组合在一起构成所需样本.分层抽样的步骤类型3分层抽样中的计算问题【例3】(1)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查,假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为() A.101 B.808 C.1 212 D.2 012(2)将一个总体分为A,B,C三层,其个体数之比为5∶3∶2.若用分层抽样方法抽取容量为100的样本,则应从C中抽取________个个体.(3)分层抽样中,总体共分为2层,第1层的样本量为20,样本平均数为3,第2层的样本量为30,样本平均数为8,则该样本的平均数为____________.(1)B (2)20 (3)6 [(1)因为甲社区有驾驶员96人,并且在甲社区抽取的驾驶员的人数为12人, 所以四个社区抽取驾驶员的比例为1296=18,所以驾驶员的总人数为(12+21+25+43)÷18=808(人).(2)∵A ,B ,C 三层个体数之比为5∶3∶2,又有总体中每个个体被抽到的概率相等,∴分层抽样应从C 中抽取100×210=20(个)个体.(3)ω=2020+30×3+3020+30×8=6.]在例3(2)中,A ,B ,C 三层的样本的平均数分别为15,30,20,则样本的平均数为________.20.5 [由题意可知样本的平均数为ω=55+3+2×15+35+3+2×30+25+3+2×20=20.5.]进行分层抽样的相关计算时,常用到的2个关系(1)样本容量n 总体的个数N =该层抽取的个体数该层的个体数; (2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.14.3统计图表14.3.1扇形统计图、折线统计图、频数直方图知识点统计图表统计图表主要应用扇形统计图能够直观描述各类数据占总体的比例频数直方图既直观反映分布状况,又可以表现变化趋势折线统计图描述数据随时间的变化趋势重点题型类型1频率分布表和频数直方图的画法【例1】一个农技站为了考察某种大麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.65.8 5.56.0 6.5 5.1 6.5 5.3 5.9 5.5 5.86.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.56.8 6.0 6.3 5.5 5.0 6.3 5.2 6.07.0 6.46.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.77.46.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.65.36.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.05.66.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.75.8 5.37.06.0 6.0 5.9 5.4 6.0 5.2 6.06.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3根据上面的数据列出频率分布表,绘制出频数直方图,并估计在这块试验田里长度在5.75~6.35 cm之间的麦穗所占的百分比.[解](1)计算最大值与最小值的差:7.4-4.0=3.4.(2)决定组距与组数:若取组距为0.3,因为3.40.3≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12.(3)决定分点:使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55.(4)列频率分布表:分组频数频率[3.95,4.25)10.01[4.25,4.55)10.01[4.55,4.85)20.02[4.85,5.15)50.05[5.15,5.45)110.11[5.45,5.75)150.15[5.75,6.05)280.28[6.05,6.35)130.13[6.35,6.65)110.11[6.65,6.95)100.10[6.95,7.25)20.02[7.25,7.55]10.01合计100 1.00(5)绘制频数直方图如图.从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35 cm之间的麦穗约占41%.频率分布表绘制频数直方图应注意的问题(1)在绘制出频率分布表后,绘制频数直方图的关键就是确定小矩形的高.一般地,频数直方图中两坐标轴上的单位长度是不一致的,合理的定高方法是“以一个恰当的单位长度”(没有统一规定),然后以各组的“频数”所占的比例来定高.如我们预先设定以“”为1个单位长度,代表“1”,则若一个组的频数为2,则该小矩形的高就是“”(占两个单位长度),如此类推.(2)数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~100个左右时,应分成5~12组,在频数直方图中,小长方形的高就是频数,各组频数之和等于样本容量.类型2 频数直方图的应用【例2】 为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频数直方图(如图所示).(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?[解] (1)由频数直方图得,各组的频数分别为6,12,54,42,24,12,所以样本容量为150,因此第二小组的频率为126+12+54+42+24+12=0.08.(2)由频数直方图得达标的各组频数分别为54,42,24,12,可估计该校高一年级学生的达标率为54+42+24+12150×100%=88%.频数直方图的性质:因为小矩形的高表示频数,各组频数的和为样本容量,各组的频率=频数/样本容量,即样本容量=频数/相应的频率.类型3 统计图表的综合应用【例3】 如图是根据某市3月1日至3月10日的最低气温(单位:℃)的情况绘制的折线统计图,试根据折线统计图反映的信息,绘制该市3月1日到10日最低气温(单位:℃)的扇形统计图.[解]该城市3月1日至10日的最低气温(单位:℃)情况如下表:日期12345678910最低气温(℃)-3-20-1120-122其中最低气温为-3 ℃的有1天,占10%,最低气温为-2 ℃的有1天,占10%,最低气温为-1℃的有2天,占20%,最低气温为0℃的有2天,占20%,最低气温为1℃的有1天,占10%,最低气温为2℃的有3天,占30%,扇形统计图如图所示.若本例中条件不变,绘制该市3月1日到3月10日最低气温(单位:℃)的频数直方图.[解]该城市3月1日到3月10日的最低气温(单位:℃)情况如下表:日期12345678910最低气温-3-20-1120-122 (℃)其中最低气温为-3 ℃的有1天,最低气温为-2 ℃的有1天,最低气温为-1 ℃的有2天,最低气温为0 ℃的有2天,最低气温为1 ℃的有1天,最低气温为2 ℃的有3天.频数直方图如图所示.折线统计图的读图方法(1)读折线统计图时,首先要看清楚直角坐标系中横、纵坐标表示的意义,其次要明确图中的数量及其单位.(2)在折线统计图中,从折线的上升、下降可分析统计数量的增减变化情况,从陡峭程度上,可分析数据间相对增长、下降的幅度.14.3.2频率直方图知识点1频率直方图把横轴均分成若干段,每一段对应的长度称为组距,然后以此线段为底作矩形,它的高等于该组的频率组距,这样得出一系列的矩形,每个矩形的面积恰好是该组的频率,这些矩形就构成了频率直方图.(1)对数据分组时,组距、组数的确定有没有固定的标准?(2)当样本容量不超过100时,分多少组合适?[提示](1)组距与组数的确定没有固定的标准,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.在确定分组区间的端点,即分点时,应对分点进行适当调整,使分点比数据多一位小数,并确保每个数据均能落在一个区间内,而不是处于区间的端点.(2)组数与样本容量有关,一般地,样本容量越大,分的组数也越多.当样本容量不超过100时,按照数据的多少,常分成5至12组.知识点2频率折线图如果将频率直方图中各个矩形的上底边的中点顺次连接起来,并将两边端点向外延伸半个组距,就得到频率折线图,简称折线图.重点题型类型1频率分布表的制作及应用【例1】(1)容量为20的样本数据,分组的频数如下表:分组[10,20)[20,30)[30,40)[40,50)[50,60)[60,70]频数234542数据落在区间[10,40)的频率为________.(2)已知一个样本数据:2723252729312730323128262729282426272830以2为组距,列出频率分布表.(1)0.45[数据落在区间[10,40)内的频数为9,样本容量为20,所求频率为9 20=0.45.故填0.45.](2)[解]①计算最大值与最小值的差:最大值为32,最小值为23,它们的差为32-23=9.②已知组距为2,决定组数:因为92=4.5,所以组数为5.③决定分点:[22.5,24.5),[24.5,26.5),[26.5,28.5),[28.5,30.5),[30.5,32.5].④列频率分布表如下:分组频数频率[22.5,24.5)20.1[24.5,26.5)30.15[26.5,28.5)80.4[28.5,30.5)40.2[30.5,32.5]30.15合计2011.频率、频数和样本容量的关系为频率=频数样本容量,利用此式可知二求一.2.制作频率分布表的步骤(1)求全距,决定组数与组距,组距=全距组数;(2)分组,通常对组内数值所在区间取左闭右开区间(或左开右闭区间),最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表.提醒:(1)在制作频率分布表时,分组过多或过少都不好.分组过多会给制作频率分布表带来困难,分组过少虽减少了操作,但不能很好地反映总体情况.一般样本容量越大,所分组数应越多.(2)所分的组数应力求“取整”.组数k=全距组距,若k∈Z,则组数为k;否则,组数为大于k的最小整数,这时需适当增大全距,在两端同时增加适当的范围.(3)在决定分点时,应避免将样本中的数据作为分点,常将分点的数值取比样本中的数据多一位小数.类型2频率直方图、折线图的制作与应用【例2】有同一型号的汽车100辆,为了解这种汽车每耗油1 L所行路程的情况,现从中随机抽出10辆在同一条件下进行耗油1 L所行路程试验,得到如下样本数据(单位:km):13.7,12.7,14.4, 13.8,13.3,12.5,13.5,13.6,13.1,13.4,其分组如下:分组频数频率[12.45,12.95)[12.95,13.45)[13.45,13.95)[13.95,14.45]合计10 1.0(1)(2)根据上表,在给定坐标系中画出频率直方图及频率折线图;(3)根据上述图表,估计总体数据落在[12.95,13.95)中的可能性.[解](1)频率分布表如下.分组频数频率[12.45,12.95) 2 0.2 [12.95,13.45) 3 0.3 [13.45,13.95) 4 0.4 [13.95,14.45]1 0.1 合计101.0(2)频率直方图及频率折线图如图.(3)根据上述图表,可知数据落在[12.95,13.95)中的频率为0.3+0.4=0.7,故总体数据落在[12.95,13.95)中的可能性为0.7.1.制作频率直方图的方法步骤 (1)制作频率分布表.(2)建立直角坐标系:把横轴分成若干段,每一段对应一个组的组距,纵轴表示频率组距. (3)画矩形:在横轴上标明各组端点值,以相邻两点间的线段为底,作高等于该组的频率组距的矩形,这样得到一系列矩形,就构成了频率直方图.2.频率折线图的制作步骤 (1)取每个矩形上底边中点. (2)顺次连接各个中点.(3)取值区间两端点需分别向外延伸半个组距,并取此组距上在x 轴上的点与折线的首、尾分别相连.3.解决频率直方图的相关计算 (1)频率组距×组距=频率,即小长方形的高乘以宽即为落在相应区间数据的频率. (2)频数样本容量=频率,此关系式的变形为频数频率=样本容量.提醒:频率直方图中,每个矩形的高为频率组距,面积为对应组的频率.14.4用样本估计总体14.4.1用样本估计总体的集中趋势参数知识点平均数、众数与中位数的定义(1)平均数:一组数据的和除以数据个数所得到的数.把总体中所有数据的算术平均数称为总体的均值.(2)众数:一组数据中出现次数最多的数.(3)中位数:一组数据按照从小到大的顺序排列后,如果数据的个数为奇数,处于正中间位置的数.如果数据的个数是偶数,则取正中间两个数据的平均数.(1)中位数一定是样本数据中的一个数吗?(2)一组数据可以有几个众数?中位数是否也具有相同的结论?[提示](1)不一定.一组数据按大小顺序排列后,如果有奇数个数据,处于中间位置的数是中位数;如果有偶数个数据,则取中间两个数据的平均数是中位数.(2)一组数据中可能有一个众数,也可能有多个众数,中位数只有唯一一个.重点题型类型1平均数、中位数和众数的计算【例1】已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有() A.a>b>c B.a>c>bC.c>a>b D.c>b>aD[由题意得a=110(16+18+15+11+16+18+18+17+15+13)=15710=15.7,中位数为16,众数为18,则b=16,c=18,∴c>b>a.](1)求样本数据的中位数和众数时,把数据按照从小到大的顺序排列后,按照。
高中高中数学第二章统计章末总结课件新人教A版必修320190108244
(3)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这 10 000人中按分层抽样方法抽出100人作进一步分析,则月收入在[2 500, 3 000)的这段应抽取多少人?
解:(3) 100 = 1 ,0.000 5×500=0.25, 10000 100
10 000×0.25× 1 =25. 100
女生 男生
(A)24
(B)18
(C)16
(D)12
一年级 373 377
二年级 x
370
三年级 y z
解析:(1)由题意可知 x =0.19,所以 x=380,所以三年级的总人数为 y+z=500, 2000
所以应在三年级抽取的学生人数为 500 ×64=16(人),故选 C. 2000
(2)(202X·泰安高一检测)总体由编号为01,02,…,19,20的20个个体组成.
(2)根据(1)中所求线性回归方程,如果植被面积为 200 公顷,那么下降的气温大约是 多少℃?
n
n
(xi x)( yi y)
xi yi n x y
参考公式: b i1 n
(xi x)2
= i1 n
xi2
n
2
x
, a = y -bx .
i 1
i 1
解:(2)由(1)得当 x=200 时, y =0.03×200+2.5=8.5. 所以植被面积为 200 公顷时,下降的气温大约是 8.5 ℃.
(1)求居民收入在[3 000,3 500)的频率; (2)根据频率散布直方图算出样本数据的中位数;
解:(1)0.000 3×500=0.15. (2)0.000 2×500=0.1,0.000 4×500=0.2, 0.000 5×500=0.25. 设中位数为x,则0.1+0.2+(x-2 000)×0.000 5=0.5, 解得x=2 400,中位数为2 400元.
人教高中数学必修二B版《统计与概率的应用》统计与概率说课教学课件
A'∪C',且
延伸探究2例1(2)中若将条件改为“若小明是O型血”,则任找一个
人,其血可以输给小明的概率是多少?
解:因为小明是O型血,所以只有O型血可以输给小明,故“可以输
血给小明”的概率为
课堂篇探究学习
探究一
探究二
探究三
探究四
相互独立事件概率的实际应用
的人数及同意 BC 不同意 A 的人数相同,同意 AB 不同意 C 的人数
与同意 AC 不同意 B 的人数相同,对 ABC 都同意的与对 ABC 都不
1
同意的人数相同并且各占 .由上述条件推测该班至少有(
)
20
A.60人
B.40人
C.20人
D.120人
课堂篇探究学习
探究一
探究二
探究三
探究四
思维辨析
人教版高中数学B版必修二
第五章 统计与概率
5.4 统计与概率的应用
-1-
课标阐释
思维脉络
1.通过实例进
一步理解统计
与概率的意义
及应用.
2.能用统计与
概率的知识解
决日常生活中
的相关问题.
3.通过对实际
问题的解决提
升数学建模与
数据分析的能
力.
课前篇自主预习
1.概率在我们的现实生活中有很多应用.比如说,利用投硬币出现
所以a=(0.22+0.32)×100=54.
课堂篇探究学习
探究一
探究二
探究三
探究四
思维辨析
当堂检测
2.某家具厂为某游泳比赛场馆生产观众座椅.质检人员对该厂所产
高中数学a版必修二统计知识点
高中数学a版必修二统计知识点一、知识概述《高中数学A版必修二统计知识点》①基本定义:统计呢,简单说就是对数据进行收集、整理、分析的学科。
比如调查一个班级同学的身高,把每个同学的身高数据收集起来,然后整理成一定的形式,像按从矮到高排序之类的,最后分析这些数据,找出像平均身高啊、最高最矮同学的身高差距等,这就是统计干的事儿。
②重要程度:在数学学科里是个很实用的部分。
我们生活中到处都有数据,统计能帮我们从这些海量的数据里提取有用的信息,对做决策有很大帮助。
像企业统计产品的销量数据来决定生产数量等。
③前置知识:需要有基本的运算能力,比如加减乘除,因为在处理数据时经常要计算数据的和、平均数等。
还得明白一些数学符号的含义。
④应用价值:实际应用场景超级多。
科学家做实验要统计数据来验证假设,公司要统计市场份额来制定营销策略。
在我们的日常生活中,统计自己每个月的花费,能更好地管理自己的钱财。
二、知识体系①知识图谱:统计这个知识点在高中数学必修二里占一整块内容,和函数、几何这些知识相对独立,但它也能为一些数学建模题提供分析数据的方法。
②关联知识:和概率有点关系,概率往往是基于统计数据得出的。
比如说,统计多次抛硬币正面朝上的次数,根据这个统计的数据能更好地理解抛硬币正面朝上的概率。
③重难点分析:掌握难度的话,我觉得对于数据多的统计分析可能有点麻烦,比如大量样本的数据整理和分析。
关键点是能准确提取数据、会使用统计方法,像计算平均数、方差等。
④考点分析:在考试中占有一定比重。
考查方式有给数据求平均数、方差等,也有可能让你设计一个统计方案,比如调查学校里学生对食堂饭菜满意度的统计方案。
三、详细讲解【理论概念类】①概念辨析:像总体,就是我们要研究的所有对象的集合。
比如说要研究全校学生的身高,全校学生的身高数据就是总体。
样本是从总体里面抽取的一部分用于代表总体的。
比如从全校每个年级抽一部分学生的身高,这部分学生的身高就是样本。
新教材 人教B版高中数学必修第二册 第五章 统计与概率 知识点考点及解题方法提炼汇总
第五章统计与概率5.1统计 (1)5.1.1数据的收集 (1)第1课时总体与样本、简单随机抽样 (1)第2课时分层抽样 (5)5.1.2数据的数字特征 (8)5.1.3数据的直观表示 (14)5.1.4用样本估计总体 (21)5.3概率 (25)5.3.1样本空间与事件 (25)5.3.2事件之间的关系与运算 (28)5.3.3古典概型 (32)5.3.4频率与概率 (36)5.3.5随机事件的独立性 (38)5.4统计与概率的应用 (42)5.1统计5.1.1数据的收集第1课时总体与样本、简单随机抽样知识点总体所考察问题涉及的__对象全体__是总体个体总体中__每个对象__都是个体样本抽取的部分对象组成总体的一个样本样本一个样本中包含的__个体数目__是样本容量容量知识点普查与抽样调查一般地,对总体中__每个个体__都进行考察的方法称为普查(也称全面调查),只抽取__样本__进行考察的方法称为抽样调查.知识点简单随机抽样(1)定义:一般地,简单随机抽样(也称纯随机抽样)就是从总体中不加任何__分组__、划类、__排队__等,完全随机地抽取个体.(2)两种常见方法:①__抽签法__;②__随机数表法__.思考1:抽签法与随机数表法的异同点是什么?提示:抽签法随机数表法不同点①抽签法比随机数表法简单;②抽签法适用于总体中的个体数相对较少的情况①随机数表法要求编号的位数相同;②随机数表法适用于总体中的个体数相对较多的情况相同点①都是简单随机抽样,并且要求被抽取样本的总体的个数有限;②都是从总体中逐个不放回地抽取知识点随机数表法进行简单随机抽样的步骤思考2:用随机数表进行简单随机抽样的规则是什么?提示:(1)定方向:读数的方向(向左、向右、向上或向下都可以).(2)读数规则:读数时结合编号的特点进行读取,编号为两位数则两位两位地读取,编号为三位数则三位三位地读取,若得到的号码不在编号中或已被选用,则跳过,直到选满所需号码为止.题型简单随机抽样的概念典例剖析典例1下面的抽样方法是简单随机抽样吗?为什么?(1)从无数个个体中抽取50个个体作为样本;(2)仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查;(3)某连队从200名党员官兵中,挑选出50名最优秀的官兵赶赴青海参加抗震救灾工作;(4)一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签;(5)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出1个零件进行质量检验后,再把它放回箱子里.[分析]若抽取样本的方式是简单随机抽样,它应具备哪些特点?[解析](1)不是简单随机抽样.因为简单随机抽样要求被抽取的样本总体的个数是有限的.(2)不是简单随机抽样.虽然“一次性抽取”和“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”.(3)不是简单随机抽样.因为50名官兵是从中挑出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“等可能抽样”的要求.(4)是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能的抽样.(5)不是简单随机抽样.因为它是有放回抽样.规律方法:1.如果一个总体满足下列两个条件,那么可用简单随机抽样抽取样本:(1)总体中的个体之间无差异;(2)总体个数不多.2.判断所给的抽样是否为简单随机抽样的依据是简单随机抽样的四个特征:上述四点特征,如果有一点不满足,就不是简单随机抽样.题型抽签法典例剖析典例2要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试.请选择合适的抽样方法,并写出抽样过程.[分析]已知N=30,n=3.抽签法抽样时编号1、2、…、30,抽取3个编号,对应的汽车组成样本.[解析]应使用抽签法,步骤如下:①将30辆汽车编号,号码是1、2、3、 (30)②将1~30这30个编号写到大小、形状都相同的号签上;③将写好的号签放入一个不透明的容器中,并搅拌均匀;④从容器中每次抽取一个号签,连续抽取3次,并记录上面的编号;⑤所得号码对应的3辆汽车就是要抽取的对象.规律方法:抽签法的5个步骤题型随机数表法典例剖析典例3假设要考查某企业生产的袋装牛奶的质量是否达标,现从500袋牛奶中抽取60袋进行检验,利用随机数表法抽取样本时,先将500袋牛奶按000,001,…,499进行编号,如果从随机数表第8行第26列的数开始,按三位数连续向右读取,最先检验的5袋牛奶的号码是(下面摘取了某随机数表第7行至第9行)(B)844217533157245506887704744767217633502583921206766301647859169555671998105071851286735807443952387933211A.455068047447176B.169105071286443C.050358074439332D.447176335025212[解析]第8行第26列的数是1,依次取三位数169、555、671、998、105、071、851、286、735、807、443、…,而555、671、998、851、735、807超过最大编号499,故删掉,所以最先检验的5袋牛奶的号码依次为:169、105、071、286、443,故选B.规律方法:用随机数表法抽取样本的步骤:(1)将总体中的每个个体编号(每个号码位数一样).(2)在随机数表中任选一个数作为起始号码.(3)从选定的数开始,按一定的方向读下去,若得到的号码在编号中,则取出;若得到的号码不在编号中或与前面取出的数重复,则跳过不取,如此进行下去,直到取满为止.(4)根据选定的号码抽取样本.易错警示典例剖析典例4 一个布袋中有6个同样质地的小球,从中不放回地抽取3个小球,则某一特定小球被抽取的可能性是__12__;第三次抽取时,每个小球被抽取的可能性是__14__.[错解] 因为简单随机抽样时每个个体被抽取的可能性均为n N ,所以两空均填12. [辨析] 本题解答错误的原因在于混淆了抽样中,样本被抽到的可能性与每次抽取中个体被抽到的可能性.[正解] 因为简单随机抽样时每个个体被抽取的可能性为n N ,所以第一个空填12,而抽样是无放回抽样,所以第一次抽取时,每个小球被抽取的可能性为16,第二次抽取时,剩余5个小球被抽取的可能性为15,第三次抽取时,剩余4个小球,每个小球被抽取的可能性为14.因此,第二个空填14.第2课时 分层抽样 知识点分层抽样1.定义一般地,如果相对于要考察的问题来说,总体可以分成有__明显差别__的、__互不重叠__的几部分时,每一部分可称为层,在各层中按__层在总体中所占比例__进行随机抽样的方法称为分层随机抽样(简称为分层抽样)思考1:如何理解“层在总体中所占比例”?提示:从N 个个体中抽取n 个个体,若将总体分为A ,B ,C 三层,含有的个体数目分别是x ,y ,z ,在A ,B ,C 三层应抽取的个体数目分别是a ,b ,c ,那么a x =b y =c z =n N .2.应用的广泛性(1)分层抽样所得到的样本,一般更具有代表性,可以更准确地反映总体的特征,尤其是在层内个体相对同质而层间差异较大时更是如此.(2)分层抽样在各层中抽样时,还可根据各层的特点灵活地选用不同的随机抽样方法.(3)想同时获取总体的信息和各层的内部信息时,常采用分层抽样.思考2:简单随机抽样和分层抽样的联系和区别是什么?提示:类别简单随机抽样分层抽样各自特点从总体中逐个抽取将总体分成几层,分层进行抽取相互联系在各层抽样时采用简单随机抽样适用范围总体中的个体数较少总体由存在明显差异的几部分组成共同点①抽样过程中每个个体被抽到的可能性相等②每次抽出个体后不再放回,即不放回抽样题型分层抽样的概念典例剖析典例1下列问题中,最适合用分层抽样抽取样本的是(B)A.从10名同学中抽取3人参加座谈会B.某社区有500个家庭,其中高收入的家庭125户,中等收入的家庭280户,低收入的家庭95户.为了了解生活购买力的某项指标,要从中抽取一个容量为100户的样本C.从1 000名工人中抽取100人调查上班途中所用的时间D.从生产流水线上抽取样本检查产品质量[分析]根据分层抽样的特点选取.[解析]A中总体所含个体无差异且个数较少,适合用简单随机抽样;C和D中总体所含个体无差异且个数较多,不适合用分层抽样;B中总体所含个体差异明显,适合用分层抽样.规律方法:分层抽样的依据(1)适用于总体由差异明显的几部分组成的情况.(2)样本能更充分地反映总体的情况.(3)等可能抽样,每个个体被抽到的可能性都相等.题型分层抽样中的有关计算典例剖析典例2(1)某校有高级教师26人,中级教师104人,其他教师若干人.为了了解该校教师的工资收入情况,若按分层抽样从该校的所有教师中抽取56人进行调查,已知从其他教师中共抽取了16人,则该校共有教师__182__人.(2)某网站针对“2020年法定节假日调休安排”提出的A,B,C三种放假方案进行了问卷调查,调查结果如下:支持A方案支持B方案支持C方案35岁以下的人数200400800 35岁以上(含35岁)的人数100100400的人中抽取了6人,求n的值.②从支持B方案的人中,用分层抽样的方法抽取5人,这5人中在35岁以上(含35岁)的人数是多少?35岁以下的人数是多少?[解析](1)设该校其他教师有x人,则16x=5626+104+x,解得x=52,经检验,x=52是原方程的根,故全校教师共有26+104+52=182人.(2)①由题意得6100+200=n200+400+800+100+100+400,解得n=40.②35岁以下的人数为5500×400=4人,35岁以上(含35岁)的人数为5-4=1人.[母题探究]将本例的条件改为“A,B,C三种放假方案人数之比为2∶3∶5.现用分层抽样方法抽取一个容量为n的样本,样本中A方案有16人”,求样本的容量n.[解析]由于A,B,C三种放假方案人数之比为2∶3∶5,样本中A方案有16人,则210=16n,解得n=80.规律方法:分层抽样中的求解技巧(1)样本容量n总体的个体数N=该层抽取的个体数该层的个体数.(2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.题型分层抽样的方案设计典例剖析典例3一个单位有职工160人,其中有业务人员112人,管理人员16人,后勤服务人员32人,为了了解职工的某种情况,要从中抽取一个容量为20的样本,写出用分层抽样的方法抽取样本的过程.[分析]分层抽样中各层抽取个体数依各层个体数之比来分配,确定各层抽取的个体数之后,可采用简单随机抽样在各层中抽取个体.[解析]三部分所含个体数之比为112∶16∶32=7∶1∶2,设三部分各抽个体数为7x,x,2x,则由7x+x+2x=20得x=2.故业务人员、管理人员、后勤服务人员抽取个体数分别为14,2和4.对112名业务人员进行编号,用随机数表法抽样抽取14人.再用抽签法可抽出管理人员和服务人员的号码.将以上各层抽出的个体合并起来,就得到容量为20的样本.规律方法:分层抽样的注意事项分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,各层之间的样本差异要大,且互不重叠.(2)为了保证每个个体等可能入样,所有层应采用同一抽样比,等可能抽样.(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.[特别提醒]保证每个个体等可能入样是简单随机抽样、分层抽样共同的特征,为了保证这一点所有层按同一抽样比,等可能抽样.易错警示典例剖析抽样方法选择不当导致所得样本不具有代表性典例4某单位有职工120人,欲从中抽取20人调查职工的身体状况.领导安排工会某干部负责抽样,他应该怎样做?[错解]将120名职工编号,用随机数表法抽样抽取20人作为样本.[辨析]年龄对人的身体状况有较大影响,这种不考虑年龄抽取的样本不能准确反应单位职工的身体状况.[正解]先将这120名职工根据年龄分为老年组、中年组、青年组,再按1 6的比例在各组中抽取相应的人数,即用分层抽样的方法抽取样本.5.1.2数据的数字特征知识点最值。
部编版高中数学必修二第九章统计知识点总结归纳
(名师选题)部编版高中数学必修二第九章统计知识点总结归纳单选题1、某老师为了解某班50名同学在家学习的情况,决定将本班学生依次编号为01,02,⋅⋅⋅,50.利用下面的随机数表选取10名学生调查,选取方法是从下面随机数表的第1行第2列开始由左到右依次读取两个数字,则选出来的第4名学生的编号为()7 2 5 6 0 8 1 3 0 2 5 8 3 2 4 9 8 7 0 2 4 8 1 2 9 7 2 8 0 19 8 3 1 0 4 9 2 3 1 4 9 3 5 8 2 0 9 3 6 2 4 4 8 6 9 6 9 3 87 4 8 1A.25B.24C.29D.19答案:C分析:利用随机表法从第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个即可求解.从题中随机数表的第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个可得:25 ,30 ,24,2 9,19,10 ,49 ,23,14,20,故选出来的第4名学生的编号为29.故选:C.2、从某中学随机抽取100名学生,将他们的身高数据(单位cm)绘制成频率分布直方图,若要从身高在[150,160),[160,170),[170,180]三组内的学生中,用分层抽样的方法选取16人参加一次活动.则从身高在[170,180]内的学生中选取的人数应为()A.3B.4C.5D.7答案:B分析:先求得a 的值,然后结合分层抽样的知识计算出正确答案.依题意(0.005+0.015+a +0.035+0.02)×10=1,解得a =0.025,身高在[150,160),[160,170),[170,180]三组内的学生比例为0.025:0.035:0.02=5:7:4,用分层抽样的方法选取16人参加一次活动,则从身高在[170,180]内的学生中选取的人数应为4人故选:B3、某高中学校为了促进学生个体的全面发展,针对学生发展要求,开设了富有地方特色的“泥塑”与“剪纸”两个社团.已知报名参加这两个社团的学生共有800人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如下表:其中x :y :z =5:3:2,且“泥塑”社团的人数占两个社团总人数的35.为了了解学生对两个社团活动的满意程度,从中抽取一个容量为50的样本进行调查,则从“剪纸”社团的高二年级学生中应抽取的人数为( )A .4B .6C .9D .10答案:B 分析:先按分层抽样求出高二年级人数,再按样本占总体的比例得解.因为“泥塑”社团的人数占总人数的35,所以“剪纸”社团的人数占总人数的25,人数为800×25=320. 因为“剪纸”社团中高二年级人数比例为y x+y+z =35+3+2=310,所以“剪纸”社团中高二年级人数为320×310=96.以从“剪纸”社团的高二年级学生中抽取的人数为96×50800=96×116=6.故选:B.4、某书店新进了一批书籍,下表是某月中连续6天的销售情况记录:本B.1110本C.1340本D.1278本答案:A分析:由表格中的数据可以看出每天的销售数量在一个数值附近波动,故用平均数估计总体即可.(30+40+28+44+38+42)=37(本),该月共31由表中6天的销售情况可得,一天的平均销售量为16天,故该月的销售总量约为37×31=1147(本).故选: A5、某地教育局为了解“双减”政策的落实情况,在辖区内高三年级在校学生中抽取100名学生,调查他们课后完成作业的时间,根据调查结果绘制如下频率直方图.根据此频率直方图,下列结论中不正确的是()A.所抽取的学生中有25人在2小时至2.5小时之间完成作业B.该地高三年级学生完成作业的时间超过3小时的概率估计为35%C.估计该地高三年级学生的平均做作业的时间超过2.7小时D.估计该地高三年级有一半以上的学生做作业的时间在2小时至3小时之间答案:D分析:对A,利用直方图中2小时至2.5小时之间的频率判断A;对B,计算超过3小时的频率可判断B;对C,根据直方图中平均数的公式计算,可判断C;对D,计算做作业的时间在2小时至3小时之间的频率,可判断D.对A,直方图中2小时至2.5小时之间的频率为(2.5−2)×0.5=0.25,故所抽取的学生中有100×0.25=25人在2小时至2.5小时之间完成作业,故A正确;对B,由直方图得超过3小时的频率为0.5×(0.3+0.2+0.1+0.1)=0.35,所以B正确;对C,直方图可计算学生做作业的时间的平均数为:1.25×0.05+1.75×0.15+2.25×0.25+2.75×0.20+3.25×0.15+3.75×0.10+4.25×0.05+4.75×0.05=2.75>2.7,所以C正确;对D,做作业的时间在2小时至3小时之间的频率为0.5×(0.5+0.4)=0.45<0.5,所以D错误.故选:D.6、人口普查是世界各国所广泛采用的搜集人口资料的一种科学方法,是提供全国基本人口数据的主要来源.根据人口普查的基本情况,可以科学的研究制定社会、经济、科教等各项发展政策,是国家科学决策的重要基础工作,人口普查资料是制定人口政策的依据和前提.截止2020年10月10日,我国共进行了六次人口普查,下图是这六次人口普查的人数和增幅情况,下列说法正确的是()A.人口数逐次增加,第二次增幅最大B.第六次普查人数最多,第四次增幅最小C.第六次普查人数最多,第三次增幅最大D.人口数逐次增加,从第二次开始增幅减小答案:C分析:人口数由柱状图判断,增幅由折线图判断.A.人口数逐次增加,第三次增幅最大,故错误;B.第六次普查人数最多,第六次增幅最小,故错误;C.第六次普查人数最多,第三次增幅最大,故正确;D.人口数逐次增加,从第三次开始增幅减小,故错误;故选:C7、某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:66674037146405711105650995866876832037905716031163149084452175738805905223594310若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本编号是()A.10B.09C.71D.20答案:B分析:按照题意依次读出前4个数即可.从随机数表第1行的第9列数字开始由左向右每次连续读取2个数字,删除超出范围及重复的编号,符合条件的编号有14,05,11,09,所以选出来的第4个个体的编号为09,故选:B8、某大学工程学院共有本科生1200人、硕士生400人、博士生200人,要用分层抽样的方法从中抽取一个容量为180的样本,则应抽取博士生的人数为()A.20B.25C.40D.50答案:A分析:直接利用分层抽样,即可计算.因为学院共有本科生1200人、硕士生400人、博士生200人,×180=20.所以应抽取博士生的人数为2001200+400+200故选:A多选题9、2021年11月10日,中国和美国在联合国气候变化格拉斯哥大会期间发布《中美关于在21世纪20年代强化气候行动的格拉斯哥联合宣言》(以下简称《宣言》).承诺继续共同努力,并与各方一道,加强《巴黎协定》的实施,双方同意建立“21世纪20年代强化气候行动工作组”,推动两国气候变化合作和多边进程.为响应《宣言》要求,某地区统计了2020年该地区一次能源消费结构比例,并规划了2030年一次能源消费结构比例,如下图所示:经测算,预估该地区2030年一次能源消费量将增长为2020年的2.5倍,预计该地区()A.2030年煤的消费量相对2020年减少了B.2030年天然气的消费量是2020年的5倍C.2030年石油的消费量相对2020年不变D.2030年水、核、风能的消费量是2020年的7.5倍答案:BD分析:设2020年该地区一次能源消费总量为a,计算出2030年该地区煤、石油、天然气以及水、核、风能的消费量,逐项判断可得出合适的选项.设2020年该地区一次能源消费总量为a,2020年煤的消费量为0.6a,规划2030年煤的消费量为a×2.5×0.3=0.75a>0.6a,故A错误;2020年天然气的消费量为0.1a,规划2030年天然气的消费量为a×2.5×0.2=0.5a=5×0.1a,故B正确;2020年石油的消费量为0.2a,规划2030年石油的消费量为a×2.5×0.2=0.5a>0.2a,故C错误;2020年水、核、风能的消费量为0.1a,规划2030年水、核、风能的消费量为a×2.5×0.3=0.75a=7.5×0.1a,故D正确.故选:BD.10、冬末春初,乍暖还寒,人们容易感冒发热.若发生群体性发热,则会影响到人们的身体健康,干扰正常工作生产.某大型公司规定:若任意连续7天,每天不超过5人体温高于37.3℃,则称没有发生群体性发热.下列连续7天体温高于37.3℃人数的统计特征数中,能判定该公司没有发生群体性发热的为()A.中位数为3,众数为2B.均值小于1,中位数为1C.均值为2,标准差为√2D.均值为3,众数为4答案:BC分析:根据题意,设连续7天,每天体温高于37.3℃的人数分别为a,b,c,d,e,f,g,可得0≤a≤b≤c≤d≤e≤f≤g,然后根据选项,结合反例依次判定,即可求解.由题意,连续7天,每天体温高于37.3℃的人数分别为a,b,c,d,e,f,g,可得0≤a≤b≤c≤d≤e≤f≤g,对于A中,取2,2,2,2,3,4,6,则满足中位数为3,众数为2,但第7天的人数6>5,所以A不正确;对于B中,若g≥6,由中位数为1,可知均值为1(a+b+c+d+e+f+g)≥1,与均值小于1矛盾,所以7B正确;对于C中,当均值为2,标准差为√2时,a+b+⋯+g=14,且(a−2)2+⋯+(g−2)2=14,若g≥6,则(a−2)2+(b−2)2+⋯+(g−2)2>14,例如:1,1,1,1,2,3,5,符合题意,所以C正确;对于D中,取0,1,2,4,4,4,6,则满足均值为3,众数为4,但第7天人数6>5,所以D不正确.故选:BC.11、小明用某款手机性能测试APP对10部不同品牌的手机的某项性能进行测试,所得的分数按从小到大的顺序(相等数据相邻排列)排列为:81,84,84,87,x,y,93,96,96,99,已知总体的中位数为90,则()A.x+y=180B.该组数据的均值一定为90C.该组数据的众数一定为84和96D.若要使该总体的标准差最小,则x=y=90答案:ABD分析:依题意可得x+y=180,即可求出平均数,即可判断A、B,再利用特殊值判断C,利用基本不等式判断D;(81+84+84+87+x+y+93+解:因为总体的中位数为90,所以x+y=180,所以该组数据的均值为11096+96+99)=90,故A正确,B正确,当x=y=90时,众数为84,90,96,当x=87,y=93时,众数为84,87,93,96,故C错误;要使该总体的标准差最小,即方差最小,即(x−90)2+(y−90)2最小,又(x−90)2+(y−90)2≥(x+y−180)2=0,当且仅当x−90=y−90时,即x=y=90时等号成立,故D正确.2故选:ABD填空题12、某工厂为了解产品的生产情况,随机抽取了50个样本,若样本数据x1,x2,⋯,x50的方差为8,则数据3x1−1,3x2−1,⋯,3x50−1的方差为___________.答案:72分析:根据方差的性质可得答案.样本数据x1,x2,⋯,x50的方差为8,所以数据3x1−1,3x2−1,⋯,3x50−1的方差为32×8=72.所以答案是:72.13、某学校组织学生参加数学测试,成绩的频率分布直方图如下,数据的分组依次是[20,40),[40,60),[60,80),[80,100],则可估计这次数学测试成绩的第40百分位数是_________.答案:65分析:利用百分位数的定义求解.解:成绩在[20,60)的频率是(0.005+0.01)×20=0.3,成绩在[20,80)的频率为0.3+0.02×20=0.7,所以第40百分位数一定在[60,80)内,×20=65,所以这次数学测试成绩的第40百分位数是60+0.4−0.30.4所以答案是:65。
人教B版高中数学必修二课件 《统计》统计与概率PPT(数据的数字特征)
3.做一做:某学员在一次射击测试中射靶10次,命中环数如下:
7,8,7,9,5,4,9,10,7,4.
则:(1)平均命中环数为
;
(2)命中环数的标准差为
.
答案:(1)7 (2)2
7+8+7+9+5+4+9+10+7+4
解析:(1) =
=7.
10
1
(2)∵s2= 10
[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(107)2+(7-7)2+(4-7)2]=4,∴s=2.
探究四
当堂检测
1
解:(1)甲 = ×(99+100+98+100+100+103)=100,
1
6
乙 = ×(99+100+102+99+100+100)=100,
6
1
2
甲
= 6×[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(1007
2
2
100) +(103-100) ]= ,
则没有众数.
课堂篇探究学习
探究一
探究二
探究三
探究四
当堂检测
延伸探究求出变式训练1中数据的众数与中位数.
解:众数为24与30.
1
中位数为×(22+24)=23.
2
课堂篇探究学习
探究一
探究二
新人教版高中数学必修第二册统计全套PPT课件
9 .1.1 简单随机抽样
新课程标准 1.通过实例,了解简单随机抽样的含义及其解决问题的过
程,掌握两种简单随机抽样方法:抽签法和随机数法. 2.会计算样本均值和总体均值,了解样本与总体的关系.
新学法解读 1.熟练掌握简单随机抽样的两种方法之间的差异分
析与优缺点判断. 2.通过设计抽签法或随机数法完成抽样,体会简单随
2.抽签法与随机数法的异同点 ①都属于简单随机抽样,并且要求被抽取样本的总
相同点 体的个体数有限; ②都是从总体中逐个不放回地进行抽取 ①抽签法比随机数法操作简单; ②随机数法更适用于总体中个体数较多的时候,而
不同点 抽签法适用于总体中个体数较少的情况,所以当总 体中的个体数较多时,应当选用随机数法,可以节 约大量的人力和制作号签的成本
用样本平均数估计总体平均数
[例 3] 某校为调查全校学生的睡眠时间,从全体学生中用随
机数法抽取了一个容量为 100 的简单随机样本,他们的睡眠时间
如下表(单位:h):
睡眠
合
[6,6.5) [6.5,7) [7,7.5) [7.5,8) [8,8.5) [8.5,9)
时间
计
人数 5
17
33
37
6
2 100
0702 3623 B.07 D.01
4369 4869
9728 6938
0198 7481
解析:从随机数表第 1 行的第 5 列和第 6 列数字开始由左 到右一次选取两个数字开始向右读,第一个数为 65,不 符合条件,第二个数为 72,不符合条件,第三个数为 08, 符合条件,以下符合条件的数字依次为 02,14,07,01,故第 5 个数为 01.故选 D.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章统计
一、三种抽样方法
1、统计的的基本思想是:用样本的某个量去估计总体的某个量
总体:在统计中,所有考察对象的全体。
个体:总体中的每一个考察对象。
样本:从总体中抽取的一部分个体叫做这个总体的一个样本。
样本容量:样本中个体的数目。
2、抽样方法:要求:总体中每个个体被抽取的机会相等
(1)简单随机抽样:抽签法和随机数表法
简单随机抽样的特点是:不放回、等可能.
抽签法步骤
(1)先将总体中的所有个体(共有N个)编号(号码可从1到N)
(2)把号码写在形状、大小相同的号签上,号签可用小球、卡片、纸条等制作
(3)将这些号签放在同一个箱子里,进行均匀搅拌(4)抽签时,每次从中抽出一个号签,连续抽取n次
(5)抽出样本
随机数表法步骤
(1)将总体中的个体编号(编号时位数要统一);(2)选定开始的数字;(3)按照一定的规则读取号码;(4)取出样本
(2)系统抽样
系统抽样特点:容量大、等距、等可能.
步骤:
1.编号,随机剔除多余个体,重新编号
2.分组 (段数等于样本容量),确定间隔长度 k=N/n
3.抽取第一个个体编号为i
4.依预定的规则抽取余下的个体编号为i+k, i+2k, …
(3)分层抽样
分层抽样特点:总体差异明显、按所占比例抽取、等可能.
步骤:1.将总体按一定标准分层;
2.计算各层的个体数与总体的个体数的比;
3.按比例确定各层应抽取的样本数目
)
可用简单随机抽样或系统抽样 (在每一层进行抽样4.
二、用样本估计总体
1、用样本的频率分布估计总体的分布
①作样本频率分布直方图的步骤:
(1)求极差;
(2)决定组距与组数; (组数=极差/组距)
(3)将数据分组;
(4)列频率分布表(分组,频数,频率);
(5)画频率分布直方图。
根据频率分布表做频率分布直方图应注意两点:
频率⑴纵轴的意义:组距⑵横轴的意义:样本内容(每个矩形下面是组距).
例1、为了了解中学生的身高情况,对育才中学同龄的50名男学生的身高进行了测量,结果如下:(单位:cm)
175 168 180 176 167 181 162 173 171 177
171 171 174 173 174 175 177 166 163 160
166 166 163 169 174 165 175 165 170 158
174 172 166 172 167 172 175 161 173 167
170 172 165 157 172 173 166 177 169 181
列出样本的频率分布表,画出频率分布直方图.
解:在这个样本中,最大值为181,最小值为157,它们的差是24,可以取组距为4,分成7组,根据
题意列出样本的频率分布表如下:
频率分组频数
0.06 156.5~160.5 3
0.08 160.5~164.5 4
0.24 164.5~168.5 12
0.24 12 ~168.5172.5
0.26 176.5 172.5~ 13
0.08
176.5 4 ~180.5
0.04
184.5 180.5~ 2
1.00
50
合计
)
略(频率分布直方图
:
②茎叶图作图步骤.
两部分(低位)1.将每个数据分为茎(高位)和叶; 侧右)2.将最小茎和最大茎之间的数按大小顺序排成一列,写在左(. 侧左)3.将各个数据的叶按大小次序写在其右(
(2)班甲、乙两名同学自高中以来每场数学考试成绩如下:例、某中学高二
95,81,75,91,86,89,71,65,76,88,94,110,107;甲的得分:
83,86,93,99,88,130,98,114,98,79,101.
乙的得分:. ,请根据茎叶图对两人的成绩进行比较画出两人数学成绩茎叶图
解:甲、乙两人数学成绩的茎叶图如下图:
甲乙
56
5 6 1 7 9
8 9 6 1 8 6 3 8
4 1
5 9 3 9 8 8
7 10 3 1
0 11 4
从这个茎叶图上可看出,乙同学的得分情况是大致对称的,中位数是99;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是89.因此乙同学发挥比较稳定,总体得分情况比甲同学好.
2、用样本的数据特征估计总体的数据特征
(1)、在频率直方图中计算众数、平均数、中位数
众数:在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。
中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等
平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和
(2)、标准差和方差:描述了数据的波动范围,离散程度
1222]x)?(x?(x?x)?s?[(x?x)标准差n21n
12222]s?x)(x(x?x)?[(x?x)??方差n12n
扩展:
①若x,x,???,x的平均数为x,则mx?a,mx?a,???,mx?a的平均数为mx?a.nn1212222.saax?b的方差为?axb,ax?b,???xx②若,x,???,的方差为s,,则n1221n
3.两变量之间的关系 (1)相关关系——非确定性关系 (2)函数关系——确定性关系
???yxy?n?(x?x)(yy)x?iiii??1?1ii???b,?
???ax?y?b回归直线方程:4.nn
??22xxn??(xx)ii?1??1ii???
nn2?
?xba?y??
??.,说明:回归直线过定点xy
例如:
5. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。
其基本步骤是:①画出两个变量的散点图;
②求回归直线方程;
③并用回归直线方程进行预报。