高中数学必修2《统计》知识点讲义
高中统计知识点总结
高中统计知识点总结统计学是一门研究数据收集、整理、分析和解释的学科。
在高中数学课程中,统计学是一个重要的分支,它提供了丰富的工具和方法来帮助我们理解和利用数据。
以下是我对高中统计学知识点的总结。
1. 数据的收集与整理统计学的第一步是收集数据。
数据可以通过调查问卷、实验、观察等方式获取。
在收集数据之后,我们需要对其进行整理和处理,以便更好地进行分析。
常用的整理数据的方式有列频数表和绘制条形图。
2. 描述性统计描述性统计是一种用来描述数据集合的方法。
其中最常用的是平均数、中位数和众数。
平均数是将所有数据相加然后除以数据的数量,它能够反映数据的集中趋势。
中位数是将数据按照大小排序,找出中间位置的数值,它不受异常值的影响。
众数是出现频率最高的数值,可以用来描述数据的局部集中趋势。
3. 数据的可视化可视化是一种将数据转化为图形的方法,它能够直观地展现数据的分布和变化趋势。
常用的数据可视化方法有直方图、折线图和散点图。
直方图用来展示数据的分布情况,折线图可以表示数据的变化趋势,散点图则可以展示变量之间的关系。
4. 概率与统计概率和统计是统计学的重要组成部分。
概率是用来描述事件发生的可能性的数值。
统计学则是通过样本数据来推断总体特征的学科。
概率与统计之间紧密相关,经常被用于研究和预测未来事件。
5. 抽样方法在进行统计研究时,我们经常无法对整个总体进行调查,而是通过抽取样本来代表总体。
抽样方法是指从总体中选择样本的方法。
常用的抽样方法有随机抽样、系统抽样和分层抽样等。
6. 统计推断统计推断是指通过样本数据来推断总体特征的方法。
在统计推断中,我们需要进行假设检验和置信区间估计。
假设检验是通过对样本数据进行统计推断来验证研究假设的方法。
置信区间估计是对总体参数进行范围估计的方法。
7. 回归与相关回归分析是一种用来研究变量之间关系的方法。
在回归分析中,我们可以使用直线或者曲线来拟合样本数据,从而了解变量之间的关系。
相关分析则是用来研究变量之间相关程度的方法。
14.3统计图表 讲义-2021-2022学年高一下学期数学苏教版(2019)必修第二册
029 14.3目标要求1、理解并掌握扇形统计图、折线统计图、频率直方图和画频率直方图的步骤.2、理解并掌握扇形统计图、折线统计图、频率直方图的简单综合应用.3、理解并掌握频率直方图的画法.4、理解并掌握频率直方图的应用.学科素养目标数据能够帮助人们认识世界、作出决策和预测,而统计正是与数据打交道的科学,用一句话来概括统计:统计是用以“收集数据、整理数据、分析数据、由数据得出结论”的概念、法则和方法.由此可以看出,学习统计学有助于学生适应现代社会的需要,有助于培养学生形成数据意识以及运用数据进行推断的思考方式,有助于学生形成以数学的眼光看世界的习惯,增强学生运用数学分析问题、解决问题的能力.在学习运用样本估计总体的过程中,要通过对具体数据的分析,使学生体会到由于样本数据具有随机性,样本所提供的信息在一定程度上反映了总体的有关特征,但与总体有一定的偏差.但是,如果抽样的方法比较合理,样本信息可以比较好地反映总体的信息,从而为人们合理地决策提供依据.由此使学生认识统计思维的特点和作用,体会统计思维与确定性思维的差异.重点难点重点:频率直方图的画法;难点:频率直方图的应用.教学过程基础知识点1.扇形统计图、折线统计图、频数直方图(1)扇形统计图扇形统计图可以形象地表示出各部分数据在全部数据中所占的________情况.扇形统计图中,每一个扇形的___________以及弧长,都与这一部分表示的数据大小成正比.(2)折线统计图一般地,如果数据是随时间变化的,可将数据用折线图来表示.(3)频数直方图频数直方图(也称为条形图)可以直观描述不同类别或分组数据的频数.【思考】(1)统计图表对于数据分析能够起到什么作用?(2)扇形统计图、折线统计图、频数直方图这三种统计图中,哪些可以从图中看出原始数据?2.画频率直方图的步骤(1)求极差:极差是一组数据中___________与___________的差;(2)决定组距与组数:当样本容量不超过100时,常分成___________组,为了方便起见,一般取等长组距,并且组距应力求“取整”.(3)将数据分组.(4)列频率分布表:一般分四列:分组、________、频率、_________.其中频数合计应是样本容量,频率合计是_______.(5)画频率直方图:横轴表示分组,纵轴表示_______.小长方形的面积=组距×_____=______.各小长方形的面积和等于1.【思考】(1)画频率直方图为什么要对样本数据进行分组?(2)频数直方图与频率直方图有什么不同?【课前小题演练】题1.为了解学生在“弘扬传统文化,品读经典文学”月的阅读情况,现从全校学生中随机抽取了部分学生,并统计了他们的阅读时间(阅读时间t∈[0,50]),分组整理数据得到如图所示的频率分布直方图.则图中a的值为( )A.0.028 B.0.030 C.0.280 D.0.300题2.某校200名学生数学竞赛成绩的频率分布直方图如图所示,成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则该次数学成绩在[50,60)内的人数为( )A.20 B.15 C.10 D.5题3.统计某校n名学生的某次数学同步练习成绩(满分150分),根据成绩分数分成六组:[90,100),[100,110),[110,120),[120,130),[130,140),[140,150],绘制频率分布直方图如图所示,若已知不低于140分的人数为110,则n的值是( )A.800 B.900 C.1 200 D.1 000题4.从2021年参加奥运知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如图所示.观察图形,估计这次奥运知识竞赛的及格率(大于或等于60分为及格)为________.题5.某超市对某种产品每天的销售量(单位:件)进行为期一个月(按30天计算)的数据统计分析,并得出了这种产品该月销售量的频率分布直方图(如图).假设用直方图中所得的频率来估计相应事件发生的概率.(1)求频率分布直方图中a的值;(2)若该超市在一天的销售量不低于25件,则上级商企会给超市赠送100元的礼金,估计该超市在一年内获得的礼金数.【当堂巩固训练】题6.某中学统计了初中毕业班一次模拟考试后学生的数学成绩,所得频率分布直方图结果如图所示,若已知83%的学生的数学成绩不高于x分,则x的估计值为( )A.84 B.86 C.88 D.90题7.为落实《国家学生体质健康标准》达标测试工作,全面提升学生的体质健康水平,某校高二年级体育组教师在高二年级随机抽取部分男生,测试了立定跳远项目,依据测试数据绘制了如图所示的频率直方图.已知立定跳远200 cm以上成绩为及格,255 cm以上成绩为优秀,根据图中的数据估计该校高二年级男生立定跳远项目的优秀率和图中的a分别是( )A.3%,0.010 B.3%,0.012C.6%,0.010 D.6%,0.012题8. 2020年10月1日是中秋节和国庆节双节同庆,很多人外出旅行或回家探亲,因此交通比较拥堵.某交通部门为了解从A城到B城实际通行所需时间,随机抽取了n台车辆进行统计,结果显示这些车辆的通行时间(单位:分钟)都在[30,55]内,按通行时间分为[30,35),[35,40),[40,45),[45,50),[50,55]五组,频率分布直方图如图所示,其中通行时间在[30,35)内的车辆有235台,则通行时间在[45,50)内的车辆台数是( )A.450 B.325 C.470 D.500题9.某班同学进行社会实践,对[25,55]岁的人群随机抽取n人进行了生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念的称为“低碳族”,否则称为“非低碳族”,得到如下统计表和各年龄段人数频率分布直方图,则图表中的p,a的值分别为( )组数分组低碳族的人数占本组的频率第一组[25,30) 120 0.6第二组[30,35) 195 p第三组[35,40) 100 0.5第四组[40,45) a0.4第五组[45,50) 30 0.3第六组[50,55] 15 0.30.7920 0.19540C.0.65,60 D.0.975,80题10.学校为了解新课程标准中提升阅读要求对学生阅读兴趣的影响情况,随机抽取100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示.将阅读时间不低于30 min的学生称为阅读霸,则下列结果正确的是( )A.抽样表明,该校约有一半学生为阅读霸B.抽取的100名学生中有50名学生为阅读霸C.该校学生中有50名学生不是阅读霸D.抽样表明,该校有50名学生为阅读霸题11.某学校为了调查学生在一周生活方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60]元的学生有60人,则下列说法正确的是( )A.样本中支出在[50,60]元的频率为0.03B.样本中支出不少于40元的人数为132C.n的值为200D.若该校有2000名学生,则定有600人支出在[50,60]元题12.每年六月二十六日是国际禁毒日.为了让同学们“珍惜生命,远离毒品”,六盘水市某学校组织全校学生参加了禁毒知识网络竞赛,通过统计,得到学生成绩的频率分布直方图,如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若该校的学生总人数为2000,则成绩超过80分的学生人数大约为________.题13.某中学为了了解高三年级女生的体重(单位:千克)情况,从中随机抽测了100名女生的体重,所得数据均在区间[48,58]中,其频率分布直方图如图所示,则在抽测的100名女生中,体重在区间[50,56)的女生数为________.题14.某城市100户居民的月平均用电量(单位:千瓦时),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图所示.(1)求直方图中x的值;(2)在月平均用电量为[220,240),[240,260),[260,280)的三组用户中,用分层抽样的方法抽取10户居民,则月平均用电量在[240,260)的用户中应抽取多少户?【综合突破拔高】题15.为了改善市民的生活环境,某沿江城市决定对本市的1 000家中小型化工企业进行污染情况摸排,并把污染情况综合折算成标准分100分,如图为该市被调查的化工企业的污染情况标准分的频率分布直方图,根据该图可估计本市标准分不低于50分的企业数为( )A.400 B.500 C.600 D.800题16.在一次期末考试中,随机抽取200名学生的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成5组:[50,60),[60,70),[70,80),[80,90),[90,100].据此绘制了如下图所示的频率分200A.30名B.40名C.50名D.60名题17.某市举行“中学生诗词大赛”,分初赛和复赛两个阶段进行,规定:初赛成绩大于90分的具有复赛资格,某校有800名学生参加了初赛,所有学生的成绩均在区间[30,150]内,其频率分布直方图如图.则获得复赛资格的人数为( )A.640 B.520 C.280 D.240题18.为了解某市居民用水情况,通过抽样,获得了100位居民某年的月均用水量(单位:吨),将该数据按照[0,0.5),[0.5,1),…,[4.4.5]分成9组,绘制了如图所示的频率分布直方图,政府要试行居民用水定额管理,制定了一个用水量标准a,使88%的居民用水量不超过a(假设a为整数),按平价收水费,超出a的部分按议价收费,则a的最小值为________.题19.某中学有初中学生1800人,高中学生1200人.为了解学生本学期课外阅读情况,现采用分层随机抽样的方法,从中抽取了100名学生,先统计了他们的课外阅读时间,然后按初中学生和高中学生分为两组,再将每组学生的阅读时间(单位:h)分为5组:[1,10),[10,20),[20,30),[30,40),[40,50],并分别加以统计,得到如图所示的频率分布直方图,试估计该校所有学生中,阅读时间不小于30 h的学生人数为________.题20.某学校现有学生3000人,为了解学生的体质健康情况,对学生进行了体质测评,得分分布在[50,100]之间,按[50,60),[60,70),[70,80),[80,90),[90,100]分组,得到的频率分布直方图如图所示:(1)求a的值;(2)估计该校学生体质测评分数在[70,90)的人数.题21.某制造商为运动会生产一批直径为40 mm的乒乓球,现随机抽样检查20只,测得每只球的直径(单位:mm,保留两位小数)如下:40.02 40.00 39.98 40.00 39.9940.00 39.98 40.01 39.98 39.9940.00 39.99 39.95 40.01 40.0239.98 40.00 39.99 40.00 39.96(1)完成下面的频率分布表,并补全图中频率分布直方图和频率分布折线图.分组频数频率频率组距[39.95,39.97) 2 0.10 5 [39.97,39.99) 4 10[39.99,40.01) 10 0.50[40.01,40.03) 4 0.20 10合计20 1.00 50(2)假定乒乓球的直径误差不超过0.02 mm为合格品,若这批乒乓球的总数为10000只,试根据抽样检查结果估计这批产品的合格只数.029 14.3目标要求1、理解并掌握扇形统计图、折线统计图、频率直方图和画频率直方图的步骤.2、理解并掌握扇形统计图、折线统计图、频率直方图的简单综合应用.3、理解并掌握频率直方图的画法.4、理解并掌握频率直方图的应用.学科素养目标数据能够帮助人们认识世界、作出决策和预测,而统计正是与数据打交道的科学,用一句话来概括统计:统计是用以“收集数据、整理数据、分析数据、由数据得出结论”的概念、法则和方法.由此可以看出,学习统计学有助于学生适应现代社会的需要,有助于培养学生形成数据意识以及运用数据进行推断的思考方式,有助于学生形成以数学的眼光看世界的习惯,增强学生运用数学分析问题、解决问题的能力. 在学习运用样本估计总体的过程中,要通过对具体数据的分析,使学生体会到由于样本数据具有随机性,样本所提供的信息在一定程度上反映了总体的有关特征,但与总体有一定的偏差.但是,如果抽样的方法比较合理,样本信息可以比较好地反映总体的信息,从而为人们合理地决策提供依据.由此使学生认识统计思维的特点和作用,体会统计思维与确定性思维的差异.重点难点重点:频率直方图的画法; 难点:频率直方图的应用.教学过程基础知识点1.扇形统计图、折线统计图、频数直方图 (1)扇形统计图扇形统计图可以形象地表示出各部分数据在全部数据中所占的__比例___情况.扇形统计图中,每一个扇形的____圆心角___以及弧长,都与这一部分表示的数据大小成正比. (2)折线统计图一般地,如果数据是随时间变化的,可将数据用折线图来表示. (3)频数直方图频数直方图(也称为条形图)可以直观描述不同类别或分组数据的频数. 【思考】(1)统计图表对于数据分析能够起到什么作用? 提示:①从数据中获取有用的信息; ②直观、准确地理解相关的结果.(2)扇形统计图、折线统计图、频数直方图这三种统计图中,哪些可以从图中看出原始数据?提示:扇形统计图适合表示总体的各个部分所占比例的问题,折线统计图能看到原始数据,频数直方图只能看到每组中数据的个数,但不是原始数据. 2.画频率直方图的步骤(1)求极差:极差是一组数据中___最大值____与___最小值____的差;(2)决定组距与组数:当样本容量不超过100时,常分成___5~12___组,为了方便起见, 一般取等长组距,并且组距应力求“取整”. (3)将数据分组.(4)列频率分布表:一般分四列:分组、__频数___、频率、 频率组距.其中频数合计应是 样本容量,频率合计是_1_.(5)画频率直方图:横轴表示分组,纵轴表示频率组距.小长方形的面积=组距× 频率组距=__频率___.各小长方形的面积和等于1.【思考】(1)画频率直方图为什么要对样本数据进行分组?提示:不分组很难看出样本中的数字所包含的信息,分组后,计算出频率,从而估计总体的分布特征. (2)频数直方图与频率直方图有什么不同?提示:频数直方图能使我们清楚地知道数据分布在各个小组的个数,而频率直方图则是从各个小组数据在样本容量中所占比例大小的角度来表示数据分布的规律. 【课前小题演练】题1.为了解学生在“弘扬传统文化,品读经典文学”月的阅读情况,现从全校学生中随机抽取了部分学生,并统计了他们的阅读时间(阅读时间t ∈[0,50]),分组整理数据得到如图所示的频率分布直方图.则图中a 的值为( )A .0.028B .0.030C .0.280D .0.300【解析】选A .由(0.006+a +0.040+0.020+0.006)×10=1得a =0.028.题2.某校200名学生数学竞赛成绩的频率分布直方图如图所示,成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则该次数学成绩在[50,60)内的人数为( )A .20B .15C .10D .5【解析】选C .由频率分布直方图得,该次数学成绩在[50,60)内的频率为:12 (1-0.04×10-0.03×10-0.02×10)=0.05,所以该次数学成绩在[50,60)内的人数为200×0.05=10.题3.统计某校n 名学生的某次数学同步练习成绩(满分150分),根据成绩分数分成六组:[90,100),[100,110),[110,120),[120,130),[130,140),[140,150],绘制频率分布直方图如图所示,若已知不低于140分的人数为110,则n 的值是( )A.800 B.900 C.1 200 D.1 000【解析】选D.由频率分布直方图的性质得:10(0.031+0.020+0.016+0.016+m+0.006)=1,解得m=0.011.因为不低于140分的频率为0.011×10=0.11,所以n=1100.11=1 000.题4.从2021年参加奥运知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如图所示.观察图形,估计这次奥运知识竞赛的及格率(大于或等于60分为及格)为________.【解析】1-0.1-0.15=0.75.答案:0.75题5.某超市对某种产品每天的销售量(单位:件)进行为期一个月(按30天计算)的数据统计分析,并得出了这种产品该月销售量的频率分布直方图(如图).假设用直方图中所得的频率来估计相应事件发生的概率.(1)求频率分布直方图中a的值;(2)若该超市在一天的销售量不低于25件,则上级商企会给超市赠送100元的礼金,估计该超市在一年内获得的礼金数.【解析】(1)由题意可得a=15[1-(0.01+0.06+0.07+0.04)×5]=0.02.(2)根据频率分布直方图知,日销售量不低于25件的天数为:(0.04+0.02)×5×30=9(天),一个月可获得的礼金数为9×100=900(元),依此可以估计该超市一年内获得的礼金数为900×12=10 800元.【当堂巩固训练】6已知83%的学生的数学成绩不高于x分,则x的估计值为( )A.84 B.86 C.88 D.90【解析】选A.由频率分布直方图知(2a+0.02+0.03+0.04)×10=1,解得a=0.005.因为前三组的频率之和为(0.005+0.04+0.03)×10=0.75<0.83,而前四组的频率之和为(0.005+0.04+0.03+0.02)×10=0.95>0.83,所以由(x-80)×0.02=0.83-0.75,解得x=84,即x的估计值为84. 题7.为落实《国家学生体质健康标准》达标测试工作,全面提升学生的体质健康水平,某校高二年级体育组教师在高二年级随机抽取部分男生,测试了立定跳远项目,依据测试数据绘制了如图所示的频率直方图.已知立定跳远200 cm以上成绩为及格,255 cm以上成绩为优秀,根据图中的数据估计该校高二年级男生立定跳远项目的优秀率和图中的a分别是( )A.3%,0.010 B.3%,0.012C.6%,0.010 D.6%,0.012【解析】选C.由频率分布直方图可得,优秀率为0.003×20×100%=6%;由(0.003+0.014+0.020+a+0.003)×20=1,解得a=0.010.题8. 2020年10月1日是中秋节和国庆节双节同庆,很多人外出旅行或回家探亲,因此交通比较拥堵.某交通部门为了解从A城到B城实际通行所需时间,随机抽取了n台车辆进行统计,结果显示这些车辆的通行时间(单位:分钟)都在[30,55]内,按通行时间分为[30,35),[35,40),[40,45),[45,50),[50,55]五组,频率分布直方图如图所示,其中通行时间在[30,35)内的车辆有235台,则通行时间在[45,50)内的车辆台数是( )A.450 B.325 C.470 D.5000.10.250.40.05,所以通行时间在[45,50)内的频率是1-0.1-0.25-0.4-0.05=0.2,通过的车辆台数是235×2=470. 题9.某班同学进行社会实践,对[25,55]岁的人群随机抽取n 人进行了生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念的称为“低碳族”,否则称为“非低碳族”,得到如下统计表和各年龄段人数频率分布直方图,则图表中的p ,a 的值分别为( )组数 分组 低碳族的人数占本组的频率第一组 [25,30) 120 0.6 第二组 [30,35) 195 p 第三组 [35,40) 100 0.5 第四组 [40,45) a 0.4 第五组 [45,50) 30 0.3 第六组[50,55]150.3A .0.79,20B .0.195,40C .0.65,60D .0.975,80【解析】选C .第一组人数为120÷0.6=200人,由频率分布直方图可得第一组频率为5×0.04=0.2, 所以n =2000.2 =1 000,所以第三组200人,第四组5×0.03×1 000=150人,第五组100人,第六组50人,所以第二组300人,p =195300=0.65,a =150×0.4=60.题10.学校为了解新课程标准中提升阅读要求对学生阅读兴趣的影响情况,随机抽取100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示.将阅读时间不低于30 min 的学生称为阅读霸,则下列结果正确的是( )A .抽样表明,该校约有一半学生为阅读霸B .抽取的100名学生中有50名学生为阅读霸50 D .抽样表明,该校有50名学生为阅读霸 【解析】选AB .根据频率分布直方图可列下表:阅读时间/min [0,10) [10,20) [20,30) [30,40) [40,50) [50,60]抽样人数/名10182225205抽取的100名学生中有50名为阅读霸,据此可判断该校约有一半学生为阅读霸.题11.某学校为了调查学生在一周生活方面的支出情况,抽出了一个容量为n 的样本,其频率分布直方图如图所示,其中支出在[50,60]元的学生有60人,则下列说法正确的是( )A .样本中支出在[50,60]元的频率为0.03B .样本中支出不少于40元的人数为132C .n 的值为200D .若该校有2000名学生,则定有600人支出在[50,60]元【解析】选BC .样本中支出在[50,60]元的频率为1-(0.01+0.024+0.036)×10=0.3,故A 错误; 样本中支出不少于40元的人数为0.0360.03 ×60+60=132,故B 正确;n =600.3 =200,故n 的值为200,故C 正确;若该校有2000名学生,则可能有0.3×2000=600人支出在[50,60]元,故D 错误.题12.每年六月二十六日是国际禁毒日.为了让同学们“珍惜生命,远离毒品”,六盘水市某学校组织全校学生参加了禁毒知识网络竞赛,通过统计,得到学生成绩的频率分布直方图,如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若该校的学生总人数为2000,则成绩超过80分的学生人数大约为________.【解析】由题意,该校成绩超过80分的学生人数大约为2000×0.015×20=600. 答案:600题13.某中学为了了解高三年级女生的体重(单位:千克)情况,从中随机抽测了100名女生的体重,所得数据均在区间[48,58]中,其频率分布直方图如图所示,则在抽测的100名女生中,体重在区间[50,56)的女生数为________.【解析】由频率分布直方图可知,体重在区间[50,56)的频率为2×(0.100+0.150+0.125)=0.75,所以体重在区间[50,56)的女生数为0.75×100=75. 答案:75题14.某城市100户居民的月平均用电量(单位:千瓦时),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图所示.(1)求直方图中x 的值;(2)在月平均用电量为[220,240),[240,260),[260,280)的三组用户中,用分层抽样的方法抽取10户居民,则月平均用电量在[240,260)的用户中应抽取多少户?【解析】(1)由频率分布直方图得:(0.002+0.0095+0.011+x +0.0075+0.005+0.0025)×20=1, 解得x =0.0125.(2)月平均用电量在[220,240)的用户有0.0125×20×100=25(户),月用电量在[240,260)的用户有0.0075×20×100=15(户)月平均用电量在[260,280)的用户有0.005×20×100=10(户),抽取比例为:1025+15+10 =15 ,所以月平均用电量在[240,260)的用户中应该抽取:15×15 =3(户).【综合突破拔高】题15.为了改善市民的生活环境,某沿江城市决定对本市的1 000家中小型化工企业进行污染情况摸排,并把污染情况综合折算成标准分100分,如图为该市被调查的化工企业的污染情况标准分的频率分布直方图,根据该图可估计本市标准分不低于50分的企业数为( ).400 500 600 800【解析】选B.根据频率分布直方图经计算得50分以上的频率为1-(0.005×20+0.0125×20+0.015×10)=0.50,所以本市标准分不低于50分的企业数为500家.题16.在一次期末考试中,随机抽取200名学生的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成5组:[50,60),[60,70),[70,80),[80,90),[90,100].据此绘制了如下图所示的频率分布直方图.则这200名学生中成绩在[80,90)中的学生有( )A.30名B.40名C.50名D.60名【解析】选B.由题知,成绩在[80,90)内的学生所占的频率为1-(0.005×2+0.025+0.045)×10=0.2,所以这200名同学中成绩大于等于80分且小于90分的学生有200×0.2=40名.题17.某市举行“中学生诗词大赛”,分初赛和复赛两个阶段进行,规定:初赛成绩大于90分的具有复赛资格,某校有800名学生参加了初赛,所有学生的成绩均在区间[30,150]内,其频率分布直方图如图.则获得复赛资格的人数为( )A.640 B.520 C.280 D.240【解析】选B.初赛成绩大于90分的具有复赛资格,某校有800名学生参加了初赛,所有学生的成绩均在区间[30,150]内,由频率分布直方图得到初赛成绩大于90分的频率为:1-(0.0025+0.0075+0.0075)×20=0.65.所以获得复赛资格的人数为:0.65×800=520.题18.为了解某市居民用水情况,通过抽样,获得了100位居民某年的月均用水量(单位:吨),将该数据按照[0,0.5),[0.5,1),…,[4.4.5]分成9组,绘制了如图所示的频率分布直方图,政府要试行居民用水定额管理,制定了一个用水量标准a,使88%的居民用水量不超过a(假设a为整数),按平价收水费,超出a的部分按议价收费,则a的最小值为________.【解析】[0,0.5)的频数为0.08×0.5×100=4,[0.5,1)的频数为0.16×0.5×100=8,[1,1.5)的频数为0.30×0.5×100=15,[1.5,2)的频数为0.44×0.5×100=22,[2,2.5)的频数为0.5×0.5×100=25,[2.5,3)的频数为0.28×0.5×100=14.[3,3.5)的频数为0.12×0.5×100=6,[3.5,4)的频数为0.08×0.5×100=4,[4,4.5]的频数为0.04×0.5×100=2,4+8+15+22+25+14=88,所以前6组占88%,a为3吨.答案:3吨题19.某中学有初中学生1800人,高中学生1200人.为了解学生本学期课外阅读情况,现采用分层随机抽样的方法,从中抽取了100名学生,先统计了他们的课外阅读时间,然后按初中学生和高中学生分为两组,再将每组学生的阅读时间(单位:h)分为5组:[1,10),[10,20),[20,30),[30,40),[40,50],并分别加以统计,得到如图所示的频率分布直方图,试估计该校所有学生中,阅读时间不小于30 h的学生人数为________.【解析】由分层随机抽样,知抽取的初中生有60名,高中生有40名.因为初中学生中阅读时间不小于30 h的频率为(0.02+0.005)×10=0.25,所以该校所有的初中学生中,阅读时间不小于30 h的学生人数约为0.25×1800=450,同理,高中学生中阅读时间不小于30 h的频率为(0.03+0.005)×10=0.35,故该校所有的高中学生中,阅读时间不小于30 h的学生人数约为0.35×1 200=420.所以该校所有学生中,阅读时间不小于30 h的学生人数约为450+420=870.答案:870题20.某学校现有学生3000人,为了解学生的体质健康情况,对学生进行了体质测评,得分分布在[50,100]之间,按[50,60),[60,70),[70,80),[80,90),[90,100]分组,得到的频率分布直方图如图(1)求a的值;(2)估计该校学生体质测评分数在[70,90)的人数.【解析】(1)由频率分布直方图可得:(0.01+0.015+0.035+a+0.01)×10=1,解得:a=0.03;(2)由频率分布直方图可得,样本中该校学生体质测评分数在[70,90)的频率为(0.035+0.03)×10=0.65,因此该校学生体质测评分数在[70,90)的人数为3 000×0.65=1 950.题21.某制造商为运动会生产一批直径为40 mm的乒乓球,现随机抽样检查20只,测得每只球的直径(单位:mm,保留两位小数)如下:40.02 40.00 39.98 40.00 39.9940.00 39.98 40.01 39.98 39.9940.00 39.99 39.95 40.01 40.0239.98 40.00 39.99 40.00 39.96(1)完成下面的频率分布表,并补全图中频率分布直方图和频率分布折线图.分组频数频率频率组距[39.95,39.97) 2 0.10 5[39.97,39.99) 4 10[39.99,40.01) 10 0.50[40.01,40.03) 4 0.20 10合计20 1.00 50(2)假定乒乓球的直径误差不超过0.02 mm为合格品,若这批乒乓球的总数为10000只,试根据抽样检查结果估计这批产品的合格只数.【解析】(1)频率分布表如下:分组 频数 频率 频率组距 [39.95,39.97) 2 0.10 5 [39.97,39.99) 4 0.20 10 [39.99,40.01) 10 0.50 25 [40.01,40.03)4 0.20 10 合计201.0050频率分布直方图、频率分布折线图如图所示.(2)因为抽样的20只产品中在[39.98,40.02]范围内的有18只,所以合格率为1820 ×100%=90%.所以根据抽样检查结果,可以估计这批产品的合格只数为9000.。
(完整版)高中数学必修2《统计》知识点讲义
第二章统计一、三种抽样方法1、统计的的基本思想是:用样本的某个量去估计总体的某个量总体:在统计中,所有考察对象的全体。
个体:总体中的每一个考察对象。
样本:从总体中抽取的一部分个体叫做这个总体的一个样本。
样本容量:样本中个体的数目。
2、抽样方法:要求:总体中每个个体被抽取的机会相等(1)简单随机抽样:抽签法和随机数表法简单随机抽样的特点是:不放回、等可能.抽签法步骤(1)先将总体中的所有个体(共有N个)编号(号码可从1到N)(2)把号码写在形状、大小相同的号签上,号签可用小球、卡片、纸条等制作(3)将这些号签放在同一个箱子里,进行均匀搅拌(4)抽签时,每次从中抽出一个号签,连续抽取n次(5)抽出样本随机数表法步骤(1)将总体中的个体编号(编号时位数要统一);(2)选定开始的数字;(3)按照一定的规则读取号码;(4)取出样本(2)系统抽样系统抽样特点:容量大、等距、等可能.步骤:1.编号,随机剔除多余个体,重新编号2.分组 (段数等于样本容量),确定间隔长度 k=N/n3.抽取第一个个体编号为i4.依预定的规则抽取余下的个体编号为i+k, i+2k, …(3)分层抽样分层抽样特点:总体差异明显、按所占比例抽取、等可能.步骤:1.将总体按一定标准分层;2.计算各层的个体数与总体的个体数的比;3.按比例确定各层应抽取的样本数目4.在每一层进行抽样 (可用简单随机抽样或系统抽样)二、用样本估计总体1、用样本的频率分布估计总体的分布①作样本频率分布直方图的步骤:(1)求极差;(2)决定组距与组数; (组数=极差/组距)(3)将数据分组;(4)列频率分布表(分组,频数,频率);(5)画频率分布直方图。
根据频率分布表做频率分布直方图应注意两点:频率⑴纵轴的意义:组距⑵横轴的意义:样本内容(每个矩形下面是组距).例1、为了了解中学生的身高情况,对育才中学同龄的50名男学生的身高进行了测量,结果如下:(单位:cm)175 168 180 176 167 181 162 173 171 177171 171 174 173 174 175 177 166 163 160166 166 163 169 174 165 175 165 170 158174 172 166 172 167 172 175 161 173 167170 172 165 157 172 173 166 177 169 181列出样本的频率分布表,画出频率分布直方图.解:在这个样本中,最大值为181,最小值为157,它们的差是24,可以取组距为4,分成7组,根据题意列出样本的频率分布表如下:频率分布直方图(略)②茎叶图作图步骤:1.将每个数据分为茎(高位)和叶(低位)两部分.2.将最小茎和最大茎之间的数按大小顺序排成一列,写在左(右)侧;3.将各个数据的叶按大小次序写在其右(左)侧.例、某中学高二(2)班甲、乙两名同学自高中以来每场数学考试成绩如下:甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,130,98,114,98,79,101.画出两人数学成绩茎叶图,请根据茎叶图对两人的成绩进行比较.解:甲、乙两人数学成绩的茎叶图如下图:甲乙5 65 6 1 7 98 9 6 1 8 6 3 84 15 9 3 9 8 87 10 3 10 11 4从这个茎叶图上可看出,乙同学的得分情况是大致对称的,中位数是99;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是89.因此乙同学发挥比较稳定,总体得分情况比甲同学好.2、用样本的数据特征估计总体的数据特征(1)、在频率直方图中计算众数、平均数、中位数众数:在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。
部编版高中数学必修二第九章统计知识点归纳总结(精华版)
(名师选题)部编版高中数学必修二第九章统计知识点归纳总结(精华版)单选题1、为了鼓励学生积极锻炼身体,强健体魄,某学校决定每学期对体育成绩在年级前100名的学生给予专项奖励.已知该校高三年级共有500名学生,如图是该年级学生本学期体育测试成绩的频率分布直方图.据此估计,能够获得该项奖励的高三学生的最低分数为()A.89B.88C.87D.86答案:B分析:根据题意确定出前100名的频率,进而判断出第100名的区间,然后根据频率求出答案.由题意,100500=0.2,[90,95)的频率为:0.02×5=0.1,[85,90)的频率为:0.05×5=0.25,则0.1<0.2<0.25,则第100名在[85,90)中,设分数为x,[x,90)的频率为:0.2−0.1=0.1,所以90−x5=0.2−0.10.25=0.10.25=25⇒x=88.故选:B.2、2021年3月,树人中学组织三个年级的学生进行“庆祝中国共产党成立100周年”党史知识竞赛.经统计,得到前200名学生分布的饼状图(如图)和前200名中高一学生排名分布的频率条形图(如图),则下列命题错误..的是()A.成绩前200名的200人中,高一人数比高二人数多30人B.成绩第1-100名的100人中,高一人数不超过一半C.成绩第1-50名的50人中,高三最多有32人D.成绩第51-100名的50人中,高二人数比高一的多答案:D分析:根据饼状图和条形图提供的数据判断.由饼状图,成绩前200名的200人中,高一人数比高二人数多200×(45%−30%)=30,A正确;=45<50,由条形图知高一学生在前200名中,前100和后100人数相等,因此高一人数为200×45%×12B正确;成绩第1-50名的50人中,高一人数为200×45%×0.2=18,因此高三最多有32人,C正确;第51-100名的50人中,高二人数不确定,无法比较,D错误.故选:D.3、新冠肺炎疫情的发生,我国的三大产业均受到不同程度的影响,其中第三产业中的各个行业都面临着很大的营收压力.2020年7月国家统计局发布了我国上半年国内经济数据,如图所示:图1为国内三大产业比重,图2为第三产业中各行业比重.以下关于我国上半年经济数据的说法正确的是()A.第一产业的生产总值与第三产业中“租赁和商务服务业”的生产总值基本持平B.第一产业的生产总值超过第三产业中“房地产业”的生产总值C.若“住宿餐饮业”生产总值为7500亿元,则“金融业”生产总值为32500亿元D.若“金融业”生产总值为41040亿元,则第二产业生产总值为166500亿元答案:D分析:利用扇形统计图和第三产业中各行业比重统计图的数据即可求解.对于A,57%×6%=3.42%<6%,错误;对于B,57%×13%=7.41%>6%,错误;×16%=4000(亿),错误;对于C,75003%×37%=166500亿元,正确.对于D,根据题意,第二产业生产总值为4104016%×57%故选:D.4、甲、乙两支曲棍球队在去年的国际比赛中,甲队的平均每场进球数为3.2,全年比赛进球个数的标准差为3;乙队的平均每场进球数为1.8,全年比赛进球个数的标准差为0.3.下列说法正确的个数为()①甲队的技术比乙队好;②乙队发挥比甲队稳定;③甲队的表现时好时坏.A.0B.3C.2D.1答案:B分析:根据平均数、方差的知识,对四个说法逐一分析,由此得出正确选项.∵甲队平均数大于乙队的平均数,∴甲队的技术比乙队好,又∵甲队的标准差大于乙队的标准差,∴乙队发挥比甲队稳定,甲队的表现时好时坏,故①②③都对.故选:B小提示:本题主要考查平均数、方差在实际生活中的应用,属于基础题.5、某汽车制造厂分别从A,B两类轮胎中各随机抽取了6个进行测试,下面列出了每一个轮胎行驶的最远里程(单位:103km).A类轮胎:94,96,99,99,105,107.B类轮胎:95,95,98,99,104,109.根据以上数据,下列说法正确的是()A.A类轮胎行驶的最远里程的众数小于B类轮胎行驶的最远里程的众数B.A类轮胎行驶的最远里程的极差等于B类轮胎行驶的最远里程的极差C.A类轮胎行驶的最远里程的平均数大于B类轮胎行驶的最远里程的平均数D.A类轮胎的性能更加稳定答案:D分析:根据众数、极差、平均数和方差的定义以及计算公式即可求解.解:对A:A类轮胎行驶的最远里程的众数为99,B类轮胎行驶的最远里程的众数为95,选项A错误;对B:A类轮胎行驶的最远里程的极差为13,B类轮胎行驶的最远里程的极差为14,选项B错误.对C:A类轮胎行驶的最远里程的平均数为100+−6−4−1−1+5+76=100,B类轮胎行驶的最远里程的平均数为100+−5−5−2−1+4+96=100,选项C错误.对D:A类轮胎行驶的最远里程的方差为(94−100)2+(96−100)2+(99−100)2×2+(105−100)2+(107−100)26=643,B类轮胎行驶的最远里程的方差为(95−100)2×2+(98−100)2+(99−100)2+(104−100)2+(109−100)26=763>643,故A类轮胎的性能更加稳定,选项D正确.故选:D.6、某购物广场开展的“买三免一”促销活动异常火爆,对其中一日8时至22时的销售额进行统计,组距为2小时的频率分布直方图如图所示.已知12时至l6时的销售额为90万元,则10时至12时的销售额为().A.60万元B.80万元C.100万元D.120万元答案:A分析:依据频率分布直方图的性质即可求得10时至12时的销售额.12时至l6时的频率为0.100×2+0.125×2=0.45,10时至12时的频率为0.150×2=0.3010时至12时的销售额0.300.45×90=60(万元)则故选:A7、某班统计一次数学测验成绩的平均分与方差,计算完毕才发现有个同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为x̅,s2,新平均分和新方差分别为x̅1,s12,若此同学的得分恰好为x̅,则()A.x̅=x̅1,s2=s12B.x̅=x̅1,s2<s12C.x̅=x̅1,s2>s12D.x̅<x̅1,s2=s12答案:C分析:利用平均数和方差的公式即可求解.设这个班有n个同学,分数分别是a1,a2,a3,…,a n,第i个同学的成绩a i=x̅没录入,第一次计算时,总分是(n−1)x̅,方差s2=1n−1[(a1−x̅)2+(a2−x̅)2+⋅⋅⋅+(a i−1−x̅)2+(a i+1−x̅)2+⋅⋅⋅+(a n−x̅)2];第二次计算时,x̅1=(n−1)x̅+x̅n=x̅,方差s12=1n [(a1−x̅)2+(a2−x̅)2+⋅⋅⋅+(a i−1−x̅)2+(a i−x̅)2+(a i+1−x̅)2+⋅⋅⋅+(a n−x̅)2]=n−1ns2,故s2>s12.故选:C.8、下列抽样方法是简单随机抽样的是()A.某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动B.从10个手机中逐个不放回地随机抽取2个进行质量检验C.从空间直角坐标系中抽取10个点作为样本D.饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查答案:B分析:根据简单随机抽样的特点逐项判断可得答案.对于A,某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动,每个人被抽到的机会不相等,故错误;对于B,从10个手机中逐个不放回地随机抽取2个进行质量检验,是简单随机抽样,故正确;对于C,从空间直角坐标系中抽取10个点作为样本,由于被抽取的样本的总体个数是无限的,所以不是简单随机抽样,故错误;对于D,饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查,不是逐个抽取,所以不是简单随机抽样,故错误.故选:B.多选题9、某赛季甲乙两名篮球运动员各6场比赛得分情况如下表:B.甲运动员得分的中位数小于乙运动员得分的中位数C.甲运动员得分的平均值大于乙运动员得分的平均值D.甲运动员的成绩比乙运动员的成绩稳定答案:BD分析:按所给数据计算两人的极差,中位数,平均值,和方差.由题意甲的极差为34-9=25,中位数是21,均值为22,方差为s2=75,同样乙的极差为35-10=25,中位数是22,均值为22,方差为s乙2=8913.比较知BD都正确,故答案为BD.小提示:本题考查样本的数据特征,掌握极差、中位数、均值、方差等概念是解题基础,本题属于基础题.10、为评估一种农作物的种植效果,选了10块地作试验田.这10块地的亩产量(单位:kg)互不相等,且从小到大分别为x1,x2,⋅⋅⋅,x10,则下列说法正确的有()A.x1,x2,⋅⋅⋅,x10的平均数可以用来评估这种农作物亩产量稳定程度B.x1,x2,⋅⋅⋅,x10的标准差可以用来评估这种农作物亩产量稳定程度C.x10−x1可以用来评估这种农作物亩产量稳定程度D.x1,x2,⋅⋅⋅,x10的中位数为x5答案:BC分析:根据平均数、标准差、极差、中位数的定义即可求解.解:标准差和极差都可以用来评估这种农作物亩产量稳定程度,故BC正确.故A错误,中位数为x5+x62,故D错.故选:BC.11、在某文艺比赛中,由6名媒体代表组成的甲组、12名专家组成的乙组和12名观众代表组成的丙组分别给选手打分(100分制,选手得分为所有评委打分的平均分).已知甲组对某选手打分为;46,50,52,48,48,56,乙组、丙组对该选手打分的平均分分别为48和56,标准差分别为3.7和11.8,则()A.该选手的得分为51.6B.甲组打分的中位数为50C.相对于丙组,乙组打分稳定性更高D.相对于丙组,乙组对该选手评价更高答案:AC分析:计算出甲组打分平均分,再根据选手得分为所有评委打分的平均分即可求得该选手的得分,即可判断A;将46,50,52,48,48,56,按照从小到大得顺序排列,求得中位数,即可判断B;根据乙组、丙组对该选手打分的标准差即可判断C;根据乙组、丙组对该选手打分的平均分即可判断D.解:甲组打分平均分为46+50+52+48+48+56=50,6=51.6,故A正确;∴x̅=6×50+12×48+12×566+12+12将46,50,52,48,48,56,按照从小到大得顺序排列得46,48,48,50,52,56,=49,B错误;所以甲组打分的中位数为48+502根据标准差知乙组评委打分的波动小,稳定性更高,故C正确;根据平均数知丙组对选手评价更高,D错误.故选:AC.填空题12、某班学号1−8的学生铅球测试成绩如下表:答案:7分析:利用百分位数的计算方法即可求解.将以上数据从小到大排列为5.2,6.9,7.1,7.9,8.0,8.1,8.4,9.1;=7.8×25%=2,则第25百分位数第2项和第3项的平均数,即为6.9+7.12所以答案是:7.13、某校为了解学生的课外阅读情况﹐随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,该调查中,得到的数据为______.(填“观测数据”或“实验数据”)答案:观测数据.分析:根据数据收集的方式,结合观测数据和实验数据的定义,即可求解.由题意,从课外阅读的学生中﹐随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,这个数据为观测数据.所以答案是:观测数据.。
高中数学必修二统计概率知识点总结
必修第二册第九章 统计知识点总结知识点一:简单随机抽样1. 全面调查和抽样调查2.简单随机抽样的概念放回简单随机抽样不放回简单随机抽样一般地,设一个总体含有N(N 为正整数)个个体,从中逐个抽取n (1≤n<N)个个体作为样本如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本3.抽签法先把总体中的个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌.最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的个体数.调查方式全面调查(普查)抽样调查定义对每一个调查对象都进行调查的方法,称为全面调查,又称普查根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为 抽样调查相关概念总体:在一个调查中,我们把调查对象的全体称为总体.个体:组成总体的每一个调查对象称为个体样本:把从总体中抽取的那部分个体 称为样本.样本量:样本中包含的个体数称为 样本量4.随机数法(1)定义:先把总体中的个体编号,用随机数工具产生已编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本,重复上述过程,直到抽足样本所需要的个体数.(2)产生随机数的方法:(i)用随机试验生成随机数;(ii)用信息技术生成随机数.5.总体均值和样本均值(1)总体均值:一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,Y N,则称Y=Y1+Y2+⋯+Y NN =1N∑i=1NY i为总体均值,又称总体平均数.(2)总体均值加权平均数的形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数f i(i=1,2,…,k),则总体均值还可以写成加权平均数的形式Y=1N ∑i=1kf i Y i.(3)如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,y n,则称y=y1+y2+⋯+y nn =1n∑i=1ny i为样本均值,又称样本平均数.6.分层随机抽样的相关概念(1)分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.(2)比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.(3)进行分层随机抽样的相关计算时,常用到的关系①样本容量n总体容量N =该层抽取的个体数该层的个体数;②总体中某两层的个体数之比等于样本中这两层抽取的个体数之比;③样本的平均数和各层的样本平均数的关系:w=mm+n x+nm+ny=MM+Nx+NM+Ny.1.画频率分布直方图的步骤(1)求极差:极差为一组数据中最大值与最小值的差;(2)决定组距与组数:当样本容量不超过100时,常分成5-12组,为方便起见,一般取等长组距,并且组距应力求“取整”;(3)将数据分组;(4)列频率分布表:一般分四列:分组、频数累计、频数、频率.其中频数合计应是样本容量,频率合计是⑥1;.(5)画频率分布直方图:横轴表示分组,纵轴表示频率组距=频率,各小长方形的面积的总和等于1.小长方形的面积=组距×频率组距2.其他统计图表统计图表主要应用扇形图直观描述各部分数据在全部数据中所占的比例条形图和直方图直观描述不同类别或分组数据的频数和频率反映统计对象在不同时间(或其他合适情形)的发展折线图变化情况1.第p百分位数:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.2.计算一组n个数据的第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.3.四分位数:第25百分位数,第50百分位数,第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.知识点四:总体集中趋势的估计1.众数、中位数和平均数的定义(1)众数:一组数据中出现次数最多的数.(2)中位数:一组数据按大小顺序排列后,处于中间位置的数.如果这组数据是偶数个,则取中间两个数据的平均数.(3)平均数:一组数据的和除以数据个数所得到的数.2.众数、中位数、平均数与频率分布直方图的关系(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(3)众数:众数是最高小矩形底边的中点所对应的数据.2.众数、中位数、平均数与频率分布直方图的关系众数众数是最高小长方形底边的中点所对应的数据,表示样本数据的中心值中位数①在频率分布直方图中,中位数左边和右边的直方图面积相等,由此可以估计中位数的值,但是有偏差;②表示样本数据所占频率的等分线平均数①平均数等于每个小长方形的面积乘小长方形底边中点的横坐标之和;②平均数是频率分布直方图的重心,是频率分布直方图的平衡点1.一组数据x1,x2,…,x n的方差和标准差数据x1,x2,…,x n的方差为1n ∑i=1n(x i-x)2=1n∑i=1nx i2-x2,标准差为√1n∑i=1n(x i-x)2.2.总体方差和总体标准差(1)总体方差和标准差:如果总体中所有个体的变量值分别为Y1,Y2,…,Y N,总体的平均数为Y,则称S2= 1N ∑i=1N(Y i-Y)2为总体方差,S=√S2为总体标准差.(2)总体方差的加权形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数为f i(i=1,2,…,k),则总体方差为S2= 1N ∑i=1kf i(Y i-Y)2.3.样本方差和样本标准差如果一个样本中个体的变量值分别为y1,y2,…,y n,样本平均数为y,则称s2= 1n ∑i=1n(y i-y)2为样本方差,s=√s2为样本标准差.4.标准差的意义标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.5.分层随机抽样的方差设样本容量为n,平均数为x,其中两层的个体数量分别为n1,n2,两层的平均数分别为x1,x2,方差分别为s12,s22,则这个样本的方差为s2=n1n [s12+(x1-x)2]+n2n[s22+(x2-x)2].必修第二册第十章概率知识点总结知识点一:有限样本空间与随机事件1.随机试验的概念和特点(1)随机试验:我们把对随机现象的实现和对它的观察称为随机试验,简称试验,常用字母E表示.(2)随机试验的特点:(i)试验可以在相同条件下重复进行;(ii)试验的所有可能结果是明确可知的,并且不止一个;(iii)每次试验总是恰好出现这些可能结果中的一个,但事先不能确定出现哪一个结果.2.样本点和样本空间定义字母表示样本点我们把随机试验E的每个可能的基本结果称为样本点用ω表示样本点样本空间全体样本点的集合称为试验E的样本空间用Ω表示样本空间有限样本空间如果一个随机试验有n个可能结果ω1,ω2,…,ωn,则称样本空间Ω={ω1,ω2,…,ωn}为有限样本空间Ω={ω1,ω2,…,ωn}3.事件的类型我们将样本空间Ω的子集称为随机事件,简称事件,并把只包含一个样本点的事件称为基本事件.随机事件一般用大写字母A,B,C,…表示.在每次试验中,当且仅当A中某个样本点出现时,称为事件A发生.Ω作为自身的子集,包含了所有的样本点,在每次试验中总有一个样本点发生,所以Ω总会发生,我们称Ω为必然事件.而空集⌀不包含任何样本点,在每次试验中都不会发生,我们称⌀为不可能事件.必然事件与不可能事件不具有随机性.为了方便统一处理,将必然事件和不可能事件作为随机事件的两个极端情形.这样,每个事件都是样本空间Ω的一个子集.知识点二:事件的关系和运算1.包含关系定义一般地,若事件A 发生,则事件B 一定发生,我们就称事件B 包含事件A(或事件A 包含于事件B)含义 A 发生导致B 发生 符号表示B ⊇A(或A ⊆B)图形表示特殊情形如果事件B 包含事件A,事件A 也包含事件B,即B ⊇A 且A ⊇B,则称事件A 与事件B 相等,记作A=B2.并事件(和事件)定义一般地,事件A 与事件B 至少有一个发生,这样的一个事件中的样本点或者在事件A 中,或者在事件B 中,我们称这个事件为事件A 与事件B 的并事件(或 和事件)含义 A 与B 至少有一个发生符号表示A ∪B(或A+B)图形表示3.交事件(积事件)定义一般地,事件A 与事件B 同时发生,这样的一个事件中的样本点既在事件A中,也在事件B 中,我们称这样的一个事件为事件A 与事件B 的交事件(或积 事件)含义 A 与B 同时发生 符号表示A ∩B(或AB)图形表示4.互斥(互不相容)一般地,如果事件A与事件B不能同时发生,也就是说A∩B是一个不可能定义事件,即A∩B=⌀,则称事件A与事件B互斥(或互不相容)含义A与B不能同时发生符号表示A∩B=⌀图形表示5.互为对立一般地,如果事件A与事件B在任何一次试验中有且仅有一个发生,即A∪B=定义Ω,且A∩B=⌀,那么称事件A与事件B互为对立.事件A的对立事件记为A 含义A与B有且仅有一个发生符号表示A∩B=⌀,且A∪B=Ω图形表示6.清楚随机事件的运算与集合运算的对应关系有助于解决此类问题.符号事件的运算集合的运算A 随机事件集合A A的对立事件A的补集AB 事件A与B的交事件集合A与B的交集A∪B 事件A与B的并事件集合A与B的并集知识点三:古典概型1.古典概型的定义试验具有如下共同特征:(1)有限性:样本空间的样本点只有有限个;(2)等可能性:每个样本点发生的可能性相等.我们将具有以上两个特征的试验称为古典概型试验,其数学模型称为古典概率模型,简称古典概型.2.古典概型的概率计算公式一般地,设试验E是古典概型,样本空间Ω包含n个样本点,事件A包含其中的k个样本点,则定义事件A的概率P(A)= kn =n(A)n(Ω),其中n(A)和n(Ω)分别表示事件A和样本空间Ω包含的样本点个数.知识点四:概率的基本性质1.概率的基本性质性质1 对任意的事件A,都有P(A)≥0.性质2 必然事件的概率为1,不可能事件的概率为0,即P(Ω)=1,P(⌀)=0.性质3 如果事件A与事件B互斥,那么P(A∪B)=P(A)+P(B).性质4 如果事件A与事件B互为对立事件,那么P(B)=1-P(A),P(A)=1-P(B).性质5 如果A⊆B,那么P(A)≤P(B).性质6 设A,B是一个随机试验中的两个事件,我们有P(A∪B)=P(A)+P(B)-P(A∩B).知识点五:事件的相互独立性1.相互独立事件的定义:对任意两个事件A与B,如果P(AB)=P(A)P(B)成立,则称事件A 与事件B相互独立,简称为独立.2.相互独立事件的性质:当事件A,B相互独立时,则事件A与事件B相互独立,事件A与事件B相互独立,事件A与事件B相互独立.【提示】公式P(AB)=P(A)P(B)可以推广到一般情形:如果事件A1,A2,…,A n相互独立,那么这n个事件同时发生的概率等于每个事件发生的概率的积,即P(A1A2·…·A n)=P(A1)P(A2)·…·P(A n).3. 两个事件是否相互独立的判断方法(1)直接法:由事件本身的性质直接判定两个事件发生是否相互影响.(2)公式法:若P(AB)=P(A)P(B),则事件A,B为相互独立事件.4.求相互独立事件同时发生的概率的步骤:①首先确定各事件之间是相互独立的.②求出每个事件的概率,再求积.5.事件间的独立性关系已知两个事件A,B相互独立,它们的概率分别为P(A),P(B),则有事件表示概率A,B同时发生AB P(A)P(B)A,B都不发生A B P(A)P(B)A,B恰有一个发生(A B)∪(A B) P(A)P(B)+P(A)P(B)A,B中至少有一个发生(A B)∪(A B)∪(AB) P(A)P(B)+P(A)P(B)+P(A)P(B)A,B中至多有一个发生(A B)∪(A B)∪(A B) P(A)P(B)+P(A)P(B)+P(A)P(B)。
高一必修二数学统计与概率
高一必修二数学统计与概率统计与概率是高中数学课程中的一门重要学科,它们通过收集和分析数据,帮助我们了解事物的规律和趋势,以及预测未来的可能性。
在这篇文章中,我们将会探讨统计与概率的基本概念、应用以及相关技巧。
一、统计与概率的基本概念1.1 统计统计是指对一定范围内的个体、事物或现象进行观察、收集、整理和分析数据,以揭示其中的规律和特点。
统计的目的是通过对数据的整理和分析,获取有关事物的信息和结论。
统计的过程包括数据收集、数据整理、数据分析和数据解读。
数据收集可以通过问卷调查、实地观察、实验等方式进行;数据整理则是对收集到的原始数据进行分类、整理和汇总,方便后续的数据分析;数据分析是指利用数理统计方法对整理好的数据进行计算和推理,得出相关结论;最后,数据解读是根据统计结果进行信息的解释和推断。
1.2 概率概率是描述事件发生可能性的一种数值表示。
它是统计学中的一个重要分支,研究的是随机事件的发生和发展规律。
概率的计算方法有频率概率和古典概率两种。
频率概率是指通过长期观察和实验的结果,计算某个事件发生的可能性。
例如,抛掷一枚硬币,正面朝上的频率是50%。
古典概率是指根据事件的样本空间和样本点的等概率原理,计算某个事件发生的可能性。
例如,一副扑克牌中黑桃出现的概率是1/4。
二、统计与概率的应用2.1 统计的应用统计学在现实生活中有着广泛的应用。
例如,在经济领域,统计学可以用来预测消费者的购买行为,分析市场的供求关系,帮助企业制定营销策略。
在医学领域,统计学可以用来研究疾病的流行病学特征,分析药物的疗效和安全性。
在社会科学领域,统计学可以用来分析人口数据,研究社会现象的变化和趋势。
2.2 概率的应用概率学在游戏、金融、工程等领域中有着广泛的应用。
在游戏中,概率可以帮助玩家提高胜率,例如在扑克牌游戏中,计算出每种手牌获胜的概率,从而制定更优的策略。
在金融领域,概率可以用来衡量投资的风险和收益,帮助投资者做出合理的决策。
新教材 人教B版高中数学必修第二册 第五章 统计与概率 知识点考点及解题方法提炼汇总
第五章统计与概率5.1统计 (1)5.1.1数据的收集 (1)第1课时总体与样本、简单随机抽样 (1)第2课时分层抽样 (5)5.1.2数据的数字特征 (8)5.1.3数据的直观表示 (14)5.1.4用样本估计总体 (21)5.3概率 (25)5.3.1样本空间与事件 (25)5.3.2事件之间的关系与运算 (28)5.3.3古典概型 (32)5.3.4频率与概率 (36)5.3.5随机事件的独立性 (38)5.4统计与概率的应用 (42)5.1统计5.1.1数据的收集第1课时总体与样本、简单随机抽样知识点总体所考察问题涉及的__对象全体__是总体个体总体中__每个对象__都是个体样本抽取的部分对象组成总体的一个样本样本一个样本中包含的__个体数目__是样本容量容量知识点普查与抽样调查一般地,对总体中__每个个体__都进行考察的方法称为普查(也称全面调查),只抽取__样本__进行考察的方法称为抽样调查.知识点简单随机抽样(1)定义:一般地,简单随机抽样(也称纯随机抽样)就是从总体中不加任何__分组__、划类、__排队__等,完全随机地抽取个体.(2)两种常见方法:①__抽签法__;②__随机数表法__.思考1:抽签法与随机数表法的异同点是什么?提示:抽签法随机数表法不同点①抽签法比随机数表法简单;②抽签法适用于总体中的个体数相对较少的情况①随机数表法要求编号的位数相同;②随机数表法适用于总体中的个体数相对较多的情况相同点①都是简单随机抽样,并且要求被抽取样本的总体的个数有限;②都是从总体中逐个不放回地抽取知识点随机数表法进行简单随机抽样的步骤思考2:用随机数表进行简单随机抽样的规则是什么?提示:(1)定方向:读数的方向(向左、向右、向上或向下都可以).(2)读数规则:读数时结合编号的特点进行读取,编号为两位数则两位两位地读取,编号为三位数则三位三位地读取,若得到的号码不在编号中或已被选用,则跳过,直到选满所需号码为止.题型简单随机抽样的概念典例剖析典例1下面的抽样方法是简单随机抽样吗?为什么?(1)从无数个个体中抽取50个个体作为样本;(2)仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查;(3)某连队从200名党员官兵中,挑选出50名最优秀的官兵赶赴青海参加抗震救灾工作;(4)一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签;(5)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出1个零件进行质量检验后,再把它放回箱子里.[分析]若抽取样本的方式是简单随机抽样,它应具备哪些特点?[解析](1)不是简单随机抽样.因为简单随机抽样要求被抽取的样本总体的个数是有限的.(2)不是简单随机抽样.虽然“一次性抽取”和“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”.(3)不是简单随机抽样.因为50名官兵是从中挑出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“等可能抽样”的要求.(4)是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能的抽样.(5)不是简单随机抽样.因为它是有放回抽样.规律方法:1.如果一个总体满足下列两个条件,那么可用简单随机抽样抽取样本:(1)总体中的个体之间无差异;(2)总体个数不多.2.判断所给的抽样是否为简单随机抽样的依据是简单随机抽样的四个特征:上述四点特征,如果有一点不满足,就不是简单随机抽样.题型抽签法典例剖析典例2要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试.请选择合适的抽样方法,并写出抽样过程.[分析]已知N=30,n=3.抽签法抽样时编号1、2、…、30,抽取3个编号,对应的汽车组成样本.[解析]应使用抽签法,步骤如下:①将30辆汽车编号,号码是1、2、3、 (30)②将1~30这30个编号写到大小、形状都相同的号签上;③将写好的号签放入一个不透明的容器中,并搅拌均匀;④从容器中每次抽取一个号签,连续抽取3次,并记录上面的编号;⑤所得号码对应的3辆汽车就是要抽取的对象.规律方法:抽签法的5个步骤题型随机数表法典例剖析典例3假设要考查某企业生产的袋装牛奶的质量是否达标,现从500袋牛奶中抽取60袋进行检验,利用随机数表法抽取样本时,先将500袋牛奶按000,001,…,499进行编号,如果从随机数表第8行第26列的数开始,按三位数连续向右读取,最先检验的5袋牛奶的号码是(下面摘取了某随机数表第7行至第9行)(B)844217533157245506887704744767217633502583921206766301647859169555671998105071851286735807443952387933211A.455068047447176B.169105071286443C.050358074439332D.447176335025212[解析]第8行第26列的数是1,依次取三位数169、555、671、998、105、071、851、286、735、807、443、…,而555、671、998、851、735、807超过最大编号499,故删掉,所以最先检验的5袋牛奶的号码依次为:169、105、071、286、443,故选B.规律方法:用随机数表法抽取样本的步骤:(1)将总体中的每个个体编号(每个号码位数一样).(2)在随机数表中任选一个数作为起始号码.(3)从选定的数开始,按一定的方向读下去,若得到的号码在编号中,则取出;若得到的号码不在编号中或与前面取出的数重复,则跳过不取,如此进行下去,直到取满为止.(4)根据选定的号码抽取样本.易错警示典例剖析典例4 一个布袋中有6个同样质地的小球,从中不放回地抽取3个小球,则某一特定小球被抽取的可能性是__12__;第三次抽取时,每个小球被抽取的可能性是__14__.[错解] 因为简单随机抽样时每个个体被抽取的可能性均为n N ,所以两空均填12. [辨析] 本题解答错误的原因在于混淆了抽样中,样本被抽到的可能性与每次抽取中个体被抽到的可能性.[正解] 因为简单随机抽样时每个个体被抽取的可能性为n N ,所以第一个空填12,而抽样是无放回抽样,所以第一次抽取时,每个小球被抽取的可能性为16,第二次抽取时,剩余5个小球被抽取的可能性为15,第三次抽取时,剩余4个小球,每个小球被抽取的可能性为14.因此,第二个空填14.第2课时 分层抽样 知识点分层抽样1.定义一般地,如果相对于要考察的问题来说,总体可以分成有__明显差别__的、__互不重叠__的几部分时,每一部分可称为层,在各层中按__层在总体中所占比例__进行随机抽样的方法称为分层随机抽样(简称为分层抽样)思考1:如何理解“层在总体中所占比例”?提示:从N 个个体中抽取n 个个体,若将总体分为A ,B ,C 三层,含有的个体数目分别是x ,y ,z ,在A ,B ,C 三层应抽取的个体数目分别是a ,b ,c ,那么a x =b y =c z =n N .2.应用的广泛性(1)分层抽样所得到的样本,一般更具有代表性,可以更准确地反映总体的特征,尤其是在层内个体相对同质而层间差异较大时更是如此.(2)分层抽样在各层中抽样时,还可根据各层的特点灵活地选用不同的随机抽样方法.(3)想同时获取总体的信息和各层的内部信息时,常采用分层抽样.思考2:简单随机抽样和分层抽样的联系和区别是什么?提示:类别简单随机抽样分层抽样各自特点从总体中逐个抽取将总体分成几层,分层进行抽取相互联系在各层抽样时采用简单随机抽样适用范围总体中的个体数较少总体由存在明显差异的几部分组成共同点①抽样过程中每个个体被抽到的可能性相等②每次抽出个体后不再放回,即不放回抽样题型分层抽样的概念典例剖析典例1下列问题中,最适合用分层抽样抽取样本的是(B)A.从10名同学中抽取3人参加座谈会B.某社区有500个家庭,其中高收入的家庭125户,中等收入的家庭280户,低收入的家庭95户.为了了解生活购买力的某项指标,要从中抽取一个容量为100户的样本C.从1 000名工人中抽取100人调查上班途中所用的时间D.从生产流水线上抽取样本检查产品质量[分析]根据分层抽样的特点选取.[解析]A中总体所含个体无差异且个数较少,适合用简单随机抽样;C和D中总体所含个体无差异且个数较多,不适合用分层抽样;B中总体所含个体差异明显,适合用分层抽样.规律方法:分层抽样的依据(1)适用于总体由差异明显的几部分组成的情况.(2)样本能更充分地反映总体的情况.(3)等可能抽样,每个个体被抽到的可能性都相等.题型分层抽样中的有关计算典例剖析典例2(1)某校有高级教师26人,中级教师104人,其他教师若干人.为了了解该校教师的工资收入情况,若按分层抽样从该校的所有教师中抽取56人进行调查,已知从其他教师中共抽取了16人,则该校共有教师__182__人.(2)某网站针对“2020年法定节假日调休安排”提出的A,B,C三种放假方案进行了问卷调查,调查结果如下:支持A方案支持B方案支持C方案35岁以下的人数200400800 35岁以上(含35岁)的人数100100400的人中抽取了6人,求n的值.②从支持B方案的人中,用分层抽样的方法抽取5人,这5人中在35岁以上(含35岁)的人数是多少?35岁以下的人数是多少?[解析](1)设该校其他教师有x人,则16x=5626+104+x,解得x=52,经检验,x=52是原方程的根,故全校教师共有26+104+52=182人.(2)①由题意得6100+200=n200+400+800+100+100+400,解得n=40.②35岁以下的人数为5500×400=4人,35岁以上(含35岁)的人数为5-4=1人.[母题探究]将本例的条件改为“A,B,C三种放假方案人数之比为2∶3∶5.现用分层抽样方法抽取一个容量为n的样本,样本中A方案有16人”,求样本的容量n.[解析]由于A,B,C三种放假方案人数之比为2∶3∶5,样本中A方案有16人,则210=16n,解得n=80.规律方法:分层抽样中的求解技巧(1)样本容量n总体的个体数N=该层抽取的个体数该层的个体数.(2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.题型分层抽样的方案设计典例剖析典例3一个单位有职工160人,其中有业务人员112人,管理人员16人,后勤服务人员32人,为了了解职工的某种情况,要从中抽取一个容量为20的样本,写出用分层抽样的方法抽取样本的过程.[分析]分层抽样中各层抽取个体数依各层个体数之比来分配,确定各层抽取的个体数之后,可采用简单随机抽样在各层中抽取个体.[解析]三部分所含个体数之比为112∶16∶32=7∶1∶2,设三部分各抽个体数为7x,x,2x,则由7x+x+2x=20得x=2.故业务人员、管理人员、后勤服务人员抽取个体数分别为14,2和4.对112名业务人员进行编号,用随机数表法抽样抽取14人.再用抽签法可抽出管理人员和服务人员的号码.将以上各层抽出的个体合并起来,就得到容量为20的样本.规律方法:分层抽样的注意事项分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,各层之间的样本差异要大,且互不重叠.(2)为了保证每个个体等可能入样,所有层应采用同一抽样比,等可能抽样.(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.[特别提醒]保证每个个体等可能入样是简单随机抽样、分层抽样共同的特征,为了保证这一点所有层按同一抽样比,等可能抽样.易错警示典例剖析抽样方法选择不当导致所得样本不具有代表性典例4某单位有职工120人,欲从中抽取20人调查职工的身体状况.领导安排工会某干部负责抽样,他应该怎样做?[错解]将120名职工编号,用随机数表法抽样抽取20人作为样本.[辨析]年龄对人的身体状况有较大影响,这种不考虑年龄抽取的样本不能准确反应单位职工的身体状况.[正解]先将这120名职工根据年龄分为老年组、中年组、青年组,再按1 6的比例在各组中抽取相应的人数,即用分层抽样的方法抽取样本.5.1.2数据的数字特征知识点最值一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数最极端的情况.一般地,最大值用max 表示,最小值用min 表示. 知识点平均数1.定义:如果给定的一组数是x 1,x 2,…,x n ,则这组数的平均数为x -=1n (x 1+x 2+…+x n ).这一公式在数学中常简记为x -=1n ∑i =1n x i .2.求和符号∑具有的性质(1)∑i =1n (x i +y i )=∑i =1n x i +∑i =1n y i .(2)∑i =1n (kx i )=k ∑i =1n x i .(3)∑i =1n t =nt .3.如果x 1,x 2,…,x n 的平均数为x -,且a ,b 为常数,则ax 1+b ,ax 2+b ,…,ax n +b 的平均数是a x -+B .思考1:(1)x 5+x 6+…+x 15如何用符号∑表示?(2)如何证明∑i =1n (kx i )=k ∑i =1nx i?提示:(1)x 5+x 6+…+x 15=∑i =515x i .(2)∑i =1n (kx i )=kx 1+kx 2+…+kx n=k (x 1+x 2+…+x n )=k ∑i =1nx i .知识点中位数1.如果一组数有奇数个数,并按照从小到大排列后为x 1,x 2,…,x 2n +1,则称x n +1为这组数的中位数.2.如果一组数有偶数个数,且按照从小到大排列后为x 1,x 2,…,x 2n ,则称x n +x n +12为这组数的中位数.知识点百分位数1.定义:一组数的p %(p ∈(0,100))分位数指的是满足下列条件的一个数值:至少有p %的数据不大于该值,且至少有(100-p )%的数据不小于该值.2.计算方法:设一组数按照从小到大排列后为x 1,x 2,…,x n ,计算i =np %的值,如果i 不是整数,设i 0为大于i 的最小整数,取xi 0为p %分位数;如果i 是整数,取x i +x i +12为p %分位数.规定:0分位数是x 1(即最小值),100%分位数是x n (即最大值).思考2:中位数和百分位数的关系是什么?提示:中位数是50%分位数.知识点众数一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数.知识点极差一组数的极差指的是这组数的最大值减去最小值所得的差.知识点方差与标准差(1)如果x 1,x 2,…,x n 的平均数为x -,则方差s 2=1n i =1n (x i -x -)2,方差的算术平方根称为标准差.(2)如果x 1,x 2,…,x n 的方差为s 2,且a ,b 为常数,则ax 1+b ,ax 2+b ,……,ax n +b 的方差是a 2s 2.思考2:(1)方差和标准差的取值范围是什么?方差、标准差为0的含义是什么?(2)方差和标准差是如何反映一组数据的离散程度的?提示:(1)标准差、方差的取值范围:[0,+∞).标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度.(2)标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.题型最值、平均数、众数的确定典例剖析典例1 某公司员工的月工资情况如表所示: 月工资/元 8 000 5 000 4 000 2 000 1 000 800 700 员工/人125820122(2)你认为用哪个数来代表该公司员工的月工资更合理?[解析] (1)该公司员工月工资的最大值为8 000元,最小值为700元,众数为1 000元.平均数为150(8 000×1+5 000×2+4 000×5+2 000×8+1 000×20+800×12+700×2)=1 700(元).(2)用众数,因为最大值为8 000元且只有一个,无法代表该公司员工的月工资,平均数受到最大值的影响,也无法代表该公司员工的月工资,每月拿1 000元的员工最多,众数代表该公司员工的月工资最合理.规律方法:1.把数据从小到大排列,根据定义即可确定最值和众数. 2.平均数的求法 (1)用定义式; (2)用平均数的性质;(3)在容量为n 的一组数据中,若数据x 1有n 1个,x 2有n 2个,…,x k 有n k 个,且n =n 1+n 2+…+n k ,则这组数据的平均数为1n (n 1x 1+n 2x 2+…+n k x k )=n 1n x 1+n 2nx 2+…+n kn x k .题型中位数、百分位数的计算典例剖析典例2 (1)已知一组数据8,6,4,7,11,6,8,9,10,5,则该组数据的中位数是__7.5__;(2)甲、乙两名篮球运动员在随机抽取的12场比赛中的得分情况如下:甲运动员得分:12,15,20,25,31,31,36,36,37,39,44,49.乙运动员得分:8,13,14,16,23,26,28,29,31,38,39,51.求甲、乙两名运动员得分的25%分位数,75%分位数和90%分位数. [解析] (1)已知数据从小到大排列为:4,5,6,6,7,8,8,9,10,11,共10个数,所以中位数是7+82=7.5.(2)两组数据都是12个数,而且12×25%=3,12×75%=9,12×90%=10.8, 因此,甲运动员得分的25%分位数为x 3+x 42=20+252=22.5,甲运动员得分的75%分位数为x9+x102=37+392=38,甲运动员得分的90%分位数为x11=44.乙运动员得分的25%分位数为x3+x42=14+162=15,乙运动员得分的75%分位数为x9+x102=31+382=34.5,乙运动员得分的90%分位数为x11=39.规律方法:1.求中位数的一般步骤(1)把数据按大小顺序排列.(2)找出排列后位于中间位置的数据,即为中位数.若中间位置有两个数据,则求出这两个数据的平均数作为中位数.2.求百分位数的一般步骤(1)排序:按照从小到大排列:x1,x2,…,x n.(2)计算:求i=np%的值.(3)求值:分数p%分位数i不是整数xi0,其中i0为大于i的最小整数i是整数x i+x i+12题型极差、方差、标准差的计算典例剖析典例3已知一组数据:2,2,2,3,3,3,3,4,4,4,4,4,5,5,5,5,5,5,6,6.(1)求极差;(2)求方差;(3)求标准差.[解析](1)最大值为6,最小值为2,极差为4.(2)可将数据整理为x23456频数34562每一个数都减去4x-4-2-1012频数34562120×[(-2)×3+(-1)×4+0×5+1×6+2×2]=0,120×[(-2)2×3+(-1)2×4+02×5+12×6+22×2]=32.因此,所求平均值为4,方差为32. (3)由(2)知标准差为62. 规律方法:求方差的基本方法(1)先求平均值,再代入公式s 2=1n ∑i =1n (x i -x -)2,或s 2=1n ∑i =1n x 2i -x 2.(2)用性质.(3)当一组数据重复数据较多时,可先整理出频数表,再计算s 2. 题型分层抽样的方差典例剖析典例4 甲、乙两班学生参加了同一考试,其中甲班50人,乙班40人.甲班的平均成绩为80.5分,方差为500;乙班的平均成绩为85分,方差为360.那么甲、乙两班全部90名学生的平均成绩和方差分别是多少?[解析] 设甲班50名学生的成绩分别是a 1,a 2,…,a 50,那么甲班的平均成绩和方差分别为x -甲=a 1+a 2+…+a 5050=80.5(分),s 2甲=(a 1-x -甲)2+(a 2-x -甲)2+…+(a 50-x -甲)250=500. 设乙班40名学生的成绩分别是b 1,b 2,…,b 40,那么乙班的平均成绩和方差分别为x -乙=b 1+b 2+…+b 4040=85(分),s 2乙=(b 1-x -乙)2+(b 2-x -乙)2+…+(b 40-x -乙)240=360. 如果不知道a 1,a 2,…,a 50和b 1,b 2,…,b 40,只知道甲、乙两班的平均成绩、方差及甲、乙两班的人数,那么根据前面的分析,全部90名学生的平均成绩应为x -=50x -甲+40x -乙50+40=50×80.5+40×8590=82.5(分),方差s 2=50[s 2甲+(x -甲-x -)2]+40[s 2乙+(x -乙-x -)2]50+40=50×[500+(80.5-82.5)2]+40×[360+(85-82.5)2]90=50×500+50×4+40×360+40×6.2590≈442.78.规律方法:若样本中有两层,第一层有m 个数,分别为x 1,x 2,…,x m ,平均数为x -,方差为s 2;第二层有n 个数,分别为y 1,y 2,…,y n ,平均数为y -,方差为t 2,则样本的均值为a -=m x -+n y-m +n,方差为m [s 2+(x --a -)2]+n [t 2+(y --a -)2]m +n.易错警示典例剖析典例5 下面是某赛季甲、乙两名篮球队员每场比赛得分情况: 甲:4 14 14 24 25 31 32 35 36 36 39 45 49 乙:8 12 15 18 23 27 25 32 33 34 41 则甲、乙得分的中位数之和是( B ) A .56分 B .57分 C .58分 D .59分[错解] D 因为甲的中位数是32,乙的中位数是27,所以甲、乙得分的中位数之和是59.[辨析] 本题易忽视求乙得分的中位数时,没有将数据从小到大排列起来,将原始数据中的中间一个数误认为就是乙得分的中位数而导致错误.因此理解样本的数字特征的含义较为重要.[正解] 由题可知甲得分的中位数为32分,乙得分的数据从小到大排列为:8,12,15,18,23,25,27,32,33,34,41,故乙得分的中位数为25分,因此甲、乙两人得分的中位数之和为57分.5.1.3 数据的直观表示柱形图(也称为条形图) 知识点作用 形象地比较各种数据之间的数量关系特征(1)一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例.(2)每一矩形都是__等宽__的折线图知识点作用形象地表示数据的变化趋势特征一条轴上显示的通常是时间,另一条轴上是对应的__数据__扇形图(也称为饼图、饼形图)知识点作用形象地表示出各部分数据在全部数据中所占的__比例__特征每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成__正比__茎叶图知识点作用(1)如果每一行的数都是按从大到小(或从小到大)顺序排列,则从中可以方便地看出这组数的__最值__、__中位数__等数字特征(2)可以看出一组数的分布情况,可能得到一些额外的信息(3)比较两组数据的集中或分散程度特征所有的茎都竖直排列,而叶沿__水平__方向排列(2)茎叶图的优点是什么?提示:(1)应用茎叶图进行统计时,注意重复出现的数据要重复记录,不能遗漏.(2)茎叶图能保留原始数据,并方便随时添加记录数据.知识点画频数分布直方图与频率分布直方图的步骤(1)找出最值,计算极差.(2)合理分组,确定区间.(3)整理数据.(4)作出有关图示.频数分布直方图纵坐标是频数,每一组数对应的矩形的__高度__与频数成正比频率分布直方图纵坐标是__频率组距__,每一组数对应的矩形高度与频率成正比,每个矩形的面积等于这一组数对应的频率,所有矩形的面积之和为1思考2:频数分布直方图与频率分布直方图有什么不同?提示:频数分布直方图能使我们清楚地知道数据分布在各个小组的个数,而频率分布直方图则是从各小组数据在所有数据中所占的比例大小的角度来表示数据分布的规律.知识点频数分布折线图和频率分布折线图把频数分布直方图和频率分布直方图中每个矩形上面一边的__中点__用线段连接起来,且画成与横轴相交.题型柱形图与折线图典例剖析典例12020年1月6日的《中国青年报》报道:“根据调查,有担当(76.3%)和踏实(74.5%)的年轻人最被受访者欣赏.奋进(54.7%)、坚毅(54.1%)、有梦想(50.2%)、有闯劲儿(40.1%)、沉稳(36.7%)、直率(34.6%)、幽默(33.4%)、活泼(27.2%)、庄重(20.3%)、洒脱(20%)也是受访者欣赏的品质.”为形象地表示这一调查结果.(1)作出柱形图;(2)作出折线图.[解析](1)柱形图如图①.(2)方法一:取图①中各小矩形上面的中点用线段连接起来(图略),即得折线图.方法二:直接作出折线图如图②其中横轴上的1,2,3,…,12分别表示“有担当”,“踏实”,…,“洒脱”.规律方法:1.柱形图中,各小矩形宽相等.2.注意横、纵轴的意义.3.由柱形图可以作出折线图:取各小矩形上边的中点,再用线段连接,取各小矩形下边的中点并标注上数字,要说明标注数字所对应的数据类型.题型扇形图典例剖析典例2某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示,现在用分层随机抽样方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为__50__;测试结果为第一、二、三分厂取出的产品的平均使用寿命分别为1 020小时,980小时,1 030小时,估计这个企业生产的产品的平均使用寿命为__1_015__小时.[解析]由分层随机抽样可知,第一分厂应抽取100×50%=50(件),该产品的平均使用寿命为50×1 020+20×980+30×1 030100=1 015(小时).规律方法:在扇形图中,部分数据在全部数据中的比例等于对应扇形的圆心角度数与360°之比,等于对应扇形的弧长与周长之比,也等于对应扇形面积与圆面积之比.题型茎叶图的画法及应用典例剖析典例3下面是甲、乙两名运动员某赛季一些场次得分的茎叶图:(1)甲、乙两名运动员的最高得分各是多少?(2)哪名运动员的成绩好一些?[解析](1)甲、乙两名运动员的最高得分分别为51分,52分.(2)从茎叶图可以看出,甲运动员得分大致对称,乙运动员的得分除一个52分以外,也大致对称.而甲运动员的平均得分高于乙运动员的平均得分,因此甲运动员的成绩更好.规律方法:1.利用茎叶图进行数据分析时,通常从茎叶图中各个“叶”上的数字多少来分析该组数据的分布对称性、稳定性等.2.如果茎叶图中的数据大致集中在某一行附近,那么说明这组数据比较稳定.3.茎叶图只适用于样本数据较少的情况.题型频率分布表和频率分布直方图典例剖析典例4从高一学生中抽取50名参加调研考试,成绩的分组及各组的频数如下(单位:分):[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计成绩在[70,80)的学生占总体的百分比.[分析]计算频率、列表与绘图.[解析](1)频率分布表如下:成绩分组频数频率[40,50)20.04[50,60)30.06[60,70)100.2[70,80)150.3[80,90)120.24[90,100]80.16合计50 1.00(2)绘制频率分布直方图如图,由题意知组距为10,取小矩形的高为频率组距,计算得到如下的数据表:成绩分组频率小矩形的高[40,50)0.040.004[50,60)0.060.006[60,70)0.20.02[70,80)0.30.03(3)由频率分布直方图可知成绩在[70,80)分的学生所占总体的百分比是0.03×10=0.3=30%.规律方法:绘制频率分布直方图的方法:(1)先制作频率分布表,然后作直角坐标系.(2)把横轴分成若干段,每一段对应一个组.(3)在上面标出的各点中,分别以相邻两点为端点的线段为底作长方形,它的高等于该组的频率组距.每个长方形的面积恰好是该组的频率,这些长方形构成了频率分布直方图.易错警示典例剖析典例5某中学同年级40名男生的体重数据如下(单位:kg):61605959595858575757575656565656565655555555545454545353535252525251515150504948列出样本的频率分布表,绘出频率分布直方图.[错解](1)极差61-48=13.(2)取组距2,分组132=6.5分7组.(3)分点及分组如下:48~50,50~52,52~54,54~56,56~58,58~60,60~62.(4)列频率分布表:。
(完整版)高中数学必修2《统计》知识点讲义.docx
第二章统计一、三种抽样方法1、的的基本思想是:用本的某个量去估体的某个量体:在中,所有考察象的全体。
个体:体中的每一个考察象。
本:从体中抽取的一部分个体叫做个体的一个本。
本容量:本中个体的数目。
2、抽方法:要求:体中每个个体被抽取的机会相等(1)随机抽:抽法和随机数表法随机抽的特点是:不放回、等可能.抽法步( 1)先将体中的所有个体(共有N 个)号(号可从 1 到 N)( 2)把号写在形状、大小相同的号上,号可用小球、卡片、条等制作( 3)将些号放在同一个箱子里,行均匀拌(4)抽,每次从中抽出一个号,抽取n 次(5)抽出本随机数表法步(1)将体中的个体号 ( 号位数要一 ) ;( 2)定开始的数字;( 3)按照一定的取号;( 4)取出本(2)系抽系抽特点:容量大、等距、等可能.步 :1.号 , 随机剔除多余个体 , 重新号2.分 ( 段数等于本容量 ), 确定隔度 k=N/n3.抽取第一个个体号 i4. 依定的抽取余下的个体号i+k, i +2k, ⋯(3)分抽分抽特点:体差异明、按所占比例抽取、等可能.步: 1. 将体按一定准分 ;2.算各的个体数与体的个体数的比;3.按比例确定各抽取的本数目4.在每一行抽 ( 可用随机抽或系抽 )二、用样本估计总体1、用样本的频率分布估计总体的分布①作样本频率分布直方图的步骤:(1)求极差;(2)决定组距与组数 ; ( 组数=极差 / 组距 )(3)将数据分组;(4)列频率分布表(分组,频数,频率);(5)画频率分布直方图。
根据频率分布表做频率分布直方图应注意两点:频率⑴纵轴的意义:组距⑵横轴的意义:样本内容(每个矩形下面是组距).例 1、为了了解中学生的身高情况, 对育才中学同龄的50名男学生的身高进行了测量, 结果如下:(单位: cm)175168180176167181162173171177171171174173174175177166163160166166163169174165175165170158174172166172167172175161173167170172165157172173166177169181列出样本的频率分布表, 画出频率分布直方图.解:在这个样本中, 最大值为 181, 最小值为 157, 它们的差是24, 可以取组距为4, 分成 7 组 , 根据题意列出样本的频率分布表如下:分组频数频率156.5 ~ 160.530.06160.5 ~ 164.540.08164.5 ~ 168.5120.24168.5 ~ 172.5120.24172.5 ~ 176.5130.26176.5 ~ 180.540.08180.5 ~ 184.520.04合计50 1.00频率分布直方图( 略 )②茎叶图作图步骤:1.将每个数据分为茎 ( 高位 ) 和叶 ( 低位 ) 两部分 .2. 将最小茎和最大茎之间的数按大小顺序排成一列, 写在左 ( 右 ) 侧;3.将各个数据的叶按大小次序写在其右( 左 ) 侧.例、某中学高二(2) 班甲、乙两名同学自高中以来每场数学考试成绩如下:甲的得分: 95,81,75,91,86,89,71,65,76,88,94,110,107;乙的得分: 83,86,93,99,88,130,98,114,98,79,101.画出两人数学成绩茎叶图, 请根据茎叶图对两人的成绩进行比较.解:甲、乙两人数学成绩的茎叶图如下图:甲乙565 6 1 798 9 6 1 8 6 3 84 15 9 3 9 8 87 10 310 114从这个茎叶图上可看出, 乙同学的得分情况是大致对称的, 中位数是99;甲同学的得分情况除一个特殊得分外,也大致对称, 中位数是89. 因此乙同学发挥比较稳定, 总体得分情况比甲同学好.2、用样本的数据特征估计总体的数据特征( 1)、在频率直方图中计算众数、平均数、中位数众数:在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。
部编版高中数学必修二第九章统计带答案知识点总结全面整理
(名师选题)部编版高中数学必修二第九章统计带答案知识点总结全面整理单选题1、已知一个样本容量为7的样本的平均数为5,方差为2,现样本加入新数据4,5,6,此时样本容量为10,若此时平均数为x ,方差为s 2,则( ) A .x =5,s 2=2B .x =5,s 2=1.6 C .x =4.9,s 2=1.6D .x =5.1,s 2=22、2021年3月12日是全国第43个植树节,为提高大家爱劳动的意识,某中学组织开展植树活动,并收集了高三年级1~11班植树量的数据(单位:棵),绘制了下面的折线图.根据折线图,下列结论不正确的是( )A .各班植树的棵数不是逐班增加的B .4班植树的棵数低于11个班的平均值C .各班植树棵数的中位数为6班对应的植树棵数D .1至5班植树的棵数相对于6至11班,波动更小,变化比较平稳 3、下列抽样方法是简单随机抽样的是( )A .某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动B .从10个手机中逐个不放回地随机抽取2个进行质量检验C .从空间直角坐标系中抽取10个点作为样本D .饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查 4、3个数1,3,5的方差是( ) A .23B .34C .2D .835、为了更好地支持“中小型企业”的发展,某市决定对部分企业的税收进行适当的减免,某机构调查了当地的中小型企业年收入情况,并根据所得数据画出了样本的频率分布直方图,下面三个结论:①样本数据落在区间[300,500)的频率为0.45;②如果规定年收入在500万元以内的企业才能享受减免税政策,估计有55%的当地中小型企业能享受到减免税政策;③样本的中位数为480万元.其中正确结论的个数为A.0B.1C.2D.36、一组数据由10个数组成,将其中一个数由4改为1,另一个数由6改为9,其余数不变,得到新的10个数,则新的一组数的方差相比原先一组数的方差的增加值为()A.2B.3C.4D.57、某老师为了解某班50名同学在家学习的情况,决定将本班学生依次编号为01,02,⋅⋅⋅,50.利用下面的随机数表选取10名学生调查,选取方法是从下面随机数表的第1行第2列开始由左到右依次读取两个数字,则选出来的第4名学生的编号为()7 2 5 6 0 8 1 3 0 2 5 8 3 2 4 9 8 7 0 2 4 8 1 2 9 7 2 8 0 19 8 3 1 0 4 9 2 3 1 4 9 3 5 8 2 0 9 3 6 2 4 4 8 6 9 6 9 3 87 4 8 1A.25B.24C.29D.198、为了进一步推动全市学习型党组织、学习型社会建设,某市组织开展“学习强国”知识测试,从全体测试人员中随机抽取了一部分人的测试成绩,得到频率分布直方图如图所示.假设同组中的每个数据都用该组区间的中点值代替,则估计这部分人的测试成绩的平均数和中位数分别是()A.85,87.5B.86.75,86.67C.86.75,85D.85,85多选题9、中国的华为公司是全球领先的ICT(信息与通信)基础设施和智能终端提供商,其致力于把数字世界带给每个人、每个家庭、每个组织,构建万物互联的智能世界.其中华为的5G智能手机是全世界很多年轻人非常喜欢的品牌.为了研究某城市甲、乙两个华为5G智能手机专卖店的销售状况,统计了2020年4月到9月甲、乙两店每月的营业额(单位:万元),得到如下的折线图,则下列说法正确的是()A.根据甲店的营业额折线图可知,该店月营业额的平均值在[31,32]内B.根据乙店的营业额折线图可知,该店月营业额总体呈上升趋势C.根据甲、乙两店的营业额折线图可知乙店的月营业额极差比甲店小D.根据甲、乙两店的营业额折线图可知7、8、9月份的总营业额甲店比乙店少10、(多选)下列调查方式合适的是()A.为了了解炮弹的杀伤力,采用抽样调查的方式B.为了了解全国中学生的睡眠状况,采用普查的方式C.为了了解人们保护水资源的意识,采用抽样调查的方式D.检查一批待售袋装牛奶中的细菌是否超标,采用普查的方式11、某学校为了了解学生一周内在生活方面的支出情况,从全校学生中随机抽取n名学生进行调查,得到频率分布直方图如图所示,其中支出在[50,60]内的学生有60人,则下列说法正确的是()A.样本中数据的中位数小于41B.样本中支出不少于40元的人数为132C.全校学生支出的众数约为45元D.若该校有2000名学生,则约有600人的支出在[50,60]内填空题12、由6个实数组成的一组数据的方差为S12,将其中一个数5改为2,另一个数4改为7 ,其余的数不变,得到新的一组数据的方差为S22,则S22−S12=________.13、已知一组数据4,2a,3−a,5,6的平均数为4,则a的值是_____.部编版高中数学必修二第九章统计带答案(四十二)参考答案1、答案:B分析:设这10个数据分别为:x1,x2,⋯,x7,x8=4,x9=5,x10=6,进而根据题意求出x1+x2+⋯+x7和(x1−5)2+(x2−5)2+⋯+(x7−5)2,进而再根据平均数和方差的定义求得答案.设这10个数据分别为:x1,x2,⋯,x7,x8=4,x9=5,x10=6,根据题意x1+x2+⋯+x77=5⇒x1+x2+⋯+x7=35,(x1−5)2+(x2−5)2+⋯+(x7−5)27=2⇒(x1−5)2+(x2−5)2+⋯+(x7−5)2=14,所以x=x1+x2+⋯+x1010=35+4+5+610=5,s2=(x1−5)2+(x2−5)2+⋯+(x10−5)210=14+(4−5)2+(5−5)2+⋯+(6−5)210=1.6.故选:B.2、答案:C分析:从图中直接观察可以判定AD正确,结合平均数的定义,将比4班多的里面取出部分补到比4班少的班中,可以使得4班的植树量最少,从而判定B正确;结合中位数的定义可以判定C错误.从图可知,2班的植树量少于1班,8班的植树量少于7班,故A正确;4班的指数棵数为10,11个班中只有2、3、8班三个的植树棵数少于10,且大于5棵,其余7个班的植树棵数都超过10棵,且有6、7、9、10、11班五个班的植树棵数都不少于15棵,将这五个班中的植树棵数各取出5棵,加到2、3、8班中取,除4班外,其余各班的植树棵数都超过了4班,所以4班植树的棵数低于11个班的平均值,故B正确;比6班植树多的只有9、10、11三个班,其余七个班都比6班少,故6班所对应的植树棵数不是中位数,故C是错误的;1到5班的植树棵数的极差在10以内,6到11班的植树棵数的极差超过了15,另外从图明显看出,1至5班植树的棵数相对于6至11班,波动更小,变化比较平稳,故D正确;综上,不正确的只有C,故选:C.小提示:本题考查频数折线图的意义,涉及平均数,中位数,波动大小的判定,难点是平均数的估算,这里采用取长补短法进行估算,可以避免数字的计算.3、答案:B分析:根据简单随机抽样的特点逐项判断可得答案.对于A,某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动,每个人被抽到的机会不相等,故错误;对于B,从10个手机中逐个不放回地随机抽取2个进行质量检验,是简单随机抽样,故正确;对于C,从空间直角坐标系中抽取10个点作为样本,由于被抽取的样本的总体个数是无限的,所以不是简单随机抽样,故错误;对于D,饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查,不是逐个抽取,所以不是简单随机抽样,故错误.故选:B.4、答案:D分析:由题得3个数的平均数为3,再利用方差公式求解.由题得3个数的平均数为3,所以S2=13[(1−3)2+(3−3)2+(5−3)2]=83.故选:D5、答案:D解析:根据直方图求出a=0.0025,求出[300,500)的频率,可判断①;求出[200,500)的频率,可判断②;根据中位数是从左到右频率为0.5的分界点,先确定在哪个区间,再求出占该区间的比例,求出中位数,判断③.由(0.001+0.0015+0,002+0.0005+2a)×100=1,a=0.0025,[300,500)的频率为(0.002+0.0025)×100=0.45,①正确;[200,500)的频率为(0.0015+0.002+0.0025)×100=0.55,②正确;[200,400)的频率为0.3,[200,500)的频率为0.55,中位数在[400,500)且占该组的45,故中位数为400+0.5−0.30.25×100=480,③正确.故选:D.小提示:本题考查补全直方图,由直方图求频率和平均数,属于基础题6、答案:B分析:先判断出平均数不变,然后分别表示出原先一组数的方差和新数据的方差,作差化简即可得到答案. 一个数由4改为1,另一个数由6改为9,故该组数据的平均数x不变,设没有改变的八个数分别为x1,x2,x3,⋯,x8,原先一组数的方差s12=110[(x1−x)2+(x2−x)2+(x3−x)2+⋯+(x8−x)2+(4−x)2+(6−x)2],新数据的方差s22=110[(x1−x)2+(x2−x)2+(x3−x)2+⋯+(x8−x)2+(1−x)2+(9−x)2所以s22−s12=110[(1−x)2+(9−x)2−(4−x)2−(6−x)2]=110(1−2x+x2+81−18x+x2−16+8x−x2−36+12x−x2)=3,故选:B.小提示:关键点点睛:该题考查了平均数与方差的求解,正确解题的关键是熟练掌握方差的计算公式.7、答案:C分析:利用随机表法从第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个即可求解.从题中随机数表的第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个可得:25 ,30 ,24,2 9,19,10 ,49 ,23,14,20,故选出来的第4名学生的编号为29.故选:C.8、答案:B分析:根据平均数和中位数的定义求解即可由题意可知,平均数约为(0.03×77.5+0.05×82.5+0.06×87.5+0.04×92.5+0.02×97.5)×5=86.75;因为前2组的频率和为5×0.03+5×0.05=0.4<0.5,前3组的频率和为5×0.03+5×0.05+5×0.06=0.7>0.5,所以中位数在[85,90)内,设中位数为x,则5×0.03+5×0.05+(x−85)×0.06=0.5,解得x≈86.67. 所以估计这部分人的测试成绩的平均数和中位数分别是86.75,86.67.故选:B.9、答案:ABD解析:计算出甲店的月营业额的平均值即可判断A;由图可直接判断B;分别计算出甲、乙两店的月营业额极差和7、8、9月份的总营业额即可判断CD.对于A,根据甲店的营业额折线图可知,该店月营业额的平均值为14+21+26+30+52+476=1906≈31.7,故A正确;对于B,根据乙店的营业额折线图可知,该店月营业额总体呈上升趋势,故B正确;对于C,可得甲店的月营业额极差为52−14=38,乙店的月营业额极差为53−7=46,故C错误;对于D,甲店7、8、9月份的总营业额为30+52+47=129,乙店7、8、9月份的总营业额为33+44+53=130,故D正确.故选:ABD.10、答案:AC分析:根据普查和抽样方法的特点判断.了解炮弹杀伤力的过程中具有破坏性,所以采用抽样调查的方式;了解全国中学生的睡眠状况,工作量大,所以采用抽样调查的方式;了解人们保护水资源的意识,工作量大,所以采用抽样调查的方式;检查一批待售袋装牛奶中的细菌是否超标,具有毁损性,所以采用抽样调查的方式.故选:AC.11、答案:BCD分析:设样本数据的中位数为x,根据(0.01+0.024)×10+(x−40)×0.036=0.5求出x可判断A;计算出样本中支出在[50,60]内的频率可得样本中支出不少于40元的人数可判断B;由频率分布直方图得样本中学生支出的众数再估算全校学生支出的众数可判断C;若该校有2000名学生乘以0.3可判断D.在A中,设样本数据的中位数为x,则(0.01+0.024)×10+(x−40)×0.036=0.5,解得x≈44.44>41,故A错误;在B中,样本中支出在[50,60]内的频率为1−(0.01+0.024+0.036)×10=0.3,样本中支出不少于40元的+60=132,故B正确;人数为0.36×60=45(元),所以全校学生支出的众数约为在C中,由频率分布直方图得样本中学生支出的众数约为40+50245元,故C正确;在D中,若该校有2000名学生,则约有2000×0.3=600人的支出在[50,60]内,故D正确.故选:BCD.12、答案:2分析:根据平均数和方差的定义进行求解即可.因为将其中一个数5改为2,另一个数4改为7,其余的数不变,所以这6个实数组成的一组数据的平均数不变,设为x,设没有变化的4个数与平均数差的平方和为S,所以S22−S12=[S+(2−x)2+(7−x)2]−[S+(5−x)2+(4−x)2]=2,6所以答案是:213、答案:2分析:根据平均数的公式进行求解即可.∵数据4,2a,3−a,5,6的平均数为4∴4+2a+3−a+5+6=20,即a=2.所以答案是:2.小提示:本题主要考查平均数的计算和应用,比较基础.。
部编版高中数学必修二第九章统计重点归纳笔记
(名师选题)部编版高中数学必修二第九章统计重点归纳笔记单选题1、从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[66,70)、[70,74)、⋯、[94,98],并整理得到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是()A.20B.40C.64D.80答案:D分析:利用频率分布直方图可计算出评分在区间[82,86)内的影视作品数量.由频率分布直方图可知,评分在区间[82,86)内的影视作品数量为400×0.05×4=80.故选:D.2、有13名同学参加百米竞赛,预赛成绩各不相同,要取前6名参加决赛,小明同学已经知道了自己的成绩,为了判断自己是否能进入决赛,他还需要知道13名同学成绩的()A.平均数B.众数C.中位数D.方差答案:C分析:成绩由小到大排列,能否进入决赛就看小明成绩排名是否在第7以前即可得解.把13名同学成绩按由大到小排列,取成绩靠前的6个成绩进入决赛,即最中间一个数之前的6个成绩进入决赛,13个成绩按由大到小排列时,最中间一个数即是中位数.故选:C3、如图,是根据某班学生在一次数学考试中的成绩画出的频率分布直方图,若由直方图得到的众数,中位数和平均数(同一组中的数据用该组区间的中点值为代表)分别为a,b,c,则()A.b>a>c B.a>b>c C.a+c2>b D.b+c2>a答案:B解析:根据频率分布直方图读出众数a,计算中位数b,平均数c,再比较大小.由频率分布直方图可知:众数a=70+802=75;中位数应落在70-80区间内,则有:0.01×10+0.015×10+0.015×10+0.03×(b−70)=0.5,解得:b=2203=7313;平均数c=0.01×10×40+502+0.015×10×50+602+0.015×10×60+702+0.03×10×70+802+0.025×10×80+902+0.005×10×90+1002=4.5+8.25+9.75+22.5+21.25+4.75=71所以a>b>c故选:B小提示:从频率分布直方图可以估计出的几个数据:(1)众数:频率分布直方图中最高矩形的底边中点的横坐标;(2)平均数:频率分布直方图每组数值的中间值乘以频率后相加;(3)中位数:把频率分布直方图分成两个面积相等部分的平行于y轴的直线横坐标.4、抽样统计甲射击运动员10次的训练成绩分别为86,85,88,86,90,89,88,87,85,92,则这10次成绩的80%分位数为()A.88.5B.89C.91D.89.5答案:D分析:将数据从小到大排列,计算10×80%=8,得到答案.甲射击运动员10次的训练成绩从小到大分别为:85,85,86,86,87,88,88,89,90,92.=89.5.10×80%=8,这10次成绩的80%分位数为:89+902故选:D.5、设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为()A.0.01B.0.1C.1D.10答案:C分析:根据新数据与原数据关系确定方差关系,即得结果.因为数据ax i+b,(i=1,2,⋯,n)的方差是数据x i,(i=1,2,⋯,n)的方差的a2倍,所以所求数据方差为102×0.01=1故选:C小提示:本题考查方差,考查基本分析求解能力,属基础题.6、某学校在校学生有2000人,为了增强学生的体质,学校举行了跑步和登山比赛,每人都参加且只参加其中一项比赛,高一、高二、高三年级参加跑步的人数分别为a,b,c,且a:b:c=2:5:3,全校参加登山的人.为了了解学生对本次比赛的满意程度,按分层抽样的方法从中抽取一个容量为200的样本进数占总人数的14行调查,则应从高三年级参加跑步的学生中抽取()A.15人B.30人C.40人D.45人答案:D=1500,再根据分层抽样的方法求解即可得答案.分析:由题知全校参加跑步的人数为2000×34解:由题意,可知全校参加跑步的人数为2000×3=1500,4=450.所以a+b+c=1500.因为a:b:c=2:5:3,所以c=1500×32+5+3因为按分层抽样的方法从中抽取一个容量为200的样本,所以应从高三年级参加跑步的学生中抽取的人数为450×200=45.2000故选:D7、根据气象学上的标准,连续5天的日平均气温低于10℃即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①、②、③、④,依次计算得到结果如下:①平均数x̅<4;②平均数x̅<4且极差小于或等于3;③平均数x̅<4且标准差s≤4;④众数等于5且极差小于或等于4.则4组样本中一定符合入冬指标的共有()A.1组B.2组C.3组D.4组答案:B分析:举反例否定①;反证法证明②符合要求;举反例否定③;直接法证明④符合要求.①举反例:0,0,0,4,11,其平均数x̅=3<4.但不符合入冬指标;②假设有数据大于或等于10,由极差小于或等于3可知,则此组数据中的最小值为10−3=7,此时数据的平均数必然大于7,与x̅<4矛盾,故假设错误.则此组数据全部小于10. 符合入冬指标;③举反例:1,1,1,1,11,平均数x̅=3<4,且标准差s=4.但不符合入冬指标;④在众数等于5且极差小于等于4时,则最大数不超过9.符合入冬指标.故选:B.8、国内生产总值(GDP)指按市场价格计算的一个国家(或地区)所有常住单位在一定时期内生产活动的最终成果.下图是我国2014~2018年连续5年的GDP及增速图,则下列结论错误的是()A.连续5年中我国GDP保持6%以上的增长B.2014~2018年我国GDP增速整体呈现下降趋势C.2018年GDP为这5年最高,GDP增速为这5年最低D.2018年GDP相对2014年GDP增长了一倍以上答案:D分析:根据表中的数据,依次分析各选项即可得答案.解:根据表中数据,对于A选项,2018年国民生产总值增长率最低,为6.6%左右,故连续5年中我国GDP保持6%以上的增长,正确;对于B选项,根据增长率折线图可知,2014~2018年我国GDP增速整体呈现下降趋势,故正确;对于C选项,2018年GDP为90万亿,为5年最高,GDP增速为6.6%左右,为5年最低,故正确;对于D选项,由表中数据,2014年GDP为64万亿左右,2018年GDP为90万亿左右,故没有增长一倍以上,故错误.故选:D多选题9、2020年春节前后,一场突如其来的新冠肺炎疫情在全国蔓延.疫情就是命令,防控就是责任.在党中央的坚强领导和统一指挥下,全国人民众志成城、团结一心,掀起了一场坚决打赢疫情防控阻击战的人民战争.下侧的图表展示了2月14日至29日全国新冠肺炎疫情变化情况,根据该折线图,下列结论正确的是()A.16天中每日新增确诊病例数量在下降且19日的降幅最大B.16天中每日新增确诊病例的中位数小于新增疑似病例的中位数C.16天中新增确诊、新增疑似、新增治愈病例的极差均大于2000D.21日至29日每日新增治愈病例数量均大于新增确诊与新增疑似病例之和答案:BCD分析:根据折线图,中位数、极差的概念,判断各选项.20日新增确诊病例数量比19日多,A错;新增确诊病例的中位数小于新增疑似病例的中位数在21、22日左右,比较可得B正确;新增确诊极差>2500−500=2000、新增疑似极差>2300−200>2000、新增治愈病例的极差>3500−1500=2000,均大于2000,C正确;21日至29日每日新增治愈病例数量均大于新增确诊与新增疑似病例之和,D正确.故选:BCD.小提示:本题考查统计图表,考查折线图,中位数、极差等概念,解题关键是正确认识统计图,能从图表中抽象出所需数据,并对数据进行处理.10、已知一组数据为-1,1,5,5,0,则该组数据的()A.众数是5B.平均数是2C.中位数是5D.方差是325分析:计算数据的众数为5,平均数为2,中位数为1,方差为325,对比选项得到答案. 数据为-1,1,5,5,0,的众数为5,A正确;数据的平均数为−1+1+5+5+05=2,B正确;数据的中位数为1,C错误;数据的方差为(−1−2)2+(1−2)2+(5−2)2+(5−2)2+(0−2)25=325,D正确.故选:ABD.11、在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间的中点值作代表,则下列说法中正确的是()A.成绩在[70,80)内的考生人数最多B.不及格的考生人数为1000C.考生竞赛成绩的平均分约为70.5分D.考生竞赛成绩的中位数为75分答案:ABC分析:读懂题目提供的直方图,根据图中的数据逐项分析即可.对于A,由频率分布直方图可得,成绩在[70,80)内的面积最大,因此考生人数最多,故A正确;对于B,由频率分布直方图可得,成绩在[40,60)内的频率为10×(0.01+0.015)=0.25,因此不及格的人数为4000×0.25=1000,对于C,由频率分布直方图可得,平均分约为:45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5(分),故C正确;对于D,因为成绩在[40,70)内的频率为10×(0.01+0.015+0.02)=0.45,≈71.67,在[70,80)内的频率为0.3,所以中位数为70+10×0.5−0.450.3故D错误;故选:ABC.填空题12、在某网店购买之前未曾使用过的商品时,先翻看该商品的相关评价.从统计角度来看,这也是一种抽样调查,这种抽样调查______.(填写“具有代表性”“不具有代表性”)请说明理由.答案:不具有代表性分析:根据给定条件,利用抽样调查具有的性质去分析判断作答.这种抽样调查是对愿意写评价的购买者的调查,或者是对这个商品有强烈意愿(喜爱或憎恶)的购买者的调查,不具有广泛性,不具有代表性.所以答案是:不具有代表性13、《中国诗词大会》是央视科教频道推出的一档以“赏中华诗词,寻文化基因,品生活之美”为宗旨的文化类演播室益智竞赛节目,邀请全国各个年龄段、各个领域的诗词爱好者共同参与诗词知识比拼.“百人团”由一百多位来自全国各地的不同年龄段的选手组成,按照年龄分组统计如下表:6人参加挑战,则从年龄组[7,20),[20,40),[40,80]中抽取的挑战者的人数分别为______.答案:1,3,2分析:根据分层抽样的特点直接计算即可.“百人团”的总人数为18+54+36=108,则用分层抽样的方法抽取的挑战者的年龄在[7,20)的人数为6×18 108=1,年龄在[20,40)的人数为6×54108=3,年龄在[40,80]的人数为6×36108=2.所以从年龄组[7,20),[20,40),[40,80]中抽取的挑战者的人数分别为1,3,2.所以答案是:1,3,2.。
部编版高中数学必修二第九章统计知识点总结全面整理
(名师选题)部编版高中数学必修二第九章统计知识点总结全面整理单选题1、已知一个样本容量为7的样本的平均数为5,方差为2,现样本加入新数据4,5,6,此时样本容量为10,若此时平均数为x,方差为s2,则()A.x=5,s2=2B.x=5,s2=1.6C.x=4.9,s2=1.6D.x=5.1,s2=2答案:B分析:设这10个数据分别为:x1,x2,⋯,x7,x8=4,x9=5,x10=6,进而根据题意求出x1+x2+⋯+x7和(x1−5)2+(x2−5)2+⋯+(x7−5)2,进而再根据平均数和方差的定义求得答案.设这10个数据分别为:x1,x2,⋯,x7,x8=4,x9=5,x10=6,根据题意x1+x2+⋯+x77=5⇒x1+x2+⋯+x7=35,(x1−5)2+(x2−5)2+⋯+(x7−5)27=2⇒(x1−5)2+(x2−5)2+⋯+(x7−5)2=14,所以x=x1+x2+⋯+x1010=35+4+5+610=5,s2=(x1−5)2+(x2−5)2+⋯+(x10−5)210=14+(4−5)2+(5−5)2+⋯+(6−5)210=1.6.故选:B.2、2021年3月12日是全国第43个植树节,为提高大家爱劳动的意识,某中学组织开展植树活动,并收集了高三年级1~11班植树量的数据(单位:棵),绘制了下面的折线图.根据折线图,下列结论不正确的是()A.各班植树的棵数不是逐班增加的B.4班植树的棵数低于11个班的平均值C.各班植树棵数的中位数为6班对应的植树棵数D.1至5班植树的棵数相对于6至11班,波动更小,变化比较平稳答案:C分析:从图中直接观察可以判定AD正确,结合平均数的定义,将比4班多的里面取出部分补到比4班少的班中,可以使得4班的植树量最少,从而判定B正确;结合中位数的定义可以判定C错误.从图可知,2班的植树量少于1班,8班的植树量少于7班,故A正确;4班的指数棵数为10,11个班中只有2、3、8班三个的植树棵数少于10,且大于5棵,其余7个班的植树棵数都超过10棵,且有6、7、9、10、11班五个班的植树棵数都不少于15棵,将这五个班中的植树棵数各取出5棵,加到2、3、8班中取,除4班外,其余各班的植树棵数都超过了4班,所以4班植树的棵数低于11个班的平均值,故B正确;比6班植树多的只有9、10、11三个班,其余七个班都比6班少,故6班所对应的植树棵数不是中位数,故C是错误的;1到5班的植树棵数的极差在10以内,6到11班的植树棵数的极差超过了15,另外从图明显看出,1至5班植树的棵数相对于6至11班,波动更小,变化比较平稳,故D正确;综上,不正确的只有C,故选:C.小提示:本题考查频数折线图的意义,涉及平均数,中位数,波动大小的判定,难点是平均数的估算,这里采用取长补短法进行估算,可以避免数字的计算.3、下列抽样方法是简单随机抽样的是()A.某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动B.从10个手机中逐个不放回地随机抽取2个进行质量检验C.从空间直角坐标系中抽取10个点作为样本D.饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查答案:B分析:根据简单随机抽样的特点逐项判断可得答案.对于A,某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动,每个人被抽到的机会不相等,故错误;对于B,从10个手机中逐个不放回地随机抽取2个进行质量检验,是简单随机抽样,故正确;对于C,从空间直角坐标系中抽取10个点作为样本,由于被抽取的样本的总体个数是无限的,所以不是简单随机抽样,故错误;对于D ,饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查,不是逐个抽取,所以不是简单随机抽样,故错误. 故选:B.4、3个数1,3,5的方差是( ) A .23B .34C .2D .83 答案:D分析:由题得3个数的平均数为3,再利用方差公式求解. 由题得3个数的平均数为3,所以S 2=13[(1−3)2+(3−3)2+(5−3)2]=83.故选:D5、为了更好地支持“中小型企业”的发展,某市决定对部分企业的税收进行适当的减免,某机构调查了当地的中小型企业年收入情况,并根据所得数据画出了样本的频率分布直方图,下面三个结论:①样本数据落在区间[300,500)的频率为0.45;②如果规定年收入在500万元以内的企业才能享受减免税政策,估计有55%的当地中小型企业能享受到减免税政策;③样本的中位数为480万元. 其中正确结论的个数为 A .0B .1C .2D .3 答案:D解析:根据直方图求出a =0.0025,求出[300,500)的频率,可判断①;求出[200,500)的频率,可判断②;根据中位数是从左到右频率为0.5的分界点,先确定在哪个区间,再求出占该区间的比例,求出中位数,判断③.由(0.001+0.0015+0,002+0.0005+2a)×100=1,a=0.0025,[300,500)的频率为(0.002+0.0025)×100=0.45,①正确;[200,500)的频率为(0.0015+0.002+0.0025)×100=0.55,②正确;[200,400)的频率为0.3,[200,500)的频率为0.55,中位数在[400,500)且占该组的45,故中位数为400+0.5−0.30.25×100=480,③正确.故选:D.小提示:本题考查补全直方图,由直方图求频率和平均数,属于基础题6、一组数据由10个数组成,将其中一个数由4改为1,另一个数由6改为9,其余数不变,得到新的10个数,则新的一组数的方差相比原先一组数的方差的增加值为()A.2B.3C.4D.5答案:B分析:先判断出平均数不变,然后分别表示出原先一组数的方差和新数据的方差,作差化简即可得到答案. 一个数由4改为1,另一个数由6改为9,故该组数据的平均数x不变,设没有改变的八个数分别为x1,x2,x3,⋯,x8,原先一组数的方差s12=110[(x1−x)2+(x2−x)2+(x3−x)2+⋯+(x8−x)2+(4−x)2+(6−x)2],新数据的方差s22=110[(x1−x)2+(x2−x)2+(x3−x)2+⋯+(x8−x)2+(1−x)2+(9−x)2所以s22−s12=110[(1−x)2+(9−x)2−(4−x)2−(6−x)2]=110(1−2x+x2+81−18x+x2−16+8x−x2−36+12x−x2)=3,故选:B.小提示:关键点点睛:该题考查了平均数与方差的求解,正确解题的关键是熟练掌握方差的计算公式.7、某老师为了解某班50名同学在家学习的情况,决定将本班学生依次编号为01,02,⋅⋅⋅,50.利用下面的随机数表选取10名学生调查,选取方法是从下面随机数表的第1行第2列开始由左到右依次读取两个数字,则选出来的第4名学生的编号为()7 2 5 6 0 8 1 3 0 2 5 8 3 2 4 9 8 7 0 2 4 8 1 2 9 7 2 8 0 19 8 3 1 0 4 9 2 3 1 4 9 3 5 8 2 0 9 3 6 2 4 4 8 6 9 6 9 3 87 4 8 1A.25B.24C.29D.19答案:C分析:利用随机表法从第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个即可求解.从题中随机数表的第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个可得:25 ,30 ,24,2 9,19,10 ,49 ,23,14,20,故选出来的第4名学生的编号为29.故选:C.8、为了进一步推动全市学习型党组织、学习型社会建设,某市组织开展“学习强国”知识测试,从全体测试人员中随机抽取了一部分人的测试成绩,得到频率分布直方图如图所示.假设同组中的每个数据都用该组区间的中点值代替,则估计这部分人的测试成绩的平均数和中位数分别是()A.85,87.5B.86.75,86.67C.86.75,85D.85,85答案:B分析:根据平均数和中位数的定义求解即可由题意可知,平均数约为(0.03×77.5+0.05×82.5+0.06×87.5+0.04×92.5+0.02×97.5)×5=86.75;因为前2组的频率和为5×0.03+5×0.05=0.4<0.5,前3组的频率和为5×0.03+5×0.05+5×0.06= 0.7>0.5,所以中位数在[85,90)内,设中位数为x,则5×0.03+5×0.05+(x−85)×0.06=0.5,解得x≈86.67. 所以估计这部分人的测试成绩的平均数和中位数分别是86.75,86.67.故选:B.多选题9、中国的华为公司是全球领先的ICT(信息与通信)基础设施和智能终端提供商,其致力于把数字世界带给每个人、每个家庭、每个组织,构建万物互联的智能世界.其中华为的5G智能手机是全世界很多年轻人非常喜欢的品牌.为了研究某城市甲、乙两个华为5G智能手机专卖店的销售状况,统计了2020年4月到9月甲、乙两店每月的营业额(单位:万元),得到如下的折线图,则下列说法正确的是()A.根据甲店的营业额折线图可知,该店月营业额的平均值在[31,32]内B.根据乙店的营业额折线图可知,该店月营业额总体呈上升趋势C.根据甲、乙两店的营业额折线图可知乙店的月营业额极差比甲店小D.根据甲、乙两店的营业额折线图可知7、8、9月份的总营业额甲店比乙店少答案:ABD解析:计算出甲店的月营业额的平均值即可判断A;由图可直接判断B;分别计算出甲、乙两店的月营业额极差和7、8、9月份的总营业额即可判断CD.对于A,根据甲店的营业额折线图可知,该店月营业额的平均值为14+21+26+30+52+476=1906≈31.7,故A正确;对于B,根据乙店的营业额折线图可知,该店月营业额总体呈上升趋势,故B正确;对于C,可得甲店的月营业额极差为52−14=38,乙店的月营业额极差为53−7=46,故C错误;对于D,甲店7、8、9月份的总营业额为30+52+47=129,乙店7、8、9月份的总营业额为33+44+ 53=130,故D正确.故选:ABD.10、(多选)下列调查方式合适的是()A.为了了解炮弹的杀伤力,采用抽样调查的方式B.为了了解全国中学生的睡眠状况,采用普查的方式C.为了了解人们保护水资源的意识,采用抽样调查的方式D.检查一批待售袋装牛奶中的细菌是否超标,采用普查的方式答案:AC分析:根据普查和抽样方法的特点判断.了解炮弹杀伤力的过程中具有破坏性,所以采用抽样调查的方式;了解全国中学生的睡眠状况,工作量大,所以采用抽样调查的方式;了解人们保护水资源的意识,工作量大,所以采用抽样调查的方式;检查一批待售袋装牛奶中的细菌是否超标,具有毁损性,所以采用抽样调查的方式.故选:AC.11、某学校为了了解学生一周内在生活方面的支出情况,从全校学生中随机抽取n名学生进行调查,得到频率分布直方图如图所示,其中支出在[50,60]内的学生有60人,则下列说法正确的是()A.样本中数据的中位数小于41B.样本中支出不少于40元的人数为132C.全校学生支出的众数约为45元D.若该校有2000名学生,则约有600人的支出在[50,60]内答案:BCD分析:设样本数据的中位数为x,根据(0.01+0.024)×10+(x−40)×0.036=0.5求出x可判断A;计算出样本中支出在[50,60]内的频率可得样本中支出不少于40元的人数可判断B;由频率分布直方图得样本中学生支出的众数再估算全校学生支出的众数可判断C;若该校有2000名学生乘以0.3可判断D.在A中,设样本数据的中位数为x,则(0.01+0.024)×10+(x−40)×0.036=0.5,解得x≈44.44>41,故A 错误;在B中,样本中支出在[50,60]内的频率为1−(0.01+0.024+0.036)×10=0.3,样本中支出不少于40元的+60=132,故B正确;人数为0.36×60=45(元),所以全校学生支出的众数约为在C中,由频率分布直方图得样本中学生支出的众数约为40+50245元,故C正确;在D中,若该校有2000名学生,则约有2000×0.3=600人的支出在[50,60]内,故D正确.故选:BCD.填空题12、由6个实数组成的一组数据的方差为S12,将其中一个数5改为2,另一个数4改为7 ,其余的数不变,得到新的一组数据的方差为S22,则S22−S12=________.答案:2分析:根据平均数和方差的定义进行求解即可.因为将其中一个数5改为2,另一个数4改为7,其余的数不变,所以这6个实数组成的一组数据的平均数不变,设为x,设没有变化的4个数与平均数差的平方和为S,所以S22−S12=[S+(2−x)2+(7−x)2]−[S+(5−x)2+(4−x)2]=2,6所以答案是:213、已知一组数据4,2a,3−a,5,6的平均数为4,则a的值是_____. 答案:2分析:根据平均数的公式进行求解即可.∵数据4,2a,3−a,5,6的平均数为4∴4+2a+3−a+5+6=20,即a=2.所以答案是:2.小提示:本题主要考查平均数的计算和应用,比较基础.。
高中数学统计知识点总结
高中数学统计知识点总结高中数学统计学问点总结1考点1:确定大事和随机大事考核要求:〔1〕理解必定大事、不行能大事、随机大事的概念,知道确定大事与必定大事、不行能大事的关系;〔2〕能区分简洁生活大事中的必定大事、不行能大事、随机大事。
考点2:大事发生的可能性大小,大事的概率考核要求:〔1〕知道各种大事发生的可能性大小不同,能推断一些随机大事发生的可能大事的大小并排出大小挨次;〔2〕知道概率的含义和表示符号,了解必定大事、不行能大事的概率和随机大事概率的取值范围;〔3〕理解随机大事发生的频率之间的区分和联系,会依据大数次试验所得频率估量大事的概率。
〔1〕在给可能性的大小排序前可先用〝肯定发生〞、〝很有可能发生〞、〝可能发生〞、〝不太可能发生〞、〝肯定不会发生〞等词语来表述大事发生的可能性的大小;〔2〕大事的概率是确定的常数,而概率是不确定的,可是近似值,与试验的次数的多少有关,只有当试验次数足够大时才能更精确。
考点3:等可能试验中大事的概率问题及概率计算考核要求〔1〕理解等可能试验的概念,会用等可能试验中大事概率计算公式来计算简洁大事的概率;〔2〕会用枚举法或画〝树形图〞方法求等可能大事的概率,会用区域面积之比解决简洁的概率问题;〔3〕形成对概率的初步熟悉,了解机会与风险、规那么公正性与决策合理性等简洁概率问题。
〔1〕计算前要先确定是否为可能大事;〔2〕用枚举法或画〝树形图〞方法求等可能大事的概率过程中要将全部等可能状况考虑完好。
考点4:数据整理与统计图表考核要求:〔1〕知道数据整理分析的意义,知道普查和抽样调查这两种收集数据的方法及其区分;〔2〕结合有关代数、几何的内容,把握用折线图、扇形图、条形图等整理数据的方法,并能通过图表猎取有关信息。
考点5:统计的含义考核要求:〔1〕知道统计的意义和一般讨论过程;〔2〕熟悉个体、总体和样本的区分,了解样本估量总体的思想方法。
考点6:平均数、加权平均数的概念和计算考核要求:〔1〕理解平均数、加权平均数的概念;〔2〕把握平均数、加权平均数的计算公式。
2020年高中数学必修第二册“统计与概率”讲义精练:第五章 5.3 5.3.2(人教B版)
5.3.2事件之间的关系与运算(教师独具内容)课程标准:1.了解随机事件的并、交、互斥与对立的含义,能结合实例进行随机事件的并、交运算.2.通过实例,理解概率的性质,掌握随机事件概率的运算法则.教学重点:事件的关系和运算,互斥事件、对立事件的概念,用概率的性质求事件的概率.教学难点:区别互斥事件和对立事件,事件的混合运算.知识点错误!未指定书签。
一事件的包含(1)一般地,如果事件A发生时,事件B一定发生,则称“□01A包含于□02 B”(或“□03B包含□04A”),记作□05A⊆B(或□06B⊇A),这一关系可用下图表示.(2)□07A⊆B也可用充分必要的语言表述为:A发生是B发生的□08充分条件,B发生是A发生的□09必要条件.(3)如果A⊆B,则P(A)□10≤P(B).知识点错误!未指定书签。
二事件的相等(1)如果事件A发生时,事件B一定发生;而且事件B发生时,事件A也一定发生,则称“□01A与B相等”,记作□02A=B.(2)A=B⇔□03A⊆B且B⊆A.A=B也可用充分必要的语言表述为:A发生是B发生的□04充要条件.(3)当A=B时,有P(A□05=P(B).知识点错误!未指定书签。
三事件的和(并)(1)给定事件A,B,由所有A中的样本点与B中的样本点组成的事件称为□01 A与B的和(或并),记作□02A+B(或□03A∪B).事件A与B的□04和可以用如图所示的阴影部分表示.(2)由定义可知:①事件A+B发生时,当且仅当□05事件A与事件B中至少有一个发生;②A□06⊆(A+B)且B□07⊆(A+B).因此,P(A)□08≤P(A+B)且P(B)□09≤P(A+B),P(A+B)□10≤P(A)+P(B).知识点错误!未指定书签。
四事件的积(交)(1)给定事件A,B,由A与B中的公共样本点组成的事件称为□01A与B的积(或□02交),记作□03AB(或□04A∩B).事件A与B的□05积可以用如图所示的阴影部分表示.(2)由定义可知:①事件AB发生时,当且仅当□06事件A与事件B都发生.②AB□07⊆A,AB□08⊆B.因此,P(AB)□09≤P(A),P(AB)□10≤P(B).知识点错误!未指定书签。
新教材 人教A版高中数学必修第二册 第九章 统计 知识点汇总及解题规律方法提炼
新教材人教A版高中数学必修第二册第九章统计知识点汇总及解题规律方法提炼第九章统计学9.1 随机抽样1.全面调查与抽样调查全面调查是对每一个调查对象进行调查的方法,也被称为普查。
在一个调查中,调查对象的全体称为总体,组成总体的每一个调查对象称为个体。
抽样调查是根据一定的目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法。
从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本量。
调查样本获得的变量值称为样本的观测数据,简称样本数据。
2.简单随机抽样简单随机抽样包括放回简单随机抽样和不放回简单随机抽样。
放回简单随机抽样是从一个总体含有N(N为正整数)个个体中逐个抽取n(1≤n<N)个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样。
不放回简单随机抽样是如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样。
通过简单随机抽样获得的样本称为简单随机样本。
实现简单随机抽样的方法很多,抽签法和随机数法是比较常用的两种方法。
3.总体平均数与样本平均数总体平均数是指总体中所有个体变量值的平均数,记为Y。
如果总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则Y=(Y1+Y2+…+YN)/N。
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式Y=(∑fiYi)/N。
样本平均数是指从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称y=(y1+y2+…+yn)/n为样本均值,又称样本平均数。
在简单随机抽样中,各个个体被抽到的机会都相等,从而保证了抽样的公平性。
在统计学中,我们常使用样本平均数y来估计总体平均数Y。
人教版高中数学必修二《统计》统计与概率PPT课件6
第五章 统计与概率
利用三数——平均数、众数、中位数解决问题
某校欲招聘一名数学教师,学校对甲、乙、丙三位候选 人进行了三项能力测试,各项测试成绩满分均为 100 分,根据 结果择优录用.三位候选人的各项测试成绩如下表所示:
测试项目
教学能力 科研能力 组织能力
测试成绩
甲
乙
丙
85
73
73
70
71
栏目 导引
第五章 统计与概率
极差、方差与标准差 某社区准备在甲、乙两位射箭爱好者中选出一人参加集 训,两人各射了 5 箭,他们的总成绩(单位:环)相同,小宇根 据他们的成绩绘制了尚不完整的统计图表,并计算了甲成绩的 平均数和方差(见小宇的作业).
栏目 导引
第五章 统计与概率
小宇的作业: 解:-x 甲=15(9+4+7+4+6)=6, s2甲=15[(9-6)2+(4-6)2+(7-6)2+(4-6)2+(6-6)2] =15(9+4+1+4+0) =3.6.
栏目 导引
第五章 统计与概率
【解】 (1)这组数据的平均数没有实际意义,对专卖店经营没 有任何参考价值. (2)这组数据共有 110 个,中位数为 228,众数为 228. (3)专卖店总经理最关心的是众数,众数是 228,说明容积为 228 L 型号的冰箱销售量最大,它能为专卖店带来较多的利润,所 以这种型号的冰箱要多进些.
第五章 统计与概率
5.1.2 数据的数字特征
第五章 统计与概率
考点
基本数 字特征
数字特 征的应用
学习目标
核心素养
理解数据的基本数字特征:最值、平
均数、中位数、百分位数、众数、极 数据分析
差、方差与标准差等
高中数学中的统计分析知识点总结
高中数学中的统计分析知识点总结统计分析是数学中一个重要的分支,旨在通过数据分析和推理来揭示事物的规律和特征。
在高中数学中,统计分析是一个必修的内容,具有一定难度和广泛的应用领域。
本文将对高中数学中的统计分析知识点进行总结。
一、数据的收集和整理数据的收集是统计分析的第一步,可以通过观察、实验、调查等方式获取。
对于收集到的数据,需要进行整理和归纳,以保证数据的可靠性和可操作性。
主要的整理方法有频数表、频率表、分组统计等。
二、数据的图表表示1. 条形图条形图是一种直观的数据展示方式,用于比较不同类别或不同时间段之间的数据差异。
条形图中,条的长度表示数据的数量或大小。
2. 折线图折线图常用于表示随时间变化的数据趋势。
通过连接不同时间点上的数据点,可以直观地展示数据的变化规律。
3. 饼图饼图主要用于表示不同类别数据所占比例的关系。
饼图的圆形面积表示不同类别的数据比例大小。
4. 散点图散点图用于表示两个变量之间的关系,通过数据点在坐标系中的位置来展示变量之间的相关性。
三、数据的测度指标1. 中心位置测度中心位置测度用于描述数据的集中趋势,常用的有平均数、中位数、众数等。
平均数是数据的总和除以数据的个数,中位数是将数据按照大小排序后,处于中间位置或两个中间位置的数的平均值,众数是出现次数最多的数。
2. 离散程度测度离散程度测度用于描述数据的分散程度,常用的有范围、方差、标准差等。
范围是数据的最大值与最小值之差,方差是各个数据与平均数偏离程度的平方和的平均值,标准差是方差的正平方根。
四、概率与统计1. 概率基本概念概率是统计学中一个重要的概念,用于描述事件发生的可能性。
概率的基本概念包括样本空间、事件、事件概率等。
2. 随机事件的概率计算随机事件的概率计算可以通过频率方法、古典方法和几何方法等进行。
频率方法通过实验的结果来计算事件的概率,古典方法通过理论计算来估计事件的概率,几何方法通过几何图形来计算事件的概率。
部编版高中数学必修二第九章统计知识点总结归纳
(名师选题)部编版高中数学必修二第九章统计知识点总结归纳单选题1、某老师为了解某班50名同学在家学习的情况,决定将本班学生依次编号为01,02,⋅⋅⋅,50.利用下面的随机数表选取10名学生调查,选取方法是从下面随机数表的第1行第2列开始由左到右依次读取两个数字,则选出来的第4名学生的编号为()7 2 5 6 0 8 1 3 0 2 5 8 3 2 4 9 8 7 0 2 4 8 1 2 9 7 2 8 0 19 8 3 1 0 4 9 2 3 1 4 9 3 5 8 2 0 9 3 6 2 4 4 8 6 9 6 9 3 87 4 8 1A.25B.24C.29D.19答案:C分析:利用随机表法从第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个即可求解.从题中随机数表的第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个可得:25 ,30 ,24,2 9,19,10 ,49 ,23,14,20,故选出来的第4名学生的编号为29.故选:C.2、从某中学随机抽取100名学生,将他们的身高数据(单位cm)绘制成频率分布直方图,若要从身高在[150,160),[160,170),[170,180]三组内的学生中,用分层抽样的方法选取16人参加一次活动.则从身高在[170,180]内的学生中选取的人数应为()A.3B.4C.5D.7答案:B分析:先求得a 的值,然后结合分层抽样的知识计算出正确答案.依题意(0.005+0.015+a +0.035+0.02)×10=1,解得a =0.025,身高在[150,160),[160,170),[170,180]三组内的学生比例为0.025:0.035:0.02=5:7:4,用分层抽样的方法选取16人参加一次活动,则从身高在[170,180]内的学生中选取的人数应为4人故选:B3、某高中学校为了促进学生个体的全面发展,针对学生发展要求,开设了富有地方特色的“泥塑”与“剪纸”两个社团.已知报名参加这两个社团的学生共有800人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如下表:其中x :y :z =5:3:2,且“泥塑”社团的人数占两个社团总人数的35.为了了解学生对两个社团活动的满意程度,从中抽取一个容量为50的样本进行调查,则从“剪纸”社团的高二年级学生中应抽取的人数为( )A .4B .6C .9D .10答案:B 分析:先按分层抽样求出高二年级人数,再按样本占总体的比例得解.因为“泥塑”社团的人数占总人数的35,所以“剪纸”社团的人数占总人数的25,人数为800×25=320. 因为“剪纸”社团中高二年级人数比例为y x+y+z =35+3+2=310,所以“剪纸”社团中高二年级人数为320×310=96.以从“剪纸”社团的高二年级学生中抽取的人数为96×50800=96×116=6.故选:B.4、某书店新进了一批书籍,下表是某月中连续6天的销售情况记录:本B.1110本C.1340本D.1278本答案:A分析:由表格中的数据可以看出每天的销售数量在一个数值附近波动,故用平均数估计总体即可.(30+40+28+44+38+42)=37(本),该月共31由表中6天的销售情况可得,一天的平均销售量为16天,故该月的销售总量约为37×31=1147(本).故选: A5、某地教育局为了解“双减”政策的落实情况,在辖区内高三年级在校学生中抽取100名学生,调查他们课后完成作业的时间,根据调查结果绘制如下频率直方图.根据此频率直方图,下列结论中不正确的是()A.所抽取的学生中有25人在2小时至2.5小时之间完成作业B.该地高三年级学生完成作业的时间超过3小时的概率估计为35%C.估计该地高三年级学生的平均做作业的时间超过2.7小时D.估计该地高三年级有一半以上的学生做作业的时间在2小时至3小时之间答案:D分析:对A,利用直方图中2小时至2.5小时之间的频率判断A;对B,计算超过3小时的频率可判断B;对C,根据直方图中平均数的公式计算,可判断C;对D,计算做作业的时间在2小时至3小时之间的频率,可判断D.对A,直方图中2小时至2.5小时之间的频率为(2.5−2)×0.5=0.25,故所抽取的学生中有100×0.25=25人在2小时至2.5小时之间完成作业,故A正确;对B,由直方图得超过3小时的频率为0.5×(0.3+0.2+0.1+0.1)=0.35,所以B正确;对C,直方图可计算学生做作业的时间的平均数为:1.25×0.05+1.75×0.15+2.25×0.25+2.75×0.20+3.25×0.15+3.75×0.10+4.25×0.05+4.75×0.05=2.75>2.7,所以C正确;对D,做作业的时间在2小时至3小时之间的频率为0.5×(0.5+0.4)=0.45<0.5,所以D错误.故选:D.6、人口普查是世界各国所广泛采用的搜集人口资料的一种科学方法,是提供全国基本人口数据的主要来源.根据人口普查的基本情况,可以科学的研究制定社会、经济、科教等各项发展政策,是国家科学决策的重要基础工作,人口普查资料是制定人口政策的依据和前提.截止2020年10月10日,我国共进行了六次人口普查,下图是这六次人口普查的人数和增幅情况,下列说法正确的是()A.人口数逐次增加,第二次增幅最大B.第六次普查人数最多,第四次增幅最小C.第六次普查人数最多,第三次增幅最大D.人口数逐次增加,从第二次开始增幅减小答案:C分析:人口数由柱状图判断,增幅由折线图判断.A.人口数逐次增加,第三次增幅最大,故错误;B.第六次普查人数最多,第六次增幅最小,故错误;C.第六次普查人数最多,第三次增幅最大,故正确;D.人口数逐次增加,从第三次开始增幅减小,故错误;故选:C7、某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:66674037146405711105650995866876832037905716031163149084452175738805905223594310若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本编号是()A.10B.09C.71D.20答案:B分析:按照题意依次读出前4个数即可.从随机数表第1行的第9列数字开始由左向右每次连续读取2个数字,删除超出范围及重复的编号,符合条件的编号有14,05,11,09,所以选出来的第4个个体的编号为09,故选:B8、某大学工程学院共有本科生1200人、硕士生400人、博士生200人,要用分层抽样的方法从中抽取一个容量为180的样本,则应抽取博士生的人数为()A.20B.25C.40D.50答案:A分析:直接利用分层抽样,即可计算.因为学院共有本科生1200人、硕士生400人、博士生200人,×180=20.所以应抽取博士生的人数为2001200+400+200故选:A多选题9、2021年11月10日,中国和美国在联合国气候变化格拉斯哥大会期间发布《中美关于在21世纪20年代强化气候行动的格拉斯哥联合宣言》(以下简称《宣言》).承诺继续共同努力,并与各方一道,加强《巴黎协定》的实施,双方同意建立“21世纪20年代强化气候行动工作组”,推动两国气候变化合作和多边进程.为响应《宣言》要求,某地区统计了2020年该地区一次能源消费结构比例,并规划了2030年一次能源消费结构比例,如下图所示:经测算,预估该地区2030年一次能源消费量将增长为2020年的2.5倍,预计该地区()A.2030年煤的消费量相对2020年减少了B.2030年天然气的消费量是2020年的5倍C.2030年石油的消费量相对2020年不变D.2030年水、核、风能的消费量是2020年的7.5倍答案:BD分析:设2020年该地区一次能源消费总量为a,计算出2030年该地区煤、石油、天然气以及水、核、风能的消费量,逐项判断可得出合适的选项.设2020年该地区一次能源消费总量为a,2020年煤的消费量为0.6a,规划2030年煤的消费量为a×2.5×0.3=0.75a>0.6a,故A错误;2020年天然气的消费量为0.1a,规划2030年天然气的消费量为a×2.5×0.2=0.5a=5×0.1a,故B正确;2020年石油的消费量为0.2a,规划2030年石油的消费量为a×2.5×0.2=0.5a>0.2a,故C错误;2020年水、核、风能的消费量为0.1a,规划2030年水、核、风能的消费量为a×2.5×0.3=0.75a=7.5×0.1a,故D正确.故选:BD.10、冬末春初,乍暖还寒,人们容易感冒发热.若发生群体性发热,则会影响到人们的身体健康,干扰正常工作生产.某大型公司规定:若任意连续7天,每天不超过5人体温高于37.3℃,则称没有发生群体性发热.下列连续7天体温高于37.3℃人数的统计特征数中,能判定该公司没有发生群体性发热的为()A.中位数为3,众数为2B.均值小于1,中位数为1C.均值为2,标准差为√2D.均值为3,众数为4答案:BC分析:根据题意,设连续7天,每天体温高于37.3℃的人数分别为a,b,c,d,e,f,g,可得0≤a≤b≤c≤d≤e≤f≤g,然后根据选项,结合反例依次判定,即可求解.由题意,连续7天,每天体温高于37.3℃的人数分别为a,b,c,d,e,f,g,可得0≤a≤b≤c≤d≤e≤f≤g,对于A中,取2,2,2,2,3,4,6,则满足中位数为3,众数为2,但第7天的人数6>5,所以A不正确;对于B中,若g≥6,由中位数为1,可知均值为1(a+b+c+d+e+f+g)≥1,与均值小于1矛盾,所以7B正确;对于C中,当均值为2,标准差为√2时,a+b+⋯+g=14,且(a−2)2+⋯+(g−2)2=14,若g≥6,则(a−2)2+(b−2)2+⋯+(g−2)2>14,例如:1,1,1,1,2,3,5,符合题意,所以C正确;对于D中,取0,1,2,4,4,4,6,则满足均值为3,众数为4,但第7天人数6>5,所以D不正确.故选:BC.11、小明用某款手机性能测试APP对10部不同品牌的手机的某项性能进行测试,所得的分数按从小到大的顺序(相等数据相邻排列)排列为:81,84,84,87,x,y,93,96,96,99,已知总体的中位数为90,则()A.x+y=180B.该组数据的均值一定为90C.该组数据的众数一定为84和96D.若要使该总体的标准差最小,则x=y=90答案:ABD分析:依题意可得x+y=180,即可求出平均数,即可判断A、B,再利用特殊值判断C,利用基本不等式判断D;(81+84+84+87+x+y+93+解:因为总体的中位数为90,所以x+y=180,所以该组数据的均值为11096+96+99)=90,故A正确,B正确,当x=y=90时,众数为84,90,96,当x=87,y=93时,众数为84,87,93,96,故C错误;要使该总体的标准差最小,即方差最小,即(x−90)2+(y−90)2最小,又(x−90)2+(y−90)2≥(x+y−180)2=0,当且仅当x−90=y−90时,即x=y=90时等号成立,故D正确.2故选:ABD填空题12、某工厂为了解产品的生产情况,随机抽取了50个样本,若样本数据x1,x2,⋯,x50的方差为8,则数据3x1−1,3x2−1,⋯,3x50−1的方差为___________.答案:72分析:根据方差的性质可得答案.样本数据x1,x2,⋯,x50的方差为8,所以数据3x1−1,3x2−1,⋯,3x50−1的方差为32×8=72.所以答案是:72.13、某学校组织学生参加数学测试,成绩的频率分布直方图如下,数据的分组依次是[20,40),[40,60),[60,80),[80,100],则可估计这次数学测试成绩的第40百分位数是_________.答案:65分析:利用百分位数的定义求解.解:成绩在[20,60)的频率是(0.005+0.01)×20=0.3,成绩在[20,80)的频率为0.3+0.02×20=0.7,所以第40百分位数一定在[60,80)内,×20=65,所以这次数学测试成绩的第40百分位数是60+0.4−0.30.4所以答案是:65。
人教高中数学必修二B版《统计》统计与概率说课复习(数据的收集)
(6)抽样调查:只抽取样本进行考察的方法称为抽样调查.
2.样本与样本容量有何区别?
提示:样本与样本容量是两个不同的概念,样本是从总体中抽出
的个体,是对象;样本容量是样本中包含的个体数目,是一个数.
课前篇自主预习
一
二
三
3.做一做:为了了解高一年级1 000名学生的考试成绩,从中随机
取一个容量为6的样本进行质量检验.如何用随机数表法设计抽样
方案?
解:第一步,将元件的编号调整为010,011,…,099,100,…,600.
第二步,在随机数表中任选一个行数作为开始,任选一方向作为
读数方向.
第三步,从选定的数开始读数,每次读取三位,凡不在010~600内的
数跳过去不读,前面已经出现的数也不读,依次可得到6个数.
课堂篇探究学习探究一探究二探究三探究四
思维辨析
当堂检测
反思感悟1.使用分层抽样的前提
分层抽样的适用前提条件是总体可以分层、层与层之间有明显
区别,而层内个体间差异较小.
2.使用分层抽样应遵循的原则
(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体
互不交叉,即遵循不重复、不遗漏的原则;
(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简
定义:一般地,如果相对于要考察的问题来说,总体可以分成有明
显差别的、互不重叠的几部分时,每一部分都可称为层,在各层中
按层在总体中所占比例进行随机抽样的方法称为分层随机抽样(简
称为分层抽样).
2.分层抽样有什么特点?
提示:(1)分层抽样适用于已知总体是由差异明显的几部分组成的;
(2)分成的各层互不交叉;
探究四
人教B版高中数学必修二课件 《统计》统计与概率PPT(数据的数字特征)
3.做一做:某学员在一次射击测试中射靶10次,命中环数如下:
7,8,7,9,5,4,9,10,7,4.
则:(1)平均命中环数为
;
(2)命中环数的标准差为
.
答案:(1)7 (2)2
7+8+7+9+5+4+9+10+7+4
解析:(1) =
=7.
10
1
(2)∵s2= 10
[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(107)2+(7-7)2+(4-7)2]=4,∴s=2.
探究四
当堂检测
1
解:(1)甲 = ×(99+100+98+100+100+103)=100,
1
6
乙 = ×(99+100+102+99+100+100)=100,
6
1
2
甲
= 6×[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(1007
2
2
100) +(103-100) ]= ,
则没有众数.
课堂篇探究学习
探究一
探究二
探究三
探究四
当堂检测
延伸探究求出变式训练1中数据的众数与中位数.
解:众数为24与30.
1
中位数为×(22+24)=23.
2
课堂篇探究学习
探究一
探究二
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章统计
一、三种抽样方法
1、统计的的基本思想是:用样本的某个量去估计总体的某个量
总体:在统计中,所有考察对象的全体。
个体:总体中的每一个考察对象。
样本:从总体中抽取的一部分个体叫做这个总体的一个样本。
样本容量:样本中个体的数目。
2、抽样方法:要求:总体中每个个体被抽取的机会相等
(1)简单随机抽样:抽签法和随机数表法
简单随机抽样的特点是:不放回、等可能.
抽签法步骤
(1)先将总体中的所有个体(共有N个)编号(号码可从1到N)
(2)把号码写在形状、大小相同的号签上,号签可用小球、卡片、纸条等制作
(3)将这些号签放在同一个箱子里,进行均匀搅拌(4)抽签时,每次从中抽出一个号签,连续抽取n次(5)抽出样本
随机数表法步骤
(1)将总体中的个体编号(编号时位数要统一);(2)选定开始的数字;(3)按照一定的规则读取号码;(4)取出样本
(2)系统抽样
系统抽样特点:容量大、等距、等可能.
步骤:
1.编号,随机剔除多余个体,重新编号
2.分组 (段数等于样本容量),确定间隔长度 k=N/n
3.抽取第一个个体编号为i
4.依预定的规则抽取余下的个体编号为i+k, i+2k, …
(3)分层抽样
分层抽样特点:总体差异明显、按所占比例抽取、等可能.
步骤:1.将总体按一定标准分层;
2.计算各层的个体数与总体的个体数的比;
3.按比例确定各层应抽取的样本数目
4.在每一层进行抽样 (可用简单随机抽样或系统抽样)
二、用样本估计总体
1、用样本的频率分布估计总体的分布
①作样本频率分布直方图的步骤:
(1)求极差;
(2)决定组距与组数; (组数=极差/组距)
(3)将数据分组;
(4)列频率分布表(分组,频数,频率);
(5)画频率分布直方图。
根据频率分布表做频率分布直方图应注意两点: ⑴纵轴的意义:组距
频率 ⑵横轴的意义:样本内容(每个矩形下面是组距).
例1、为了了解中学生的身高情况,对育才中学同龄的50名男学生的身高进行了测量,结果如下:(单位:cm ) 175 168 180 176 167 181 162 173 171 177
171 171 174 173 174 175 177 166 163 160
166 166 163 169 174 165 175 165 170 158
174 172 166 172 167 172 175 161 173 167
170 172 165 157 172 173 166 177 169 181
列出样本的频率分布表,画出频率分布直方图.
解:在这个样本中,最大值为181,最小值为157,它们的差是24,可以取组距为4,分成7组,根据题意列出样本的频率分布表如下:
频率分布直方图(略) 分组
频数 频率 156.5~160.5
3 0.06 160.5~164.5
4 0.08 164.5~168.5
12 0.24 168.5~172.5
12 0.24 172.5~176.5
13 0.26 176.5~180.5
4 0.08 180.5~184.5
2 0.04 合计 50 1.00
②茎叶图作图步骤:
1.将每个数据分为茎(高位)和叶(低位)两部分.
2.将最小茎和最大茎之间的数按大小顺序排成一列,写在左(右)侧;
3.将各个数据的叶按大小次序写在其右(左)侧.
例、某中学高二(2)班甲、乙两名同学自高中以来每场数学考试成绩如下:
甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107;
乙的得分:83,86,93,99,88,130,98,114,98,79,101.
画出两人数学成绩茎叶图,请根据茎叶图对两人的成绩进行比较.
解:甲、乙两人数学成绩的茎叶图如下图:
甲乙
5 6
5 6 1 7 9
8 9 6 1 8 6 3 8
4 1
5 9 3 9 8 8
7 10 3 1
0 11 4
从这个茎叶图上可看出,乙同学的得分情况是大致对称的,中位数是99;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是89.因此乙同学发挥比较稳定,总体得分情况比甲同学好.
2、用样本的数据特征估计总体的数据特征
(1)、在频率直方图中计算众数、平均数、中位数
众数:在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。
中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等 平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和
(2)、标准差和方差:描述了数据的波动范围,离散程度 标准差222121[()()()]n s x x x x x x n =
-+-+- 方差2222121[()()()]n s x x x x x x n
=
-+-+-
扩展: 1212,,,,,,,.n n x x x x mx a mx a mx a mx a ⋅⋅⋅++⋅⋅⋅++①若的平均数为则的平均数为 2221212,,,,,,,.n n x x x s ax b ax b ax b a s ⋅⋅⋅++⋅⋅⋅+②若的方差为则的方差为
3.两变量之间的关系
(1)相关关系——非确定性关系
(2)函数关系——确定性关系
4.回归直线方程:∧∧∧+=a x b y
⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∧∧====∧∑∑∑∑x b y a x n x y
x n y x x x y y x x b n i i n i i i n i i n i i i ,)())((1221
121
(),.x y 说明:回归直线过定点
例如:
5. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。
其基本步骤是:①画出两个变量的散点图;
②求回归直线方程;
③并用回归直线方程进行预报。