(完整版)高中数学必修2《统计》知识点讲义

合集下载

高中数学必修二第九章统计考点总结(带答案)

高中数学必修二第九章统计考点总结(带答案)

高中数学必修二第九章统计考点总结单选题1、为了鼓励学生积极锻炼身体,强健体魄,某学校决定每学期对体育成绩在年级前100名的学生给予专项奖励.已知该校高三年级共有500名学生,如图是该年级学生本学期体育测试成绩的频率分布直方图.据此估计,能够获得该项奖励的高三学生的最低分数为()A.89B.88C.87D.86答案:B分析:根据题意确定出前100名的频率,进而判断出第100名的区间,然后根据频率求出答案.由题意,100500=0.2,[90,95)的频率为:0.02×5=0.1,[85,90)的频率为:0.05×5=0.25,则0.1<0.2<0.25,则第100名在[85,90)中,设分数为x,[x,90)的频率为:0.2−0.1=0.1,所以90−x5=0.2−0.10.25=0.10.25=25⇒x=88.故选:B.2、2021年3月,树人中学组织三个年级的学生进行“庆祝中国共产党成立100周年”党史知识竞赛.经统计,得到前200名学生分布的饼状图(如图)和前200名中高一学生排名分布的频率条形图(如图),则下列命题错误..的是()A.成绩前200名的200人中,高一人数比高二人数多30人B.成绩第1-100名的100人中,高一人数不超过一半C.成绩第1-50名的50人中,高三最多有32人D.成绩第51-100名的50人中,高二人数比高一的多答案:D分析:根据饼状图和条形图提供的数据判断.由饼状图,成绩前200名的200人中,高一人数比高二人数多200×(45%−30%)=30,A正确;=45<50,由条形图知高一学生在前200名中,前100和后100人数相等,因此高一人数为200×45%×12B正确;成绩第1-50名的50人中,高一人数为200×45%×0.2=18,因此高三最多有32人,C正确;第51-100名的50人中,高二人数不确定,无法比较,D错误.故选:D.3、下面的四个问题中,可以用抽样调查方法的是()A.检验10件产品的质量B.银行对公司10万元存款的现钞的真假检验C.跳伞运动员检查20个伞包及伞的质量D.检验一批汽车的防碰撞性能答案:D分析:根据抽样与普查的概念,分析即可得答案.根据抽样与普查的概念可得,A、B、C一般采用普查方法,需逐一检验,D采用抽样调查的方法.故选:D4、国家高度重视青少年视力健康问题,指出要“共同呵护好孩子的眼睛,让他们拥有一个光明的未来”.某校为了调查学生的视力健康状况,决定从每班随机抽取5名学生进行调查.若某班有50名学生,将每一学生从01到50编号,从下面所给的随机数表的第2行第4列的数开始,每次从左向右选取两个数字,则选取的第三个号码为()随机数表如下:015432876595428753467953258657413369832445977386524435786241A.13B.24C.33D.36答案:D分析:随机数表进行读数时,确定开始的位置以及位数,逐一往后即可,遇到超出范围或重复的数字跳过即可.根据随机数表的读取方法,第2行第4列的数为3,每次从左向右选取两个数字,所以第一组数字为32,作为第一个号码;第二组数字58,舍去;第三组数字65,舍去;第四组数字74,舍去;第五组数字13,作为第二个号码;第六组数字36,作为第三个号码,所以选取的第三个号码为36故选:D5、某汽车制造厂分别从A,B两类轮胎中各随机抽取了6个进行测试,下面列出了每一个轮胎行驶的最远里程(单位:103km).A类轮胎:94,96,99,99,105,107.B类轮胎:95,95,98,99,104,109.根据以上数据,下列说法正确的是()A.A类轮胎行驶的最远里程的众数小于B类轮胎行驶的最远里程的众数B.A类轮胎行驶的最远里程的极差等于B类轮胎行驶的最远里程的极差C.A类轮胎行驶的最远里程的平均数大于B类轮胎行驶的最远里程的平均数D.A类轮胎的性能更加稳定答案:D分析:根据众数、极差、平均数和方差的定义以及计算公式即可求解.解:对A:A类轮胎行驶的最远里程的众数为99,B类轮胎行驶的最远里程的众数为95,选项A错误;对B:A类轮胎行驶的最远里程的极差为13,B类轮胎行驶的最远里程的极差为14,选项B错误.对C:A类轮胎行驶的最远里程的平均数为100+−6−4−1−1+5+76=100,B类轮胎行驶的最远里程的平均数为100+−5−5−2−1+4+96=100,选项C错误.对D:A类轮胎行驶的最远里程的方差为(94−100)2+(96−100)2+(99−100)2×2+(105−100)2+(107−100)26=643,B类轮胎行驶的最远里程的方差为(95−100)2×2+(98−100)2+(99−100)2+(104−100)2+(109−100)26=763>643,故A类轮胎的性能更加稳定,选项D正确.故选:D.6、已知一个样本容量为7的样本的平均数为5,方差为2,现样本加入新数据4,5,6,此时样本容量为10,若此时平均数为x,方差为s2,则()A.x=5,s2=2B.x=5,s2=1.6C.x=4.9,s2=1.6D.x=5.1,s2=2答案:B分析:设这10个数据分别为:x1,x2,⋯,x7,x8=4,x9=5,x10=6,进而根据题意求出x1+x2+⋯+x7和(x1−5)2+(x2−5)2+⋯+(x7−5)2,进而再根据平均数和方差的定义求得答案.设这10个数据分别为:x1,x2,⋯,x7,x8=4,x9=5,x10=6,根据题意x1+x2+⋯+x77=5⇒x1+x2+⋯+x7=35,(x1−5)2+(x2−5)2+⋯+(x7−5)27=2⇒(x1−5)2+(x2−5)2+⋯+(x7−5)2=14,所以x=x1+x2+⋯+x1010=35+4+5+610=5,s2=(x1−5)2+(x2−5)2+⋯+(x10−5)210=14+(4−5)2+(5−5)2+⋯+(6−5)210=1.6.故选:B.7、有甲、乙两种水稻,测得每种水稻各10株的分蘖数据,计算出样本均值E(X甲)=E(X乙),方差分别为D(X甲)=11,D(X乙)=3.4.由此可以估计()A.甲种水稻比乙种水稻分蘖整齐B.乙种水稻比甲种水稻分蘖整齐C.甲、乙两种水稻分蘖整齐程度相同D.甲、乙两种水稻分蘖整齐程度不能比较答案:B分析:可以用样本的方差估计总体的方差,方差越小,分蘖越整齐.解:已知样本方差:D(X乙)=3.4,D(X甲)=11由此估计,乙种水稻的方差约为3.4,甲种水稻的方差约为11.因为3.4<11所以乙种水稻比甲种水稻分蘖整齐故选:B.8、2021年3月12日是全国第43个植树节,为提高大家爱劳动的意识,某中学组织开展植树活动,并收集了高三年级1~11班植树量的数据(单位:棵),绘制了下面的折线图.根据折线图,下列结论不正确的是()A.各班植树的棵数不是逐班增加的B.4班植树的棵数低于11个班的平均值C.各班植树棵数的中位数为6班对应的植树棵数D.1至5班植树的棵数相对于6至11班,波动更小,变化比较平稳答案:C分析:从图中直接观察可以判定AD正确,结合平均数的定义,将比4班多的里面取出部分补到比4班少的班中,可以使得4班的植树量最少,从而判定B正确;结合中位数的定义可以判定C错误.从图可知,2班的植树量少于1班,8班的植树量少于7班,故A正确;4班的指数棵数为10,11个班中只有2、3、8班三个的植树棵数少于10,且大于5棵,其余7个班的植树棵数都超过10棵,且有6、7、9、10、11班五个班的植树棵数都不少于15棵,将这五个班中的植树棵数各取出5棵,加到2、3、8班中取,除4班外,其余各班的植树棵数都超过了4班,所以4班植树的棵数低于11个班的平均值,故B正确;比6班植树多的只有9、10、11三个班,其余七个班都比6班少,故6班所对应的植树棵数不是中位数,故C是错误的;1到5班的植树棵数的极差在10以内,6到11班的植树棵数的极差超过了15,另外从图明显看出,1至5班植树的棵数相对于6至11班,波动更小,变化比较平稳,故D正确;综上,不正确的只有C,故选:C.小提示:本题考查频数折线图的意义,涉及平均数,中位数,波动大小的判定,难点是平均数的估算,这里采用取长补短法进行估算,可以避免数字的计算.多选题9、PM2.5的监测值是用来评价环境空气质量的指标之一.划分等级为PM2.5日均值在35μg/m3以下,空气质量为一级,在35~75μg/m3,空气质量为二级,超过75μg/m3为超标.如图是某地12月1日至10日PM2.5的日均值(单位:μg/m3),则下列说法正确的是()A.这10天PM2.5日均值的80%分位数为60B.从PM2.5日均值看,前5天的日均值的极差小于后5天的日均值的极差C.从PM2.5日均值看,前5天的日均值的方差小于后5天日均值的方差D.这10天中PM2.5日均值的平均值是50答案:BC分析:A由百分位数的定义求80%分位数;B、C求出前后5天的极差、方差判断;C由平均值求法求10天中PM2.5日均值的平均值即可.由图知:PM2.5从小到大为30,32,34,40,41,45,48,60,78,80,而10×80%=8,所以80%分位数为60+782=69,A错误;日均值的平均值30+32+34+40+41+45+48+60+78+8010=48.8,D错误;前5天极差为41−30=11,后5天极差为80−45=35,B正确;前5天平均值为30+32+34+40+415=35.4,后5天平均值为45+48+60+78+805=62.2,所以前5天的日均值的方差15∑(x i−35.4)25i=1=19.04,后5天日均值的方差15∑(x i−62.2)210i=6=213.76,C正确;故选:BC10、2021年7月28日扬州发生了新冠疫情,下面图表记录的是7.28-8.23扬州每日新增病例数,从图表中我们能得到哪些正确信息()A.从7.28-8.23扬州每日新增病例数最少0人,最多58人;B.从7.28-8.23扬州每日新增病例数多于41人的有3天;C.从7.28-8.5每日新增病例数逐日递增;D.从8.7-8.12每日新增病例数先逐日递增后逐日递减答案:AD分析:观察折线图得到选项AD正确;B. 从7.28-8.23扬州每日新增病例数多于41人的有4天,所以该选项错误;C. 从7.28-8.5每日新增病例数是先增后减再增,所以该选项错误;解:A. 从7.28-8.23扬州每日新增病例数8.22和8.23最少0人,8.5最多58人,所以该选项正确;B. 从7.28-8.23扬州每日新增病例数多于41人的有4天,它们是8.5、8.6、8.9和8.10,所以该选项错误;C. 从7.28-8.5每日新增病例数不是逐日递增,而是先增后减再增,所以该选项错误;D. 从8.7-8.12每日新增病例数先逐日递增后逐日递减,所以该选项正确.故选:AD11、某市教育局为了解疫情时期网络教学期间的学生学习情况,从该市随机抽取了1000名高中学生,对他们每天的平均学习时间进行问卷调查,根据所得信息制作了如图所示的频率分布直方图,则()A.这1000名高中学生每天的平均学习时间为6~8小时的人数有100人B.估计该市高中学生每天的平均学习时间的众数为9小时C.估计该市高中学生每天的平均学习时间的60%分位数为9.2小时D.估计该市高中学生每天的平均学习时间的平均值为8.6小时答案:BCD分析:对于A:直接利用频率分布直方图的数据进行计算,即可判断;对于B:根据众数的定义进行判断;对于C:直接利用频率分布直方图的数据进行计算,即可判断;对于D:直接利用频率分布直方图的数据,按照平均数的定义进行计算,即可判断.对于A:从频率分布直方图,可以得到0.10×2×1000=200,即这1000名高中学生每天的平均学习时间为6~8小时的人数有200人,故A错误;对于B:由频率分布直方图可以得到,抽查的1000名高中学生每天的平均学习时间的众数为9小时,由此可以估计该市高中学生每天的平均学习时间的众数为9小时,故B正确;对于C:由频率分布直方图可以得到,设抽查的1000名高中学生每天的平均学习时间的60%分位数为k小时,则有:0.05×2+0.01×2+0.25×(k−8)=0.6,解得:k=9.2,即抽查的1000名高中学生每天的平均学习时间的60%分位数为9.2小时,由此可以估计该市高中学生每天的平均学习时间的60%分位数为9.2小时,故C正确;对于D:由频率分布直方图可以得到,抽查的1000名高中学生每天的平均学习时间的平均值为0.05×2×5+ 0.10×2×7+0.25×2×9+0.10×2×11=8.6小时,由此可以估计该市高中学生平均学习时间的平均值为8.6小时,故D正确;故选:BCD填空题12、某医院有职工200人,每人到超市或市场购物约有25次,为调查职工戴口罩购物的次数,随机抽取了40名职工进行调查,得到这个月职工戴口罩购物次数的频率直方图,则该医院职工戴口罩购物次数不低于15的人数约为_______________.答案:60分析:先计算出购物次数不低于15的人数对应的频率,从而求得购物次数不低于15的人数.根据频率直方图知医院职工戴口罩购物次数不低于15的频率为0.01×5+0.05×5=0 .3,医院职工总数为200,所以该医院职工戴口罩购物次数不低于15的人数为200×0.3=60.所以答案是:6013、某公司青年、中年、老年员工的人数之比为10∶8∶7,从中抽取100名作为样本,若每人被抽中的概率是0.2,则该公司青年员工的人数为__________.答案:200分析:先根据分层抽样的方法计算出该单位青年职工应抽取的人数,进而算出青年职工的总人数.由题意,从中抽取100名员工作为样本,需要从该单位青年职工中抽取10×100=40(人).因为每人被10+8+7抽中的概率是0.2,所以青年职工共有400.2=200(人).所以答案是:200.14、某校为了解学生的课外阅读情况﹐随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,该调查中,得到的数据为______.(填“观测数据”或“实验数据”) 答案:观测数据.分析:根据数据收集的方式,结合观测数据和实验数据的定义,即可求解.由题意,从课外阅读的学生中﹐随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,这个数据为观测数据. 所以答案是:观测数据. 解答题15、中秋佳节来临之际,小李准备销售一种农特产,这段时间内,每售出1箱该特产获利50元,未售出的,每箱亏损30元.经调查,市场需求量的频率分布直方图如图所示.小李购进了160箱该特产,以x (单位:箱,100≤x ≤200)表示市场需求量,y (单位:元)表示经销该特产的利润.(1)根据频率分布直方图估计市场需求量的众数和平均数; (2)将y 表示为x 的函数;(3)根据频率分布直方图求利润不少于4800元的频率. 答案:(1)150,153(2)y ={80x −4800,100≤x <1608000,160≤x ≤200(3)0.9分析:(1)由频率分布直方图,市场需求量的平均数为每组中间值乘以每组的纵坐标求和可得答案;(2)由利润和销售量的关系可得答案;(3)利润不少于4800元得到x的范围可得答案.(1)由频率分布直方图,得市场需求量的众数的估计值是150,需求量为[100,120)的频率为0.005×20=0.1,需求量为[120,140)的频率为0.01×20=0.2,需求量为[140,160)的频率为0.015×20=0.3,需求量为[160,180)的频率为0.0125×20=0.25,需求量为[180,200]的频率为0.0075×20=0.15,则市场需求量的平均数约为110×0.1+130×0.2+150×0.3+170×0.25+190×0.15=153.(2)因为每售出1箱该特产获利50元,未售出的,每箱亏损30元,所以当100≤x<160时,y=50x−30×(160−x)=80x−4800,当160≤x≤200时,y=160×50=8000,所以y={80x−4800,100≤x<160 8000,160≤x≤200.(3)当100≤x<160时,由80x−4800≥4800,得120≤x<160;当160≤x≤200时,y=8000>4800,所以当120≤x≤200时,利润不少于4800元,所以由(1)知利润不少于4800元的频率为1−0.1=0.9.。

(完整版)高中数学必修2《统计》知识点讲义.docx

(完整版)高中数学必修2《统计》知识点讲义.docx

第二章统计一、三种抽样方法1、的的基本思想是:用本的某个量去估体的某个量体:在中,所有考察象的全体。

个体:体中的每一个考察象。

本:从体中抽取的一部分个体叫做个体的一个本。

本容量:本中个体的数目。

2、抽方法:要求:体中每个个体被抽取的机会相等(1)随机抽:抽法和随机数表法随机抽的特点是:不放回、等可能.抽法步( 1)先将体中的所有个体(共有N 个)号(号可从 1 到 N)( 2)把号写在形状、大小相同的号上,号可用小球、卡片、条等制作( 3)将些号放在同一个箱子里,行均匀拌(4)抽,每次从中抽出一个号,抽取n 次(5)抽出本随机数表法步(1)将体中的个体号 ( 号位数要一 ) ;( 2)定开始的数字;( 3)按照一定的取号;( 4)取出本(2)系抽系抽特点:容量大、等距、等可能.步 :1.号 , 随机剔除多余个体 , 重新号2.分 ( 段数等于本容量 ), 确定隔度 k=N/n3.抽取第一个个体号 i4. 依定的抽取余下的个体号i+k, i +2k, ⋯(3)分抽分抽特点:体差异明、按所占比例抽取、等可能.步: 1. 将体按一定准分 ;2.算各的个体数与体的个体数的比;3.按比例确定各抽取的本数目4.在每一行抽 ( 可用随机抽或系抽 )二、用样本估计总体1、用样本的频率分布估计总体的分布①作样本频率分布直方图的步骤:(1)求极差;(2)决定组距与组数 ; ( 组数=极差 / 组距 )(3)将数据分组;(4)列频率分布表(分组,频数,频率);(5)画频率分布直方图。

根据频率分布表做频率分布直方图应注意两点:频率⑴纵轴的意义:组距⑵横轴的意义:样本内容(每个矩形下面是组距).例 1、为了了解中学生的身高情况, 对育才中学同龄的50名男学生的身高进行了测量, 结果如下:(单位: cm)175168180176167181162173171177171171174173174175177166163160166166163169174165175165170158174172166172167172175161173167170172165157172173166177169181列出样本的频率分布表, 画出频率分布直方图.解:在这个样本中, 最大值为 181, 最小值为 157, 它们的差是24, 可以取组距为4, 分成 7 组 , 根据题意列出样本的频率分布表如下:分组频数频率156.5 ~ 160.530.06160.5 ~ 164.540.08164.5 ~ 168.5120.24168.5 ~ 172.5120.24172.5 ~ 176.5130.26176.5 ~ 180.540.08180.5 ~ 184.520.04合计50 1.00频率分布直方图( 略 )②茎叶图作图步骤:1.将每个数据分为茎 ( 高位 ) 和叶 ( 低位 ) 两部分 .2. 将最小茎和最大茎之间的数按大小顺序排成一列, 写在左 ( 右 ) 侧;3.将各个数据的叶按大小次序写在其右( 左 ) 侧.例、某中学高二(2) 班甲、乙两名同学自高中以来每场数学考试成绩如下:甲的得分: 95,81,75,91,86,89,71,65,76,88,94,110,107;乙的得分: 83,86,93,99,88,130,98,114,98,79,101.画出两人数学成绩茎叶图, 请根据茎叶图对两人的成绩进行比较.解:甲、乙两人数学成绩的茎叶图如下图:甲乙565 6 1 798 9 6 1 8 6 3 84 15 9 3 9 8 87 10 310 114从这个茎叶图上可看出, 乙同学的得分情况是大致对称的, 中位数是99;甲同学的得分情况除一个特殊得分外,也大致对称, 中位数是89. 因此乙同学发挥比较稳定, 总体得分情况比甲同学好.2、用样本的数据特征估计总体的数据特征( 1)、在频率直方图中计算众数、平均数、中位数众数:在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。

新教材苏教版高中数学必修第二册第14章统计 知识点考点重点难点解题规律归纳总结

新教材苏教版高中数学必修第二册第14章统计 知识点考点重点难点解题规律归纳总结

第14章统计14.1获取数据的基本途径及相关概念....................................................................... - 1 -14.2抽样 ...................................................................................................................... - 3 -14.2.1简单随机抽样............................................................................................ - 3 -14.2.2分层抽样 ................................................................................................... - 7 -14.3统计图表 ............................................................................................................ - 11 -14.3.1扇形统计图、折线统计图、频数直方图.............................................. - 11 -14.3.2频率直方图 ............................................................................................. - 15 -14.4用样本估计总体................................................................................................. - 19 -14.4.1用样本估计总体的集中趋势参数.......................................................... - 19 -14.4.2用样本估计总体的离散程度参数.......................................................... - 22 -14.4.3用频率直方图估计总体分布.................................................................. - 22 -14.4.4百分位数 ................................................................................................. - 28 -14.1获取数据的基本途径及相关概念知识点1获取数据的基本途径获取数据的基本途径适用类型注意问题通过调查获取数据对于有限总体问题,我们一般通过抽样调查或普查的方法获取数据要充分有效地利用背景信息选择或创建更好的抽样方法,并有效地避免抽样过程中的人为错误通过试验获取数据没有现存的数据可以查询严格控制试验环境,通过精心的设计安排试验,以提高数据质量通过观察获取数据自然现象要通过长久的持续观察获取数据通过查询获取数据众多专家研究过,其收集的数据有所存储必须根据问题背景知识“清洗”数据,去伪存真(1)利用统计报表和年鉴属于哪种获取数据的途径?(2)要了解一种新型灯管的寿命,能通过观察获取数据吗?[提示](1)属于通过查询获取数据的途径.(2)不能,应该通过试验获取数据.知识点2总体、个体、样本、样本容量的概念一般地,在获取数据时,我们把所考察对象(某一项指标的数据)的全体叫作总体,把组成总体的每一个考察对象叫作个体,从总体中所抽取的一部分个体叫作总体的一个样本,样本中个体的数目叫作样本容量.知识点3统计分析的基本步骤和基本思想(1)统计分析的基本步骤获取数据↓分析数据↓作出估计(2)统计分析的基本思想:抽取具有较好代表性的样本,由样本数据的特征、规律估计总体的状况.重点题型类型1获取数据途径的选择【例1】(1)下列数据一般是通过试验获取的是()A.2019年南京市的降雨量B.2019年新生儿人口数量C.某学校高一年级同学的数学测试成绩D.某种特效中成药的配方(2)“中国天眼”为500米口径球面射电望远镜(Five hundred meters Aperture Spherical Telescope,简称FAST),是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是()A.通过调查获取数据B.通过试验获取数据C.通过观察获取数据D.通过查询获得数据(1)D(2)C[(1)某种特效中成药的配方的数据只能通过试验获得.(2)“中国天眼”主要是通过观察获取数据.]选择获取数据途径的依据选择获取数据的途径主要是根据所要研究问题的类型,以及获取数据的难易程度.有的数据可以有多种途径获取,有的数据只能通过一种途径获取,选择合适的方法和途径能够更好地提高数据的可靠性.类型2获取数据途径的方法的设计【例2】为了缓解城市的交通拥堵情况,某市准备出台限制私家车的政策,为此要进行民意调查.某个调查小组调查了一些拥有私家车的市民,你认为这样的调查结果能很好地反映该市市民的意愿吗?[解](1)一个城市的交通状况的好坏将直接影响着生活在这个城市中的每个人,关系到每个人的利益.为了调查这个问题,在抽样时应当关注到各种人群,既要抽到拥有私家车的市民,也要抽到没有私家车的市民.(2)调查时,如果只对拥有私家车的市民进行调查,结果一定是片面的,不能代表所有市民的意愿.因此,在调查时,要对生活在该城市的所有市民进行随机地抽样调查,不要只关注到拥有私家车的市民.在统计活动中,尤其是大型的统计活动,为避免一些外界因素的干扰,通常需要确定调查的对象、调查的方法与策略,需要精心设计前期的准备工作和收集数据的方法,然后对数据进行分析,得出统计推断.14.2抽样14.2.1简单随机抽样知识点1简单随机抽样(1)简单随机抽样的概念一般地,从个体数为N的总体中逐步不放回地取出n个个体作为样本(n<N),如果每个个体都有相同的机会被取到,那么这样的抽样方法称为简单随机抽样.(2)常用的简单随机抽样方法有抽签法和随机数表法.知识点2抽签法抽取样本的步骤(1)将总体中的N个个体编号;(2)将这N个号码写在形状、大小相同的号签上;(3)将号签放在同一箱中,并搅拌均匀;(4)从箱中每次抽出1个号签,连续抽取k次;(5)将总体中与抽到的号签的编号一致的k个个体取出.采用抽签法抽取样本时,为什么将编号写在外观、质地等无差别的小纸片(也可以使用卡片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌?[提示]为了使每个号签被抽取的可能性相等,保证抽样的公平性.知识点3随机数表法抽取样本的步骤(1)对总体中的个体编号(每个号码位数一致);(2)在随机数表中任选一个数;(3)从选定的数开始按一定的方向读下去,若得到的号码在编号中,则取出;若得到的号码不在编号中或前面已经取出,则跳过,如此继续下去,直到取满为止;(4)根据选定的号码抽取样本.重点题型类型1简单随机抽样的判断【例1】下列5个抽样中,简单随机抽样的个数是()①一儿童从玩具箱的20件玩具中任意拿一件玩,玩后放回再拿一件,连续玩了5件;②仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查;③某班从50名同学中,选出5名数学成绩最优秀的同学代表本班参加数学竞赛;④一彩民选号,从装有33个大小、形状都相同的号签的盒子中无放回地抽出6个号签.A.0 B.1 C.2 D.3B[根据简单随机抽样的特点逐个判断.①不是简单随机抽样.因为一儿童从玩具箱的20件玩具中任意拿一件玩,玩后放回再拿一件,连续玩了5件它不是“逐个”抽取.②不是简单随机抽样.虽然“一次性抽取”和“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”.③不是简单随机抽样.因为5名同学是从中挑出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“等可能抽样”的要求.④是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,等可能的抽样.综上,只有④是简单随机抽样.]简单随机抽样必须具备的特点(1)被抽取样本的总体中的个体数N是有限的;(2)抽取的样本是从总体中逐个抽取的;(3)简单随机抽样是一种等可能的抽样.如果三个特征有一个不满足,就不是简单随机抽样.类型2抽签法的应用【例2】从20架钢琴中抽取5架进行质量检查,请用抽签法确定这5架钢琴.[解]第一步,将20架钢琴编号,号码是01,02, (20)第二步,将号码分别写在外观、质地等无差别的小纸片上作为号签.第三步,将小纸片放入一个不透明的盒里,充分搅匀.第四步,从盒中不放回地逐个抽取5个号签,使与号签上编号相同的钢琴进入样本.1.一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是个体之间差异不明显.2.应用抽签法时应注意的问题:(1)编号时,如果已有编号可不必重新编号;(2)号签要求大小、形状完全相同;(3)号签要均匀搅拌;(4)根据实际需要采用有放回或无放回抽取.类型3随机数表法及其综合应用【例3】某市质监局要检查某公司某个时间段生产的500克袋装牛奶的质量是否达标,现从500袋牛奶中抽取10袋进行检验.(1)利用随机数表法抽取样本时,应如何操作?(2)如果用随机试验生成部分随机数如下所示,据此写出应抽取的袋装牛奶的编号.162,277,943,949,545,354,821,737,932,354,873,520,964,384,263,491,648,642,175, 331,572,455,068,877,047,447,672,172,065,025,834,216,337,663,013,785,916,955,567, 199,810,507,175,128,673,580,667.(3)质监局对该公司生产的袋装牛奶检验的质量指标有两个:一是每袋牛奶的质量满足500±5g,二是10袋质量的平均数≥500g,同时满足这两个指标,才认为公司生产的牛奶为合格,否则为不合格.经过检测得到10袋袋装牛奶的质量(单位:g)为:502,500,499,497,503,499,501,500,498,499.计算这个样本的平均数,并按照以上标准判断牛奶质量是否合格.[解](1)第一步,将500袋牛奶编号为001,002, (500)第二步,用随机数工具产生001~500范围内的随机数.第三步,把产生的随机数作为抽中的编号,使编号对应的袋装牛奶进入样本.第四步,重复上述过程,直到产生不同的编号等于样本所需要的数量.(2)应抽取的袋装牛奶的编号为:162,277,354,384,263, 491,175,331,455,068.(3)y=502+500+499+497+503+499+501+500+498+49910=499.8<500,所以该公司的牛奶质量不合格.1.该公司对质监局的这种检验方法并不认可,公司自己质检部门抽取了100袋牛奶按照本例(3)检验标准,统计得到这100袋袋装牛奶的质量都满足500±5g,平均数为500.4g,你认为质监局和公司的检验结果哪一个更可靠?为什么?[解]该公司的质检部门的检验结果更可靠.因为质监局抽取的样本较少,不能很好地反映总体,该公司的质检部门抽取的样本量较大,一般来说,样本量大的会好于样本量小的.尤其是样本量不大时,增加样本量可以较好地提高估计的效果.2.为进一步加强公司生产牛奶的质量,规定袋装牛奶的质量变量值为Y i =⎩⎨⎧1,质量不低于500 g 0,质量低于500 g,质监局又抽取了一个容量为50的样本,其质量变量值如下:1 1 1 0 1 1 1 1 0 0 1 0 1 0 1 0 1 0 1 0 1 1 1 1 0 1 0 1 1 1 0 0 0 1 0 1 0 1 0 0 1 0 0 1 0 1 0 1 0 1据此估计该公司生产的袋装牛奶质量不低于500 g 的比例.[解] 由样本观测数据,计算可得样本平均数为y =0.56,据此估计该公司生产的袋装牛奶质量不低于500 g 的比例约为0.56.随机数表法的注意点(1)当总体容量较大,样本容量不大时,可用随机数表法抽取样本.(2)用随机数表法抽取样本,为了方便,在编号时需统一编号的位数.(3)掌握利用信息技术产生随机数的方法和规则.14.2.2 分层抽样知识点 分层抽样(1)分层抽样的概念当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几个部分,然后按各部分在总体中所占的比实施抽样,这样的抽样方法叫作分层抽样,所分成的各个部分称为层.分层抽样的总体具有什么特性?[提示] 分层抽样的总体按一个或多个变量划分成若干个子总体,并且每一个个体属于且仅属于一个子总体.(2)分层抽样的步骤①将总体按一定标准分层;②计算各层的个体数与总体的个体数的比;③按各层的个体数占总体的个体数的比确定各层应抽取的样本容量;④在每一层进行抽样(可用简单随机抽样).重点题型类型1对分层抽样概念的理解【例1】(1)某政府机关在编人员共100人,其中副处级以上干部10人,一般工作人员70人,后勤人员20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列方法最合适的是()A.抽签法B.随机数法C.简单随机抽样D.分层抽样(2)分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层抽样为保证每个个体等可能抽样,必须进行() A.每层等可能抽样B.每层可以不等可能抽样C.所有层按同一抽样比等可能抽样D.所有层抽取的个体数量相同(1)D(2)C[(1)总体由差异明显的三部分构成,应选用分层抽样.(2)保证每个个体等可能的被抽取是三种基本抽样方式的共同特征,为了保证这一点,分层抽样时必须在所有层都按同一抽样比等可能抽取.]1.使用分层抽样的前提分层抽样的总体按一个或多个变量划分成若干个子总体,并且每一个个体属于且仅属于一个子总体,而层内个体间差异较小.2.使用分层抽样应遵循的原则(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.类型2分层抽样的应用【例2】某学校有在职人员160人,其中行政人员有16人,教师有112人,后勤人员有32人.教育部门为了了解在职人员对学校机构改革的意见,要从中抽取一个容量为20的样本,请利用分层抽样的方法抽取,写出抽样过程.分层抽样中各层的样本容量如何确定?[解]第一步,确定抽样比,样本容量与总体容量的比为20160=18.第二步,确定分别从三类人员中抽取的人数,从行政人员中抽取16×18=2(人);从教师中抽取112×18=14(人);从后勤人员中抽取32×18=4(人).第三步,采用简单随机抽样的方法,抽取行政人员2人,教师人员14人,后勤人员4人.第四步,把抽取的个体组合在一起构成所需样本.分层抽样的步骤类型3分层抽样中的计算问题【例3】(1)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查,假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为() A.101 B.808 C.1 212 D.2 012(2)将一个总体分为A,B,C三层,其个体数之比为5∶3∶2.若用分层抽样方法抽取容量为100的样本,则应从C中抽取________个个体.(3)分层抽样中,总体共分为2层,第1层的样本量为20,样本平均数为3,第2层的样本量为30,样本平均数为8,则该样本的平均数为____________.(1)B (2)20 (3)6 [(1)因为甲社区有驾驶员96人,并且在甲社区抽取的驾驶员的人数为12人, 所以四个社区抽取驾驶员的比例为1296=18,所以驾驶员的总人数为(12+21+25+43)÷18=808(人).(2)∵A ,B ,C 三层个体数之比为5∶3∶2,又有总体中每个个体被抽到的概率相等,∴分层抽样应从C 中抽取100×210=20(个)个体.(3)ω=2020+30×3+3020+30×8=6.]在例3(2)中,A ,B ,C 三层的样本的平均数分别为15,30,20,则样本的平均数为________.20.5 [由题意可知样本的平均数为ω=55+3+2×15+35+3+2×30+25+3+2×20=20.5.]进行分层抽样的相关计算时,常用到的2个关系(1)样本容量n 总体的个数N =该层抽取的个体数该层的个体数; (2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.14.3统计图表14.3.1扇形统计图、折线统计图、频数直方图知识点统计图表统计图表主要应用扇形统计图能够直观描述各类数据占总体的比例频数直方图既直观反映分布状况,又可以表现变化趋势折线统计图描述数据随时间的变化趋势重点题型类型1频率分布表和频数直方图的画法【例1】一个农技站为了考察某种大麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.65.8 5.56.0 6.5 5.1 6.5 5.3 5.9 5.5 5.86.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.56.8 6.0 6.3 5.5 5.0 6.3 5.2 6.07.0 6.46.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.77.46.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.65.36.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.05.66.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.75.8 5.37.06.0 6.0 5.9 5.4 6.0 5.2 6.06.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3根据上面的数据列出频率分布表,绘制出频数直方图,并估计在这块试验田里长度在5.75~6.35 cm之间的麦穗所占的百分比.[解](1)计算最大值与最小值的差:7.4-4.0=3.4.(2)决定组距与组数:若取组距为0.3,因为3.40.3≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12.(3)决定分点:使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55.(4)列频率分布表:分组频数频率[3.95,4.25)10.01[4.25,4.55)10.01[4.55,4.85)20.02[4.85,5.15)50.05[5.15,5.45)110.11[5.45,5.75)150.15[5.75,6.05)280.28[6.05,6.35)130.13[6.35,6.65)110.11[6.65,6.95)100.10[6.95,7.25)20.02[7.25,7.55]10.01合计100 1.00(5)绘制频数直方图如图.从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35 cm之间的麦穗约占41%.频率分布表绘制频数直方图应注意的问题(1)在绘制出频率分布表后,绘制频数直方图的关键就是确定小矩形的高.一般地,频数直方图中两坐标轴上的单位长度是不一致的,合理的定高方法是“以一个恰当的单位长度”(没有统一规定),然后以各组的“频数”所占的比例来定高.如我们预先设定以“”为1个单位长度,代表“1”,则若一个组的频数为2,则该小矩形的高就是“”(占两个单位长度),如此类推.(2)数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~100个左右时,应分成5~12组,在频数直方图中,小长方形的高就是频数,各组频数之和等于样本容量.类型2 频数直方图的应用【例2】 为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频数直方图(如图所示).(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?[解] (1)由频数直方图得,各组的频数分别为6,12,54,42,24,12,所以样本容量为150,因此第二小组的频率为126+12+54+42+24+12=0.08.(2)由频数直方图得达标的各组频数分别为54,42,24,12,可估计该校高一年级学生的达标率为54+42+24+12150×100%=88%.频数直方图的性质:因为小矩形的高表示频数,各组频数的和为样本容量,各组的频率=频数/样本容量,即样本容量=频数/相应的频率.类型3 统计图表的综合应用【例3】 如图是根据某市3月1日至3月10日的最低气温(单位:℃)的情况绘制的折线统计图,试根据折线统计图反映的信息,绘制该市3月1日到10日最低气温(单位:℃)的扇形统计图.[解]该城市3月1日至10日的最低气温(单位:℃)情况如下表:日期12345678910最低气温(℃)-3-20-1120-122其中最低气温为-3 ℃的有1天,占10%,最低气温为-2 ℃的有1天,占10%,最低气温为-1℃的有2天,占20%,最低气温为0℃的有2天,占20%,最低气温为1℃的有1天,占10%,最低气温为2℃的有3天,占30%,扇形统计图如图所示.若本例中条件不变,绘制该市3月1日到3月10日最低气温(单位:℃)的频数直方图.[解]该城市3月1日到3月10日的最低气温(单位:℃)情况如下表:日期12345678910最低气温-3-20-1120-122 (℃)其中最低气温为-3 ℃的有1天,最低气温为-2 ℃的有1天,最低气温为-1 ℃的有2天,最低气温为0 ℃的有2天,最低气温为1 ℃的有1天,最低气温为2 ℃的有3天.频数直方图如图所示.折线统计图的读图方法(1)读折线统计图时,首先要看清楚直角坐标系中横、纵坐标表示的意义,其次要明确图中的数量及其单位.(2)在折线统计图中,从折线的上升、下降可分析统计数量的增减变化情况,从陡峭程度上,可分析数据间相对增长、下降的幅度.14.3.2频率直方图知识点1频率直方图把横轴均分成若干段,每一段对应的长度称为组距,然后以此线段为底作矩形,它的高等于该组的频率组距,这样得出一系列的矩形,每个矩形的面积恰好是该组的频率,这些矩形就构成了频率直方图.(1)对数据分组时,组距、组数的确定有没有固定的标准?(2)当样本容量不超过100时,分多少组合适?[提示](1)组距与组数的确定没有固定的标准,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.在确定分组区间的端点,即分点时,应对分点进行适当调整,使分点比数据多一位小数,并确保每个数据均能落在一个区间内,而不是处于区间的端点.(2)组数与样本容量有关,一般地,样本容量越大,分的组数也越多.当样本容量不超过100时,按照数据的多少,常分成5至12组.知识点2频率折线图如果将频率直方图中各个矩形的上底边的中点顺次连接起来,并将两边端点向外延伸半个组距,就得到频率折线图,简称折线图.重点题型类型1频率分布表的制作及应用【例1】(1)容量为20的样本数据,分组的频数如下表:分组[10,20)[20,30)[30,40)[40,50)[50,60)[60,70]频数234542数据落在区间[10,40)的频率为________.(2)已知一个样本数据:2723252729312730323128262729282426272830以2为组距,列出频率分布表.(1)0.45[数据落在区间[10,40)内的频数为9,样本容量为20,所求频率为9 20=0.45.故填0.45.](2)[解]①计算最大值与最小值的差:最大值为32,最小值为23,它们的差为32-23=9.②已知组距为2,决定组数:因为92=4.5,所以组数为5.③决定分点:[22.5,24.5),[24.5,26.5),[26.5,28.5),[28.5,30.5),[30.5,32.5].④列频率分布表如下:分组频数频率[22.5,24.5)20.1[24.5,26.5)30.15[26.5,28.5)80.4[28.5,30.5)40.2[30.5,32.5]30.15合计2011.频率、频数和样本容量的关系为频率=频数样本容量,利用此式可知二求一.2.制作频率分布表的步骤(1)求全距,决定组数与组距,组距=全距组数;(2)分组,通常对组内数值所在区间取左闭右开区间(或左开右闭区间),最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表.提醒:(1)在制作频率分布表时,分组过多或过少都不好.分组过多会给制作频率分布表带来困难,分组过少虽减少了操作,但不能很好地反映总体情况.一般样本容量越大,所分组数应越多.(2)所分的组数应力求“取整”.组数k=全距组距,若k∈Z,则组数为k;否则,组数为大于k的最小整数,这时需适当增大全距,在两端同时增加适当的范围.(3)在决定分点时,应避免将样本中的数据作为分点,常将分点的数值取比样本中的数据多一位小数.类型2频率直方图、折线图的制作与应用【例2】有同一型号的汽车100辆,为了解这种汽车每耗油1 L所行路程的情况,现从中随机抽出10辆在同一条件下进行耗油1 L所行路程试验,得到如下样本数据(单位:km):13.7,12.7,14.4, 13.8,13.3,12.5,13.5,13.6,13.1,13.4,其分组如下:分组频数频率[12.45,12.95)[12.95,13.45)[13.45,13.95)[13.95,14.45]合计10 1.0(1)(2)根据上表,在给定坐标系中画出频率直方图及频率折线图;(3)根据上述图表,估计总体数据落在[12.95,13.95)中的可能性.[解](1)频率分布表如下.分组频数频率[12.45,12.95) 2 0.2 [12.95,13.45) 3 0.3 [13.45,13.95) 4 0.4 [13.95,14.45]1 0.1 合计101.0(2)频率直方图及频率折线图如图.(3)根据上述图表,可知数据落在[12.95,13.95)中的频率为0.3+0.4=0.7,故总体数据落在[12.95,13.95)中的可能性为0.7.1.制作频率直方图的方法步骤 (1)制作频率分布表.(2)建立直角坐标系:把横轴分成若干段,每一段对应一个组的组距,纵轴表示频率组距. (3)画矩形:在横轴上标明各组端点值,以相邻两点间的线段为底,作高等于该组的频率组距的矩形,这样得到一系列矩形,就构成了频率直方图.2.频率折线图的制作步骤 (1)取每个矩形上底边中点. (2)顺次连接各个中点.(3)取值区间两端点需分别向外延伸半个组距,并取此组距上在x 轴上的点与折线的首、尾分别相连.3.解决频率直方图的相关计算 (1)频率组距×组距=频率,即小长方形的高乘以宽即为落在相应区间数据的频率. (2)频数样本容量=频率,此关系式的变形为频数频率=样本容量.提醒:频率直方图中,每个矩形的高为频率组距,面积为对应组的频率.14.4用样本估计总体14.4.1用样本估计总体的集中趋势参数知识点平均数、众数与中位数的定义(1)平均数:一组数据的和除以数据个数所得到的数.把总体中所有数据的算术平均数称为总体的均值.(2)众数:一组数据中出现次数最多的数.(3)中位数:一组数据按照从小到大的顺序排列后,如果数据的个数为奇数,处于正中间位置的数.如果数据的个数是偶数,则取正中间两个数据的平均数.(1)中位数一定是样本数据中的一个数吗?(2)一组数据可以有几个众数?中位数是否也具有相同的结论?[提示](1)不一定.一组数据按大小顺序排列后,如果有奇数个数据,处于中间位置的数是中位数;如果有偶数个数据,则取中间两个数据的平均数是中位数.(2)一组数据中可能有一个众数,也可能有多个众数,中位数只有唯一一个.重点题型类型1平均数、中位数和众数的计算【例1】已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有() A.a>b>c B.a>c>bC.c>a>b D.c>b>aD[由题意得a=110(16+18+15+11+16+18+18+17+15+13)=15710=15.7,中位数为16,众数为18,则b=16,c=18,∴c>b>a.](1)求样本数据的中位数和众数时,把数据按照从小到大的顺序排列后,按照。

高中数学必修二第九章统计基础知识点归纳总结(带答案)

高中数学必修二第九章统计基础知识点归纳总结(带答案)

高中数学必修二第九章统计基础知识点归纳总结单选题1、下列调查所抽取的样本具有代表性的是()A.利用某地七月份的日平均最高气温值估计该地全年的日平均最高气温B.在农村调查市民的平均寿命C.利用一块实验水稻田的产量估计水稻的实际产量D.为了了解一批洗衣粉的质量情况,从仓库中任意抽取100袋进行检验答案:D分析:根据抽取样本要具的广泛性和代表性,抽取的样本必须是随机的,逐个分析判断即可A项中某地七月份的日平均最高气温值不能代表全年的日平均最高气温;B项中在农村调查得到的平均寿命,不具代表性;C项中利用一块实验水稻田的产量估计水稻的实际产量,不具代表性;D项抽取的样本是随机的,具有代表性.故选:D2、为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间答案:C分析:根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元的农户的比率估计值为0.02+0.04=0.06=6%,故A正确;该地农户家庭年收入不低于10.5万元的农户比率估计值为0.04+0.02×3=0.10=10%,故B正确;该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为0.10+0.14+0.20×2=0.64=64%> 50%,故D正确;该地农户家庭年收入的平均值的估计值为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+ 9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),超过6.5万元,故C错误.综上,给出结论中不正确的是C.故选:C.小提示:本题考查利用样本频率直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平均值的×组距.估计值.注意各组的频率等于频率组距3、下列调查方式合适的是().A.为了了解一批头盔的抗压能力,采用普查的方式B.为了了解一批玉米种子的发芽率,采用普查的方式C.为了了解一条河流的水质,采用抽查的方式D.为了了解一个寝室的学生(共5个人)每周体育锻炼的时间,采用抽查的方式答案:C分析:根据抽查和普查的特点,对每个选项进行逐一分析,即可判断和选择.对于选项A,采用普查的方式测试头盔的抗压能力,成本较高,不适合,故A错误;对于选项B,采用普查的方式测试玉米种子的发芽率,较为繁琐且工作量较大,不适合,故B错误;对于选项C,采用抽查的方式了解河流的水质,适合,故C正确;对于选项D,为了了解5个人每周体育锻炼的时间,适合采用普查的方式,故D错误.故选:C.4、2021年3月12日是全国第43个植树节,为提高大家爱劳动的意识,某中学组织开展植树活动,并收集了高三年级1~11班植树量的数据(单位:棵),绘制了下面的折线图.根据折线图,下列结论不正确的是()A.各班植树的棵数不是逐班增加的B.4班植树的棵数低于11个班的平均值C.各班植树棵数的中位数为6班对应的植树棵数D.1至5班植树的棵数相对于6至11班,波动更小,变化比较平稳答案:C分析:从图中直接观察可以判定AD正确,结合平均数的定义,将比4班多的里面取出部分补到比4班少的班中,可以使得4班的植树量最少,从而判定B正确;结合中位数的定义可以判定C错误.从图可知,2班的植树量少于1班,8班的植树量少于7班,故A正确;4班的指数棵数为10,11个班中只有2、3、8班三个的植树棵数少于10,且大于5棵,其余7个班的植树棵数都超过10棵,且有6、7、9、10、11班五个班的植树棵数都不少于15棵,将这五个班中的植树棵数各取出5棵,加到2、3、8班中取,除4班外,其余各班的植树棵数都超过了4班,所以4班植树的棵数低于11个班的平均值,故B正确;比6班植树多的只有9、10、11三个班,其余七个班都比6班少,故6班所对应的植树棵数不是中位数,故C是错误的;1到5班的植树棵数的极差在10以内,6到11班的植树棵数的极差超过了15,另外从图明显看出,1至5班植树的棵数相对于6至11班,波动更小,变化比较平稳,故D正确;综上,不正确的只有C,故选:C.小提示:本题考查频数折线图的意义,涉及平均数,中位数,波动大小的判定,难点是平均数的估算,这里采用取长补短法进行估算,可以避免数字的计算.5、2020年广东12月份天气预报历史记录中1号至8号的数据如表所示,则()C.这8天的最低气温的极差为5°C D.这8天的最低气温的中位数为11.5°C答案:D分析:由极差等于一组数据中的最大值与最小值的差,并根据中位数的定义,求最高、最低气温数据的中位数即可判断各项的正误.=22°C,这8天的最低气温的这8天的最高气温的极差为23−19=4°C,这8天的最高气温的中位数为21+232=11.5°C,故选:D.极差为15−9=6°C,这8天的最低气温的中位数为11+1226、某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:66674037146405711105650995866876832037905716031163149084452175738805905223594310若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本编号是()A.10B.09C.71D.20答案:B分析:按照题意依次读出前4个数即可.从随机数表第1行的第9列数字开始由左向右每次连续读取2个数字,删除超出范围及重复的编号,符合条件的编号有14,05,11,09,所以选出来的第4个个体的编号为09,故选:B7、为了更好地支持“中小型企业”的发展,某市决定对部分企业的税收进行适当的减免,某机构调查了当地的中小型企业年收入情况,并根据所得数据画出了样本的频率分布直方图,下面三个结论:①样本数据落在区间[300,500)的频率为0.45;②如果规定年收入在500万元以内的企业才能享受减免税政策,估计有55%的当地中小型企业能享受到减免税政策;③样本的中位数为480万元.其中正确结论的个数为A.0B.1C.2D.3答案:D解析:根据直方图求出a=0.0025,求出[300,500)的频率,可判断①;求出[200,500)的频率,可判断②;根据中位数是从左到右频率为0.5的分界点,先确定在哪个区间,再求出占该区间的比例,求出中位数,判断③.由(0.001+0.0015+0,002+0.0005+2a)×100=1,a=0.0025,[300,500)的频率为(0.002+0.0025)×100=0.45,①正确;[200,500)的频率为(0.0015+0.002+0.0025)×100=0.55,②正确;[200,400)的频率为0.3,[200,500)的频率为0.55,中位数在[400,500)且占该组的4,5×100=480,③正确.故中位数为400+0.5−0.30.25故选:D.小提示:本题考查补全直方图,由直方图求频率和平均数,属于基础题8、2021年是中国共产党成立100周年,某学校团委在7月1日前,开展了“奋斗百年路,启航新征程”党史知识竞赛.团委工作人员将进入决赛的100名学生的分数(满分100分且每人的分值为整数)分成6组:[70,75),[75,80),[80,85),[85,90),[90,95),[95,100]得到如图所示的频率分布直方图,则下列关于这100名学生的分数说法错误的是()A.分数的中位数一定落在区间[85,90)B.分数的众数可能为97C.分数落在区间[80,85)内的人数为25D.分数的平均数约为85答案:B分析:根据小矩形的面积之和等于1,求出b=0.05,根据中位数的求法可判断A;根据众数的求法可判断B;由在区间[80,85)上的概率可判断C;由平均数的的计算公式:小矩形的底边中点横坐标与小矩形面积的乘积之和可判断D.A,由频率分布直方图可得(0.01+0.02×2+0.03+b+0.07)×5=1,解得b=0.05,前三组的概率为(0.02×2+0.05)×5=0.45<0.5,前四组的概率为(0.02×2+0.05+0.07)×5=0.7>0.5,所以分数的中位数一定落在第四组[85,90)内,故A正确;B,分数的众数可能为87.5,故B错误;C,分数落在区间[80,85)内的人数约为0.05×5×100=25,故C正确.D,分数的平均数为:72.5×0.02×5+77.5×0.02×5+82.5×0.05×5+87.5×0.07×5+92.5×0.03×5+97.5×0.01×5=85,故D正确.故选:B多选题9、2020年突如其来的新冠肺炎疫情对房地产市场造成明显的冲击,如图为某市2020年国庆节7天假期的楼房认购量与成交量的折线图,某同学根据折线图对这7天的认购量(单位:套)与成交量(单位:套)作出如下判断,则判断正确的是()A.日成交量的中位数是16B.日成交量超过平均成交量的只有1天C.10月7日认购量量的增长率大于10月7日成交量的增长率D.日认购量的方差大于日成交量的方差答案:BD解析:根据拆线图判断各数据特征后判断各选项.由拆线图日成交量的中位数是26,A错;日成交量均值为13+8+32+16+26+38+1667≈42.7,大于均值的只有一天,B正确;10月7日认购量量的增长率为y1=276−112112≈1.464,成交量的增长率为y2=166−3838≈3.368,显然C错;日认购量的均值为223+105+91+107+100+112+276≈144.857,7由各数据与均值的差可以看出日认购量的方差大于日成交量的方差,D正确.故选:BD.小提示:关键点点睛:本题考查统计图表,考查拆线图的识别.解题关键是由拆线图得出各数据,然后求得各数据特征.如中位数,均值,增长率,方差,解题中还要善于估值,如本题中的方差,从而大致比较出大小.10、成立时间少于10年.估值超过10亿美元且未上市的企业,称为独角兽企业.2021年中国新经济独角兽企业分布较广泛、覆盖居民生活的各个方面.如图为2021年中国新经济独角兽企业TOP200的行业分布图,中国新经济独角兽企业TOP200榜单中,京、沪、粤三地的企业数量共同占比达到69%.下列说法正确的是()A.随着智能出行与共享经济观念的普及,汽车交通行业备受投资者关注B.这12个行业TOP200榜单中独角兽企业数量的中位数是17C.中国新经济独角兽企业TOP200榜单中,京、沪、粤三地的企业超过130家D.2021年中国新经济独角兽企业TOP200榜单中汽车交通、企业服务、文化娱乐的企业数量共同占比超过40% 答案:ABC分析:结合图表对选项进行分析,由此确定正确选项.A选项,由图可知,汽车交通行业独角兽企业TOP200榜单中数量最多,是由A选项正确.=17,B选项正确.B选项,数据为8,8,12,13,16,17,17,18,18,19,25,29,中位数为17+172C选项,200×69%=138>130,所以C选项正确.×100%=36.5%<40%,D选项错误.D选项,汽车交通、企业服务、文化娱乐占比29+25+19200故选:ABC11、立德中学举行党史知识竞赛,对全校参赛的1000名学生的得分情况进行了统计,把得分数据按照[50,60)、[60,70)、[70,80)、[80,90)、[90,100]分成5组,绘制了如图所示的频率分布直方图,根据图中信息,下列说法正确的是()A.图中的x值为0.020B.这组数据的极差为50C.得分在80分及以上的人数为400D.这组数据的平均数的估计值为77答案:ACD分析:根据频率分布直方图中所有长方形的面积和为1,以及极值、频数以及平均数的计算,对每个选项进行逐一分析,即可判断和选择.由(0.005+x+0.035+0.030+0.010)×10=1,可解得x=0.020,故选项A正确;频率分布直方图无法看出这组数据的最大值和最小值,故选项B不正确;得分在80分及以上的人数的频率为(0.030+0.010)×10=0.4,故人数为1000×0.4=400,故选项C正确;这组数据的平均数的估计值为:55×0.05+65×0.2+75×0.35+85×0.3+95×0.1=77故选项D正确.故选:ACD.填空题12、某学校有高中学生1000人,其中高一年级、高二年级、高三年级的人数分别为320,300,380,为了调查学生参加“社区志愿服务”的意向,现采用分层抽样的方法从该校学生中抽取一个样本量为200的样本,那么应抽取高二年级学生的人数为________答案:60分析:根据分层抽样,每层的抽样比相同计算即可.因为学校有高中学生1000人,抽取一个样本量为200的样本,故应抽取高二年级学生的人数为2001000×300=60.所以答案是:6013、有一组样本数据x1,x2,x3,x4,该样本的平均数和方差均为m.在该组数据中加入一个数m,得到新的样本数据,则新样本数据的方差为__________.答案:45m##0.8m分析:由平均数和方差的计算公式直接计算即可.样本数据x1,x2,x3,x4,该样本的平均数和方差均为m,在该组数据中加入1个数m,则新样本数据的平均数x̅=15×(4×m+m)=m,方差为s2=15×[4×m+(m−m)2]=45m.所以答案是:45m.14、由6个实数组成的一组数据的方差为S12,将其中一个数5改为2,另一个数4改为7 ,其余的数不变,得到新的一组数据的方差为S22,则S22−S12=________.答案:2分析:根据平均数和方差的定义进行求解即可.因为将其中一个数5改为2,另一个数4改为7,其余的数不变,所以这6个实数组成的一组数据的平均数不变,设为x,设没有变化的4个数与平均数差的平方和为S,所以S22−S12=[S+(2−x)2+(7−x)2]−[S+(5−x)2+(4−x)2]6=2,所以答案是:2解答题15、从甲、乙两人中选选拔一人参加射击比赛,对他们的射击水平进行了测试,两人在相同条件下各射击10次,命中的环数如下:甲78686591074乙9578768677(1)分别计算甲、乙两人射击命中环数的平均数:(2)选派谁去参赛更好?请说明理由.答案:(1)甲乙的平均数均为7;(2)选派乙,理由见解析.分析:(1)应用平均数的求法求甲乙平均数;(2)由(1)知甲乙平均数相同,求出甲乙的方差并比较大小,即可确定选派方法.(1)由题设,甲的平均数为x̅1=7+8+6+8+6+5+9+10+7+410=7,乙的平均数为x̅2=9+5+7+8+7+6+8+6+7+710=7.(2)甲的方差为s12=110∑(x i−x̅1)210i=1=0+1+1+1+1+4+4+9+0+910=3,乙的方差为s22=110∑(x i−x̅2)210i=1=4+4+0+1+0+1+1+1+0+010=1.2.由(1)知:x̅1=x̅2,而s12>s22,所以选派乙去参赛更好.。

部编版高中数学必修二第九章统计带答案知识点总结归纳完整版

部编版高中数学必修二第九章统计带答案知识点总结归纳完整版

(名师选题)部编版高中数学必修二第九章统计带答案知识点总结归纳完整版单选题1、某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图,90后从事互联网行业岗位分布条形图,则下列结论错误的是()注:90后指1990年及以后出生,80后指1980−1989年之间出生,80前指1979年及以前出生.A.互联网行业从业人员中从事技术和运营岗位的人数占总人数的三成以上B.互联网行业中从事技术岗位的人数超过总人数的20%C.互联网行业中从事运营岗位的人数90后一定比80前多D.互联网行业中从事技术岗位的人数90后一定比80后多2、下表是某校校级联欢晚会比赛中12个班级的得分情况,则得分的30百分位数是()3、为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间4、有甲、乙两种水稻,测得每种水稻各10株的分蘖数据,计算出样本均值E(X甲)=E(X乙),方差分别为D(X甲)=11,D(X乙)=3.4.由此可以估计()A.甲种水稻比乙种水稻分蘖整齐B.乙种水稻比甲种水稻分蘖整齐C.甲、乙两种水稻分蘖整齐程度相同D.甲、乙两种水稻分蘖整齐程度不能比较5、2020年12月31日,国务院联防联控机制发布,国药集团中国生物的新冠病毒灭活疫苗已获药监局批准附条件上市,其保护效力达到世界卫生组织及药监局相关标准要求,现已对18至59岁的人提供.根据某地接种年龄样本的频率分布直方图(如图)估计该地接种年龄的中位数为()A.40B.39C.38D.376、2020年广东12月份天气预报历史记录中1号至8号的数据如表所示,则()C.这8天的最低气温的极差为5°C D.这8天的最低气温的中位数为11.5°C7、从某班50名学生中抽取6名学生进行视力状况的统计分析,下列说法正确的是()A.50名学生是总体B.每个被调查的学生是个体C.抽取的6名学生的视力是一个样本D.抽取的6名学生的视力是样本容量8、为了更好地支持“中小型企业”的发展,某市决定对部分企业的税收进行适当的减免,某机构调查了当地的中小型企业年收入情况,并根据所得数据画出了样本的频率分布直方图,下面三个结论:①样本数据落在区间[300,500)的频率为0.45;②如果规定年收入在500万元以内的企业才能享受减免税政策,估计有55%的当地中小型企业能享受到减免税政策;③样本的中位数为480万元.其中正确结论的个数为A.0B.1C.2D.3多选题9、中国的华为公司是全球领先的ICT(信息与通信)基础设施和智能终端提供商,其致力于把数字世界带给每个人、每个家庭、每个组织,构建万物互联的智能世界.其中华为的5G智能手机是全世界很多年轻人非常喜欢的品牌.为了研究某城市甲、乙两个华为5G智能手机专卖店的销售状况,统计了2020年4月到9月甲、乙两店每月的营业额(单位:万元),得到如下的折线图,则下列说法正确的是()A.根据甲店的营业额折线图可知,该店月营业额的平均值在[31,32]内B.根据乙店的营业额折线图可知,该店月营业额总体呈上升趋势C.根据甲、乙两店的营业额折线图可知乙店的月营业额极差比甲店小D.根据甲、乙两店的营业额折线图可知7、8、9月份的总营业额甲店比乙店少10、如图所示的曲线图是2020年1月25日至2020年2月12日陕西省及西安市新冠肺炎累计确诊病例的曲线图,则下列判断正确的是()A.1月31日陕西省新冠肺炎累计确诊病例中西安市占比超过了13B.1月25日至2月12日陕西省及西安市新冠肺炎累计确诊病例都呈递增趋势C.2月2日后到2月10日陕西省新冠肺炎累计确诊病例增加了97例D.2月8日到2月10日西安市新冠肺炎累计确诊病例的增长率大于2月6日到2月8日的增长率11、甲、乙、丙、丁四人各掷骰子5次(骰子每次出现的点数可能为1,2,3,4,5,6),并分别记录每次出现的点数,四人根据统计结果对各自的试验数据分别做了如下描述,可以判断一定没有出现6点的描述是()A.中位数为3,众数为5B.中位数为3,极差为3C.中位数为1,平均数为2D.平均数为3,方差为2填空题12、已知一组数据4,2a,3−a,5,6的平均数为4,则a的值是_____.13、某汽车研究院现有300名研究员,他们的学历情况如图所示该研究院今年计划招聘一批新研究员,并决定不再招聘本科生,且使得招聘后本科学历的研究员比例下降到15%,硕士学历的研究员比例不变,则该研究院今年计划招聘的硕士学历的研究员人数为______.部编版高中数学必修二第九章统计带答案(十七)参考答案1、答案:D解析:根据整个互联网行业从业者年龄分布饼状图、90后从事互联网行业岗位分布条形图,对四个选项逐一分析,即可得出正确选项.对于选项A,因为互联网行业从业人员中,“90后”占比为56%,其中从事技术和运营岗位的人数占的比分别为39.6%和17%,则“90后”从事技术和运营岗位的人数占总人数的56%×(39.6%+17%)≈31.7%.“80前”和“80后”中必然也有从事技术和运营岗位的人,则总的占比一定超过三成,故选项A正确;对于选项B,因为互联网行业从业人员中,“90后”占比为56%,其中从事技术岗位的人数占的比为39.6%,则“90后”从事技术岗位的人数占总人数的56%×39.6%≈22.2%.“80前”和“80后”中必然也有从事技术岗位的人,则总的占比一定超过20%,故选项B正确;对于选项C,“90后”从事运营岗位的人数占总人数的比为56%×17%≈9.5%,大于“80前”的总人数所占比3%,故选项C正确;选项D,“90后”从事技术岗位的人数占总人数的56%×39.6%≈22.2%,“80后”的总人数所占比为41%,条件中未给出从事技术岗位的占比,故不能判断,所以选项D错误.故选:D.小提示:关键点点睛:本题考查利用扇形统计图和条形统计图解决实际问题,解本题的关键就是利用条形统计图中“90后”事互联网行业岗位的占比乘以“90后”所占总人数的占比,再对各选项逐一分析即可.2、答案:D分析:根据百分位数的定义求解即可.12×30%=3.6,把12个班级的得分按照从小到大排序为7,7,8,9,9,10,10,10,11,13,13,14,可得30百分位数是第4个得分数,即9.故选:D3、答案:C分析:根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元的农户的比率估计值为0.02+0.04=0.06=6%,故A正确;该地农户家庭年收入不低于10.5万元的农户比率估计值为0.04+0.02×3=0.10=10%,故B正确;该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为0.10+0.14+0.20×2=0.64=64%> 50%,故D正确;该地农户家庭年收入的平均值的估计值为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+ 9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),超过6.5万元,故C错误.综上,给出结论中不正确的是C.故选:C.小提示:本题考查利用样本频率直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平均值的估计值.注意各组的频率等于频率组距×组距.4、答案:B分析:可以用样本的方差估计总体的方差,方差越小,分蘖越整齐.解:已知样本方差:D(X乙)=3.4,D(X甲)=11由此估计,乙种水稻的方差约为3.4,甲种水稻的方差约为11. 因为3.4<11所以乙种水稻比甲种水稻分蘖整齐故选:B.5、答案:C分析:利用中位数左右两边的小矩形的面积都等于0.5即可求解.年龄位于[18,24)的频率为0.013×6=0.078,年龄位于[24,30)的频率为0.023×6=0.138,年龄位于[30,36)的频率为0.034×6=0.204,年龄位于[36,42)的频率为0.040×6=0.240,因为0.078+0.138+0.204=0.42<0.5,而0.078+0.138+0.204+0.240=0.42=0.66>0.5,所以中位数位于[36,42),设中位数为x,则0.078+0.138+0.204+(x−36)×0.04=0.5,解得:x=38,故选:C.6、答案:D分析:由极差等于一组数据中的最大值与最小值的差,并根据中位数的定义,求最高、最低气温数据的中位数即可判断各项的正误.=22°C,这8天的最低气温的这8天的最高气温的极差为23−19=4°C,这8天的最高气温的中位数为21+232=11.5°C,故选:D.极差为15−9=6°C,这8天的最低气温的中位数为11+1227、答案:C分析:根据总体、样本、个体、样本容量的概念判断.从某班50名学生中抽取6名学生进行视力状况的统计分析,则50个学生的视力状况是总体,抽取的6名学生的视力是一个样本,每个被调查的学生的视力状况是个体,样本容量是6,结合所给的选项,只有C正确.故选:C.8、答案:D解析:根据直方图求出a=0.0025,求出[300,500)的频率,可判断①;求出[200,500)的频率,可判断②;根据中位数是从左到右频率为0.5的分界点,先确定在哪个区间,再求出占该区间的比例,求出中位数,判断③.由(0.001+0.0015+0,002+0.0005+2a)×100=1,a=0.0025,[300,500)的频率为(0.002+0.0025)×100=0.45,①正确;[200,500)的频率为(0.0015+0.002+0.0025)×100=0.55,②正确;[200,400)的频率为0.3,[200,500)的频率为0.55,中位数在[400,500)且占该组的45,故中位数为400+0.5−0.30.25×100=480,③正确.故选:D.小提示:本题考查补全直方图,由直方图求频率和平均数,属于基础题9、答案:ABD解析:计算出甲店的月营业额的平均值即可判断A;由图可直接判断B;分别计算出甲、乙两店的月营业额极差和7、8、9月份的总营业额即可判断CD.对于A,根据甲店的营业额折线图可知,该店月营业额的平均值为14+21+26+30+52+476=1906≈31.7,故A正确;对于B,根据乙店的营业额折线图可知,该店月营业额总体呈上升趋势,故B正确;对于C,可得甲店的月营业额极差为52−14=38,乙店的月营业额极差为53−7=46,故C错误;对于D,甲店7、8、9月份的总营业额为30+52+47=129,乙店7、8、9月份的总营业额为33+44+ 53=130,故D正确.故选:ABD.10、答案:ABC分析:根据曲线图可得ABC正确,2月8日到2月10日西安新冠肺炎累计确诊病例增加了544,2月6日到2月8日西安新冠肺炎累计确诊病例增加了737,D说法不正确.1月31日陕西省新冠肺炎累计确诊病例共有87例,其中西安32例,所以西安所占比例为3287>13,故A正确;由曲线图可知,1月25日至2月12日陕西省及西安市新冠肺炎累计确诊病例都呈递增趋势,故B正确;2月2日后到2月10日陕西省新冠肺炎累计确诊病例增加了213−116=97例,故C正确;2月8日到2月10日西安新冠肺炎累计确诊病例增加了98−8888=544,2月6日到2月8日西安新冠肺炎累计确诊病例增加了88−7474=737,显然737>544,故D错误.故选:ABC.11、答案:AD分析:根据数字特征的定义,依次对选项分析判断即可对于A,由于中位数为3,众数为5,所以这5个数从小到大排列后,第3个数是3,则第4和5个为5,所以这5个数中一定没有出现6,所以A正确,对于B,由于中位数为3,极差为3,所以这5个数可以是3,3,3,4,6,所以B错误,对于C,由于中位数为1,平均数为2,所以这5个数可以是1,1,1,1,6,所以C错误,对于D,由平均数为3,方差为2,可得x1+x2+x3+x4+x5=15,15[(x1−3)2+(x2−3)2+(x3−3)2+ (x4−3)2+(x5−3)2]=2,若有一个数为6,取x1=6,则x2+x3+x4+x5=9,(x2−3)2+(x3−3)2+ (x4−3)2+(x5−3)2=1,所以(x2−3)2≤1,(x3−3)2≤1,(x4−3)2≤1,(x5−3)2≤1,所以x2,x3,x4,x5这4个数可以是4,3,3,3或2,3,3,3,与x2+x3+x4+x5=9矛盾,所以x1≠6,所以这5个数一定没有出现6点,所以D正确,故选:AD12、答案:2分析:根据平均数的公式进行求解即可.∵数据4,2a,3−a,5,6的平均数为4∴4+2a+3−a+5+6=20,即a=2.所以答案是:2.小提示:本题主要考查平均数的计算和应用,比较基础.13、答案:40分析:根据题意,设今年招聘的硕士生x人,博士生y人,由扇形图分析可得现有本科生和硕士生的人数,进而可得方程组,变形解可得x的值,即可得答案.解:根据题意,设今年招聘的硕士生x人,博士生y人,又由现有研究员300人,其中本科生300×20%=60人,硕士生300×40%=120人,则有{60300+x+y=0.15120+x 300+x+y =0.4,解得{x=40y=60;所以答案是:40.。

必修2数学第九章统计知识点

必修2数学第九章统计知识点

必修2数学第九章统计知识点一、随机抽样。

1. 简单随机抽样。

- 定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤ N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。

- 常用方法:抽签法和随机数法。

- 抽签法:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。

- 随机数法:利用随机数表、随机数生成器或统计软件来产生随机数,根据随机数抽取样本。

2. 系统抽样。

- 定义:将总体分成均衡的若干部分,然后按照预先规定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样。

- 步骤:- 先将总体的N个个体编号。

- 确定分段间隔k,对编号进行分段,当(N)/(n)(n是样本容量)是整数时,取k = (N)/(n);当(N)/(n)不是整数时,先从总体中随机地剔除几个个体,使得总体中剩余的个体数N'能被n整除,这时k=(N')/(n)。

- 在第1段用简单随机抽样确定第一个个体编号l(l≤ k)。

- 按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(l + k),再加k得到第3个个体编号(l+2k),依次类推,直到获取整个样本。

3. 分层抽样。

- 定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样。

- 步骤:- 根据已有的信息,将总体分成互不相交的层。

- 计算各层中个体的个数与总体个数的比。

- 按各层个体数占总体数的比确定各层应抽取的样本容量。

- 在每一层中进行简单随机抽样或系统抽样,获取相应的样本个体,合在一起得到分层抽样的样本。

- 特点:使样本具有较强的代表性,而且在各层抽样时,可灵活选用不同的抽样方法。

二、用样本估计总体。

高中数学统计知识点总结

高中数学统计知识点总结

高中数学统计知识点总结高中数学统计学问点总结1考点1:确定大事和随机大事考核要求:〔1〕理解必定大事、不行能大事、随机大事的概念,知道确定大事与必定大事、不行能大事的关系;〔2〕能区分简洁生活大事中的必定大事、不行能大事、随机大事。

考点2:大事发生的可能性大小,大事的概率考核要求:〔1〕知道各种大事发生的可能性大小不同,能推断一些随机大事发生的可能大事的大小并排出大小挨次;〔2〕知道概率的含义和表示符号,了解必定大事、不行能大事的概率和随机大事概率的取值范围;〔3〕理解随机大事发生的频率之间的区分和联系,会依据大数次试验所得频率估量大事的概率。

〔1〕在给可能性的大小排序前可先用〝肯定发生〞、〝很有可能发生〞、〝可能发生〞、〝不太可能发生〞、〝肯定不会发生〞等词语来表述大事发生的可能性的大小;〔2〕大事的概率是确定的常数,而概率是不确定的,可是近似值,与试验的次数的多少有关,只有当试验次数足够大时才能更精确。

考点3:等可能试验中大事的概率问题及概率计算考核要求〔1〕理解等可能试验的概念,会用等可能试验中大事概率计算公式来计算简洁大事的概率;〔2〕会用枚举法或画〝树形图〞方法求等可能大事的概率,会用区域面积之比解决简洁的概率问题;〔3〕形成对概率的初步熟悉,了解机会与风险、规那么公正性与决策合理性等简洁概率问题。

〔1〕计算前要先确定是否为可能大事;〔2〕用枚举法或画〝树形图〞方法求等可能大事的概率过程中要将全部等可能状况考虑完好。

考点4:数据整理与统计图表考核要求:〔1〕知道数据整理分析的意义,知道普查和抽样调查这两种收集数据的方法及其区分;〔2〕结合有关代数、几何的内容,把握用折线图、扇形图、条形图等整理数据的方法,并能通过图表猎取有关信息。

考点5:统计的含义考核要求:〔1〕知道统计的意义和一般讨论过程;〔2〕熟悉个体、总体和样本的区分,了解样本估量总体的思想方法。

考点6:平均数、加权平均数的概念和计算考核要求:〔1〕理解平均数、加权平均数的概念;〔2〕把握平均数、加权平均数的计算公式。

高中数学统计知识梳理

高中数学统计知识梳理

高中数学统计知识梳理在高中数学学习中,统计是一个非常重要的知识点,它涉及到数据的收集、整理、分析和解释,对我们了解世界,做出科学决策具有重要意义。

下面将对高中数学统计知识进行梳理。

**一、统计数据的收集**统计数据的收集是统计学中的第一步,它是通过各种方式获取有关事物的信息数据。

在高中数学中,我们常常会遇到以下几种方式:1. **实地观察**:直接对事物进行观察,记录所需要的信息。

2. **抽样调查**:从整体中选取一部分进行调查,代表整体情况。

3. **问卷调查**:通过设计合适的问卷收集数据,了解大众的看法和意见。

通过以上方式收集到的数据,会成为我们进行后续统计分析的基础。

**二、统计数据的整理与描述**统计数据的整理与描述是对收集到的数据进行加工处理,总结出一些有意义的信息。

在这一过程中,我们通常采取以下方法:1. **频数表**:将数据按照不同的取值范围进行分类,列出频数,便于分析数据的分布情况。

2. **频数分布直方图**:用矩形条表示各区间的频数,直观地展示数据的分布情况。

3. **数据的中心趋势度量**:包括均值、中位数和众数,帮助我们了解数据的核心特征。

通过整理与描述,我们可以更清晰地了解数据的规律和特点。

**三、统计数据的分析**统计数据的分析是统计学的关键环节,它能帮助我们做出合理的推断和决策。

在高中数学中,统计数据的分析通常包括以下内容:1. **概率统计**:研究随机事件发生的可能性,包括事件的概率计算和性质分析。

2. **参数估计**:通过样本数据对总体参数进行估计,推断总体的特征。

3. **假设检验**:利用抽样分布理论,对总体参数是否符合某种假设进行检验。

统计数据的分析可以帮助我们深入理解数据背后的规律和现象,为我们提供科学依据。

**四、统计学在实际生活中的应用**统计学不仅在学术研究中有着重要作用,更广泛地应用于实际生活中。

比如:1. **人口统计**:帮助政府了解人口结构和分布情况,制定相关政策。

新人教版高中数学必修第二册统计全套PPT课件

新人教版高中数学必修第二册统计全套PPT课件

2.简单随机抽样 一般地,设一个总体含有N(N为正整数)个个体, 从中逐个抽取n(1≤n<N)个个体作为样本,如果抽 取是放回的,且每次抽取时总体内的各个个体被抽到 的概率都相等,我们把这样的抽样方法叫做放回简单 随机抽样;如果抽取是不放回的,且每次抽取时总体 内未进入样本的各个个体被抽到的概率都相等,我们 把这样的抽样方法叫做不放回简单随机抽样。除非特 殊声明,本章所称的简单随机抽样指不放回简单随机 抽样。
(4)不是简单随机抽样,不符合“等可能性”,因为 5名同学是指定的,而不是随机抽取的。 (5)是,它属于简单随机抽样中的随机数法。 答案:(2)(5)
【内化·悟】 判断简单随机抽样的关键是什么? 提示:(1)样本总体个数是否有限; (2)抽取n个个体作为样本; (3)每个个体入样的可能性均为 n 。
N
【类题·通】 1.放回简单随机抽样的特点 (1)被抽取的样本的总体个数N是有限的。 (2)逐个抽取n个个体作为样本。 (3)抽取是放回的。 (4)每个个体入样的可能性均为 n 。
N
2.不放回简单随机抽样的特点
(1)被抽取的样本的总体个数N是有限的。
(2)逐个抽取n个,或一次性抽取n个个体作为样本。
⑤将一枚质地均匀的骰子掷两次,分别记录向上的点 数
【解析】①是不放回简单随机抽样;②④不满足等可 能抽样,所以不是简单随机抽样;③是不放回简单随 机抽样;⑤是放回简单随机抽样。 答案:①③
类型二 抽签法的应用
【典例】学校举办元旦晚会,需要从每班选10名男 生,8名女生参加合唱节目,某班有男生32名,女 生28名,试用抽签法确定该班参加合唱的同学。
为 样本均值 ,又称样本平均数。
Y2 Yn n
1 N
n i 1

统计知识点归纳总结高中

统计知识点归纳总结高中

统计知识点归纳总结高中一、基本概念1. 数据:统计学研究的对象,是指按一定规律收集和整理的信息,可以是数字、文字、图形等形式。

2. 总体和样本:总体是指研究对象的全体,样本是从总体中选取的部分个体。

3. 参数和统计量:参数是用来描述总体特征的指标,统计量是用来描述样本特征的指标。

4. 变量和常数:变量是指在统计研究中取值不确定的量,常数是指在统计研究中取值确定的量。

5. 随机试验:具有以下三个特点的试验称为随机试验:试验的结果不确定、试验的结果可以通过观察、对试验结果的观察可以得出某些结论。

6. 概率:概率是描述随机现象发生可能性大小的数值,用P(A)表示事件A发生的概率。

二、概率1. 事件与事件的关系:事件A和事件B的关系包括对立事件、互斥事件和相互独立事件。

2. 条件概率:事件B在事件A发生的条件下发生的概率,用P(A|B)表示。

3. 事件的组合与分解:概率的计算方法包括加法原理、减法原理、乘法原理和全概率公式。

4. 随机变量和概率分布:随机变量是指在随机试验中的取值是随机的变量,概率分布描述了随机变量各个取值的概率。

5. 二项分布和正态分布:二项分布适用于只有两种可能结果的试验,正态分布是一种连续随机变量的概率分布。

三、统计调查1. 抽样调查:抽样调查是以总体为基础,按一定方法从总体中抽取部分个体进行观察和测量,以此得出总体特征的一种方法。

2. 随机抽样和非随机抽样:随机抽样是指以概率为基础进行抽样,非随机抽样是指不以概率为基础进行抽样。

3. 抽样误差和非抽样误差:抽样误差是指由于样本与总体不同而导致的误差,非抽样误差是指由于调查方法或调查过程的错误而导致的误差。

4. 调查设计和调查方法:调查设计包括问卷设计、抽样设计、调查过程设计等内容,调查方法包括面对面调查、电话调查、网络调查等。

四、统计分析1. 描述统计和推断统计:描述统计是对已知数据加以整理、处理和分析的过程,推断统计是根据样本统计量对总体参数进行推断的过程。

新教材 人教A版高中数学必修第二册 第九章 统计 知识点汇总及解题规律方法提炼

新教材 人教A版高中数学必修第二册 第九章 统计 知识点汇总及解题规律方法提炼

新教材人教A版高中数学必修第二册第九章统计知识点汇总及解题规律方法提炼第九章统计学9.1 随机抽样1.全面调查与抽样调查全面调查是对每一个调查对象进行调查的方法,也被称为普查。

在一个调查中,调查对象的全体称为总体,组成总体的每一个调查对象称为个体。

抽样调查是根据一定的目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法。

从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本量。

调查样本获得的变量值称为样本的观测数据,简称样本数据。

2.简单随机抽样简单随机抽样包括放回简单随机抽样和不放回简单随机抽样。

放回简单随机抽样是从一个总体含有N(N为正整数)个个体中逐个抽取n(1≤n<N)个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样。

不放回简单随机抽样是如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样。

通过简单随机抽样获得的样本称为简单随机样本。

实现简单随机抽样的方法很多,抽签法和随机数法是比较常用的两种方法。

3.总体平均数与样本平均数总体平均数是指总体中所有个体变量值的平均数,记为Y。

如果总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则Y=(Y1+Y2+…+YN)/N。

如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式Y=(∑fiYi)/N。

样本平均数是指从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称y=(y1+y2+…+yn)/n为样本均值,又称样本平均数。

在简单随机抽样中,各个个体被抽到的机会都相等,从而保证了抽样的公平性。

在统计学中,我们常使用样本平均数y来估计总体平均数Y。

高中数学统计知识点

高中数学统计知识点

高中数学统计知识点统计是一种数学方法,可以将数据做一定的处理,然后归纳,最后将结果清晰的呈现在人们面前。

下面是店铺为你整理的高中数学统计知识点,一起来看看吧。

高中数学统计知识点:统计1.1.1简单随机抽样1.总体和样本在统计学中 , 把研究对象的全体叫做总体.把每个研究对象叫做个体.把总体中个体的总数叫做总体容量.为了研究总体x 的有关性质,一般从总体中随机抽取一部分:x₁,x₂……,xn 研究,我们称它为样本.其中个体的个数称为样本容量.2.简单随机抽样,也叫纯随机抽样。

就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。

特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。

简单随机抽样是其它各种抽样形式的基础。

通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。

3.简单随机抽样常用的方法:(1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。

在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。

4.抽签法:(1)给调查对象群体中的每一个对象编号(2)准备抽签的工具,实施抽签(3)对样本中的每一个个体进行测量或调查例:请调查你所在的学校的学生做喜欢的体育活动情况。

5.随机数表法:例:利用随机数表在所在的班级中抽取10位同学参加某项活动。

1.1.2系统抽样1.系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。

第一个样本采用简单随机抽样的办法抽取。

K(抽样距离)=N(总体规模)/n(样本规模)前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。

可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。

如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。

数学统计高三知识点

数学统计高三知识点

数学统计高三知识点数学统计是高中数学的重要分支,也是高三学生必修的内容之一。

它是以收集、整理和分析数据为主要目标的一门学科。

以下是高三数学统计的主要知识点。

1. 数据的收集与整理在数学统计中,收集和整理数据是非常重要的一步。

数据可以通过实地调查、问卷调查、实验等方式获得。

在收集数据时,要注意数据的准确性和完整性。

整理数据可以采用统计表格、图表等形式。

统计表格可以用来记录原始数据,而图表可以更直观地展示数据的分布和规律。

2. 数据的分析与描述对收集到的数据进行分析和描述是数学统计的核心内容。

常用的数据描述方法有集中趋势和离散程度的度量。

集中趋势主要包括算术平均数、中位数和众数。

算术平均数是所有数据的总和除以数据的个数,中位数是将数据按照大小排序后,处于中间位置的数,众数是出现次数最多的数。

离散程度则是衡量数据的波动性,常用的有极差、方差和标准差。

3. 概率与统计分布概率和统计分布是数学统计中的重要概念。

概率是研究随机事件发生的可能性的数学工具。

常用的概率计算方法有加法原理和乘法原理。

统计分布则是研究随机变量的取值与其概率之间的关系。

常见的统计分布有二项分布、正态分布和泊松分布等。

4. 抽样与统计推断当数据量较大时,采用抽样的方式可以更快速地对总体进行估计和推断。

在高三数学统计中,常用的抽样方法有简单随机抽样、系统抽样和分层抽样等。

抽样后,可以通过统计推断的方法对总体进行估计,常用的推断方法有点估计和区间估计。

5. 相关与回归分析相关与回归分析是研究变量之间关系的方法。

相关分析可以判断两个变量之间的线性相关性,常用的判断指标有皮尔逊相关系数和斯皮尔曼相关系数。

回归分析则是通过对自变量和因变量的关系建立回归方程,进而预测和分析变量之间的影响关系。

高三数学统计是一门综合性较强的学科,它既需要运用数学方法进行数据的计算和分析,又需要具备实际问题的思考能力。

通过对数学统计知识点的学习和掌握,能够帮助学生更好地理解和应用数据,为未来的学习和研究打下坚实的基础。

部编版高中数学必修二第九章统计知识点总结归纳

部编版高中数学必修二第九章统计知识点总结归纳

(名师选题)部编版高中数学必修二第九章统计知识点总结归纳单选题1、某老师为了解某班50名同学在家学习的情况,决定将本班学生依次编号为01,02,⋅⋅⋅,50.利用下面的随机数表选取10名学生调查,选取方法是从下面随机数表的第1行第2列开始由左到右依次读取两个数字,则选出来的第4名学生的编号为()7 2 5 6 0 8 1 3 0 2 5 8 3 2 4 9 8 7 0 2 4 8 1 2 9 7 2 8 0 19 8 3 1 0 4 9 2 3 1 4 9 3 5 8 2 0 9 3 6 2 4 4 8 6 9 6 9 3 87 4 8 1A.25B.24C.29D.19答案:C分析:利用随机表法从第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个即可求解.从题中随机数表的第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个可得:25 ,30 ,24,2 9,19,10 ,49 ,23,14,20,故选出来的第4名学生的编号为29.故选:C.2、从某中学随机抽取100名学生,将他们的身高数据(单位cm)绘制成频率分布直方图,若要从身高在[150,160),[160,170),[170,180]三组内的学生中,用分层抽样的方法选取16人参加一次活动.则从身高在[170,180]内的学生中选取的人数应为()A.3B.4C.5D.7答案:B分析:先求得a 的值,然后结合分层抽样的知识计算出正确答案.依题意(0.005+0.015+a +0.035+0.02)×10=1,解得a =0.025,身高在[150,160),[160,170),[170,180]三组内的学生比例为0.025:0.035:0.02=5:7:4,用分层抽样的方法选取16人参加一次活动,则从身高在[170,180]内的学生中选取的人数应为4人故选:B3、某高中学校为了促进学生个体的全面发展,针对学生发展要求,开设了富有地方特色的“泥塑”与“剪纸”两个社团.已知报名参加这两个社团的学生共有800人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如下表:其中x :y :z =5:3:2,且“泥塑”社团的人数占两个社团总人数的35.为了了解学生对两个社团活动的满意程度,从中抽取一个容量为50的样本进行调查,则从“剪纸”社团的高二年级学生中应抽取的人数为( )A .4B .6C .9D .10答案:B 分析:先按分层抽样求出高二年级人数,再按样本占总体的比例得解.因为“泥塑”社团的人数占总人数的35,所以“剪纸”社团的人数占总人数的25,人数为800×25=320. 因为“剪纸”社团中高二年级人数比例为y x+y+z =35+3+2=310,所以“剪纸”社团中高二年级人数为320×310=96.以从“剪纸”社团的高二年级学生中抽取的人数为96×50800=96×116=6.故选:B.4、某书店新进了一批书籍,下表是某月中连续6天的销售情况记录:本B.1110本C.1340本D.1278本答案:A分析:由表格中的数据可以看出每天的销售数量在一个数值附近波动,故用平均数估计总体即可.(30+40+28+44+38+42)=37(本),该月共31由表中6天的销售情况可得,一天的平均销售量为16天,故该月的销售总量约为37×31=1147(本).故选: A5、某地教育局为了解“双减”政策的落实情况,在辖区内高三年级在校学生中抽取100名学生,调查他们课后完成作业的时间,根据调查结果绘制如下频率直方图.根据此频率直方图,下列结论中不正确的是()A.所抽取的学生中有25人在2小时至2.5小时之间完成作业B.该地高三年级学生完成作业的时间超过3小时的概率估计为35%C.估计该地高三年级学生的平均做作业的时间超过2.7小时D.估计该地高三年级有一半以上的学生做作业的时间在2小时至3小时之间答案:D分析:对A,利用直方图中2小时至2.5小时之间的频率判断A;对B,计算超过3小时的频率可判断B;对C,根据直方图中平均数的公式计算,可判断C;对D,计算做作业的时间在2小时至3小时之间的频率,可判断D.对A,直方图中2小时至2.5小时之间的频率为(2.5−2)×0.5=0.25,故所抽取的学生中有100×0.25=25人在2小时至2.5小时之间完成作业,故A正确;对B,由直方图得超过3小时的频率为0.5×(0.3+0.2+0.1+0.1)=0.35,所以B正确;对C,直方图可计算学生做作业的时间的平均数为:1.25×0.05+1.75×0.15+2.25×0.25+2.75×0.20+3.25×0.15+3.75×0.10+4.25×0.05+4.75×0.05=2.75>2.7,所以C正确;对D,做作业的时间在2小时至3小时之间的频率为0.5×(0.5+0.4)=0.45<0.5,所以D错误.故选:D.6、人口普查是世界各国所广泛采用的搜集人口资料的一种科学方法,是提供全国基本人口数据的主要来源.根据人口普查的基本情况,可以科学的研究制定社会、经济、科教等各项发展政策,是国家科学决策的重要基础工作,人口普查资料是制定人口政策的依据和前提.截止2020年10月10日,我国共进行了六次人口普查,下图是这六次人口普查的人数和增幅情况,下列说法正确的是()A.人口数逐次增加,第二次增幅最大B.第六次普查人数最多,第四次增幅最小C.第六次普查人数最多,第三次增幅最大D.人口数逐次增加,从第二次开始增幅减小答案:C分析:人口数由柱状图判断,增幅由折线图判断.A.人口数逐次增加,第三次增幅最大,故错误;B.第六次普查人数最多,第六次增幅最小,故错误;C.第六次普查人数最多,第三次增幅最大,故正确;D.人口数逐次增加,从第三次开始增幅减小,故错误;故选:C7、某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:66674037146405711105650995866876832037905716031163149084452175738805905223594310若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本编号是()A.10B.09C.71D.20答案:B分析:按照题意依次读出前4个数即可.从随机数表第1行的第9列数字开始由左向右每次连续读取2个数字,删除超出范围及重复的编号,符合条件的编号有14,05,11,09,所以选出来的第4个个体的编号为09,故选:B8、某大学工程学院共有本科生1200人、硕士生400人、博士生200人,要用分层抽样的方法从中抽取一个容量为180的样本,则应抽取博士生的人数为()A.20B.25C.40D.50答案:A分析:直接利用分层抽样,即可计算.因为学院共有本科生1200人、硕士生400人、博士生200人,×180=20.所以应抽取博士生的人数为2001200+400+200故选:A多选题9、2021年11月10日,中国和美国在联合国气候变化格拉斯哥大会期间发布《中美关于在21世纪20年代强化气候行动的格拉斯哥联合宣言》(以下简称《宣言》).承诺继续共同努力,并与各方一道,加强《巴黎协定》的实施,双方同意建立“21世纪20年代强化气候行动工作组”,推动两国气候变化合作和多边进程.为响应《宣言》要求,某地区统计了2020年该地区一次能源消费结构比例,并规划了2030年一次能源消费结构比例,如下图所示:经测算,预估该地区2030年一次能源消费量将增长为2020年的2.5倍,预计该地区()A.2030年煤的消费量相对2020年减少了B.2030年天然气的消费量是2020年的5倍C.2030年石油的消费量相对2020年不变D.2030年水、核、风能的消费量是2020年的7.5倍答案:BD分析:设2020年该地区一次能源消费总量为a,计算出2030年该地区煤、石油、天然气以及水、核、风能的消费量,逐项判断可得出合适的选项.设2020年该地区一次能源消费总量为a,2020年煤的消费量为0.6a,规划2030年煤的消费量为a×2.5×0.3=0.75a>0.6a,故A错误;2020年天然气的消费量为0.1a,规划2030年天然气的消费量为a×2.5×0.2=0.5a=5×0.1a,故B正确;2020年石油的消费量为0.2a,规划2030年石油的消费量为a×2.5×0.2=0.5a>0.2a,故C错误;2020年水、核、风能的消费量为0.1a,规划2030年水、核、风能的消费量为a×2.5×0.3=0.75a=7.5×0.1a,故D正确.故选:BD.10、冬末春初,乍暖还寒,人们容易感冒发热.若发生群体性发热,则会影响到人们的身体健康,干扰正常工作生产.某大型公司规定:若任意连续7天,每天不超过5人体温高于37.3℃,则称没有发生群体性发热.下列连续7天体温高于37.3℃人数的统计特征数中,能判定该公司没有发生群体性发热的为()A.中位数为3,众数为2B.均值小于1,中位数为1C.均值为2,标准差为√2D.均值为3,众数为4答案:BC分析:根据题意,设连续7天,每天体温高于37.3℃的人数分别为a,b,c,d,e,f,g,可得0≤a≤b≤c≤d≤e≤f≤g,然后根据选项,结合反例依次判定,即可求解.由题意,连续7天,每天体温高于37.3℃的人数分别为a,b,c,d,e,f,g,可得0≤a≤b≤c≤d≤e≤f≤g,对于A中,取2,2,2,2,3,4,6,则满足中位数为3,众数为2,但第7天的人数6>5,所以A不正确;对于B中,若g≥6,由中位数为1,可知均值为1(a+b+c+d+e+f+g)≥1,与均值小于1矛盾,所以7B正确;对于C中,当均值为2,标准差为√2时,a+b+⋯+g=14,且(a−2)2+⋯+(g−2)2=14,若g≥6,则(a−2)2+(b−2)2+⋯+(g−2)2>14,例如:1,1,1,1,2,3,5,符合题意,所以C正确;对于D中,取0,1,2,4,4,4,6,则满足均值为3,众数为4,但第7天人数6>5,所以D不正确.故选:BC.11、小明用某款手机性能测试APP对10部不同品牌的手机的某项性能进行测试,所得的分数按从小到大的顺序(相等数据相邻排列)排列为:81,84,84,87,x,y,93,96,96,99,已知总体的中位数为90,则()A.x+y=180B.该组数据的均值一定为90C.该组数据的众数一定为84和96D.若要使该总体的标准差最小,则x=y=90答案:ABD分析:依题意可得x+y=180,即可求出平均数,即可判断A、B,再利用特殊值判断C,利用基本不等式判断D;(81+84+84+87+x+y+93+解:因为总体的中位数为90,所以x+y=180,所以该组数据的均值为11096+96+99)=90,故A正确,B正确,当x=y=90时,众数为84,90,96,当x=87,y=93时,众数为84,87,93,96,故C错误;要使该总体的标准差最小,即方差最小,即(x−90)2+(y−90)2最小,又(x−90)2+(y−90)2≥(x+y−180)2=0,当且仅当x−90=y−90时,即x=y=90时等号成立,故D正确.2故选:ABD填空题12、某工厂为了解产品的生产情况,随机抽取了50个样本,若样本数据x1,x2,⋯,x50的方差为8,则数据3x1−1,3x2−1,⋯,3x50−1的方差为___________.答案:72分析:根据方差的性质可得答案.样本数据x1,x2,⋯,x50的方差为8,所以数据3x1−1,3x2−1,⋯,3x50−1的方差为32×8=72.所以答案是:72.13、某学校组织学生参加数学测试,成绩的频率分布直方图如下,数据的分组依次是[20,40),[40,60),[60,80),[80,100],则可估计这次数学测试成绩的第40百分位数是_________.答案:65分析:利用百分位数的定义求解.解:成绩在[20,60)的频率是(0.005+0.01)×20=0.3,成绩在[20,80)的频率为0.3+0.02×20=0.7,所以第40百分位数一定在[60,80)内,×20=65,所以这次数学测试成绩的第40百分位数是60+0.4−0.30.4所以答案是:65。

人教高中数学必修二B版《统计》统计与概率说课复习(数据的收集)

人教高中数学必修二B版《统计》统计与概率说课复习(数据的收集)
查(也称为全面调查).
(6)抽样调查:只抽取样本进行考察的方法称为抽样调查.
2.样本与样本容量有何区别?
提示:样本与样本容量是两个不同的概念,样本是从总体中抽出
的个体,是对象;样本容量是样本中包含的个体数目,是一个数.
课前篇自主预习



3.做一做:为了了解高一年级1 000名学生的考试成绩,从中随机
取一个容量为6的样本进行质量检验.如何用随机数表法设计抽样
方案?
解:第一步,将元件的编号调整为010,011,…,099,100,…,600.
第二步,在随机数表中任选一个行数作为开始,任选一方向作为
读数方向.
第三步,从选定的数开始读数,每次读取三位,凡不在010~600内的
数跳过去不读,前面已经出现的数也不读,依次可得到6个数.
课堂篇探究学习探究一探究二探究三探究四
思维辨析
当堂检测
反思感悟1.使用分层抽样的前提
分层抽样的适用前提条件是总体可以分层、层与层之间有明显
区别,而层内个体间差异较小.
2.使用分层抽样应遵循的原则
(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体
互不交叉,即遵循不重复、不遗漏的原则;
(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简
定义:一般地,如果相对于要考察的问题来说,总体可以分成有明
显差别的、互不重叠的几部分时,每一部分都可称为层,在各层中
按层在总体中所占比例进行随机抽样的方法称为分层随机抽样(简
称为分层抽样).
2.分层抽样有什么特点?
提示:(1)分层抽样适用于已知总体是由差异明显的几部分组成的;
(2)分成的各层互不交叉;
探究四

人教B版高中数学必修二课件 《统计》统计与概率PPT(数据的数字特征)

人教B版高中数学必修二课件 《统计》统计与概率PPT(数据的数字特征)
都等于样本平均数.
3.做一做:某学员在一次射击测试中射靶10次,命中环数如下:
7,8,7,9,5,4,9,10,7,4.
则:(1)平均命中环数为
;
(2)命中环数的标准差为
.
答案:(1)7 (2)2
7+8+7+9+5+4+9+10+7+4
解析:(1) =
=7.
10
1
(2)∵s2= 10
[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(107)2+(7-7)2+(4-7)2]=4,∴s=2.
探究四
当堂检测
1
解:(1)甲 = ×(99+100+98+100+100+103)=100,
1
6
乙 = ×(99+100+102+99+100+100)=100,
6
1
2

= 6×[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(1007
2
2
100) +(103-100) ]= ,
则没有众数.
课堂篇探究学习
探究一
探究二
探究三
探究四
当堂检测
延伸探究求出变式训练1中数据的众数与中位数.
解:众数为24与30.
1
中位数为×(22+24)=23.
2
课堂篇探究学习
探究一
探究二

新人教版高中数学必修第二册统计全套PPT课件

新人教版高中数学必修第二册统计全套PPT课件
9 .1 随机抽样
9 .1.1 简单随机抽样
新课程标准 1.通过实例,了解简单随机抽样的含义及其解决问题的过
程,掌握两种简单随机抽样方法:抽签法和随机数法. 2.会计算样本均值和总体均值,了解样本与总体的关系.
新学法解读 1.熟练掌握简单随机抽样的两种方法之间的差异分
析与优缺点判断. 2.通过设计抽签法或随机数法完成抽样,体会简单随
2.抽签法与随机数法的异同点 ①都属于简单随机抽样,并且要求被抽取样本的总
相同点 体的个体数有限; ②都是从总体中逐个不放回地进行抽取 ①抽签法比随机数法操作简单; ②随机数法更适用于总体中个体数较多的时候,而
不同点 抽签法适用于总体中个体数较少的情况,所以当总 体中的个体数较多时,应当选用随机数法,可以节 约大量的人力和制作号签的成本
用样本平均数估计总体平均数
[例 3] 某校为调查全校学生的睡眠时间,从全体学生中用随
机数法抽取了一个容量为 100 的简单随机样本,他们的睡眠时间
如下表(单位:h):
睡眠

[6,6.5) [6.5,7) [7,7.5) [7.5,8) [8,8.5) [8.5,9)
时间

人数 5
17
33
37
6
2 100
0702 3623 B.07 D.01
4369 4869
9728 6938
0198 7481
解析:从随机数表第 1 行的第 5 列和第 6 列数字开始由左 到右一次选取两个数字开始向右读,第一个数为 65,不 符合条件,第二个数为 72,不符合条件,第三个数为 08, 符合条件,以下符合条件的数字依次为 02,14,07,01,故第 5 个数为 01.故选 D.
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二章统计
一、三种抽样方法
1、统计的的基本思想是:用样本的某个量去估计总体的某个量
总体:在统计中,所有考察对象的全体。

个体:总体中的每一个考察对象。

样本:从总体中抽取的一部分个体叫做这个总体的一个样本。

样本容量:样本中个体的数目。

2、抽样方法:要求:总体中每个个体被抽取的机会相等
(1)简单随机抽样:抽签法和随机数表法
简单随机抽样的特点是:不放回、等可能.
抽签法步骤
(1)先将总体中的所有个体(共有N个)编号(号码可从1到N)
(2)把号码写在形状、大小相同的号签上,号签可用小球、卡片、纸条等制作
(3)将这些号签放在同一个箱子里,进行均匀搅拌(4)抽签时,每次从中抽出一个号签,连续抽取n次(5)抽出样本
随机数表法步骤
(1)将总体中的个体编号(编号时位数要统一);(2)选定开始的数字;(3)按照一定的规则读取号码;(4)取出样本
(2)系统抽样
系统抽样特点:容量大、等距、等可能.
步骤:
1.编号,随机剔除多余个体,重新编号
2.分组 (段数等于样本容量),确定间隔长度 k=N/n
3.抽取第一个个体编号为i
4.依预定的规则抽取余下的个体编号为i+k, i+2k, …
(3)分层抽样
分层抽样特点:总体差异明显、按所占比例抽取、等可能.
步骤:1.将总体按一定标准分层;
2.计算各层的个体数与总体的个体数的比;
3.按比例确定各层应抽取的样本数目
4.在每一层进行抽样 (可用简单随机抽样或系统抽样)
二、用样本估计总体
1、用样本的频率分布估计总体的分布
①作样本频率分布直方图的步骤:
(1)求极差;
(2)决定组距与组数; (组数=极差/组距)
(3)将数据分组;
(4)列频率分布表(分组,频数,频率);
(5)画频率分布直方图。

根据频率分布表做频率分布直方图应注意两点:
频率
⑴纵轴的意义:
组距
⑵横轴的意义:样本内容(每个矩形下面是组距).
例1、为了了解中学生的身高情况,对育才中学同龄的50名男学生的身高进行了测量,结果如下:(单位:cm)
175 168 180 176 167 181 162 173 171 177
171 171 174 173 174 175 177 166 163 160
166 166 163 169 174 165 175 165 170 158
174 172 166 172 167 172 175 161 173 167
170 172 165 157 172 173 166 177 169 181
列出样本的频率分布表,画出频率分布直方图.
解:在这个样本中,最大值为181,最小值为157,它们的差是24,可以取组距为4,分成7组,根据题意列出样本的频率分布表如下:
频率分布直方图(略)
②茎叶图作图步骤:
1.将每个数据分为茎(高位)和叶(低位)两部分.
2.将最小茎和最大茎之间的数按大小顺序排成一列,写在左(右)侧;
3.将各个数据的叶按大小次序写在其右(左)侧.
例、某中学高二(2)班甲、乙两名同学自高中以来每场数学考试成绩如下:
甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107;
乙的得分:83,86,93,99,88,130,98,114,98,79,101.
画出两人数学成绩茎叶图,请根据茎叶图对两人的成绩进行比较.
解:甲、乙两人数学成绩的茎叶图如下图:
甲乙
5 6
5 6 1 7 9
8 9 6 1 8 6 3 8
4 1
5 9 3 9 8 8
7 10 3 1
0 11 4
从这个茎叶图上可看出,乙同学的得分情况是大致对称的,中位数是99;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是89.因此乙同学发挥比较稳定,总体得分情况比甲同学好.
2、用样本的数据特征估计总体的数据特征
(1)、在频率直方图中计算众数、平均数、中位数
众数:在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。

中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等 平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和
(2)、标准差和方差:描述了数据的波动范围,离散程度
标准差s =
方差2222121[()()()]n s x x x x x x n
=
-+-+- 扩展: 1212,,,,,,,.n n x x x x mx a mx a mx a mx a ⋅⋅⋅++⋅⋅⋅++①若的平均数为则的平均数为 2221212,,,,,,,.n n x x x s ax b ax b ax b a s ⋅⋅⋅++⋅⋅⋅+②若的方差为则的方差为
3.两变量之间的关系
(1)相关关系——非确定性关系
(2)函数关系——确定性关系
4.回归直线方程:∧∧∧+=a x b y
⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∧∧====∧∑∑∑∑x b y a x n x y
x n y x x x y y x x b n i i n i i i n i i n i i i ,)())((1221121
(),.x y 说明:回归直线过定点
例如:
5. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。

其基本步骤是:①画出两个变量的散点图;
②求回归直线方程;
③并用回归直线方程进行预报。

相关文档
最新文档