第九章 9.2 第4课时总体离散程度的估计
人教A版高中数学必修第二册教学课件-第九章 -9-2-4总体离散程度的估计
高中数学 必修第二册 RJ·A
3.(多选)甲、乙两班举行电脑汉字录入比赛,参 赛学生每分钟录入汉字的个数经统计计算后填 入右表:
班级 甲 乙
参加人数 55 55
中位数 149 151
方差 191 110
平均数 135 135
某同学根据表中数据分析得出的结论正确的是 A.甲、乙两班学生成绩的平均数相同 B.甲班的成绩波动比乙班的成绩波动大 C.乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150为优秀) D.甲班成绩的众数小于乙班成绩的众数
由定义可知A正确,BC错误.
高中数学 必修第二册 RJ·A
5.现有10个数,其平均数是4,且这10个数的平方和是200,那么这组数的标准差是__2___.
解析 由题意知 x =4,x21+x22+…+x210=200,
s= 110[x1- x 2+x2- x 2+…+x10- x 2]
= 110x21+x22+…+x210-10 x 2=
高中数学 必修第二册 RJ·A
(2)根据图形和(1)中计算结果,对两人的训练成绩作出评价.
解 s2甲>s2乙可知乙的成绩较稳定. 从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动, 可知甲的成绩在不断提高,而乙的成绩则无明显提高.
高中数学 必修第二册 RJ·A
反思感悟
折线统计图中数字特征的求解技巧 根据折线统计图研究样本数据的数字特征与横坐标和纵坐标的统计意义有关,但一般情 况下,整体分布位置较高的平均数大,数据波动性小的方差小.
+(80-81.5)2+(85-81.5)2+(65-81.5)2+(90-81.5)2+(85-81.5)2]=75.25,
标准差为 s 乙= s2乙= 75.25≈8.67.
9_2_4 总体离散程度的估计
9.2.4总体离散程度的估计课标解读课标要求核心素养1.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差).2.理解离散程度参数的统计含义.1.通过对标准差、方差、极差概念的学习,培养学生数学抽象的核心素养.2.通过应用标准差、方差、极差估计总体的离散程度,提升学生数据分析的核心素养.帆板运动是指借助风帆力量,驾驭无舵、无座舱船只滑行前进的一项水上运动,它是介于帆船和冲浪之间的新兴水上运动项目.在帆板比赛中,成绩低分为优胜,共比赛11场,并以最佳的9场成绩计算最终的名次.在1996年美国亚特兰大奥运会上,中国香港风帆运动员李丽珊,以惊人的耐力和斗志,勇夺金牌,实现了中国香港体育史上奥运金牌零的突破.事实上,这枚金牌在比赛过程中就已经被预测出来了,下表是此次比赛前7场比赛结束后,排名前5位的选手积分,根据表中信息如何预测呢?这就是我们本节课要学习的内容.排名运动员比赛场次总分12345671李丽珊(中国香港)3222427222简度(新西兰)23611055323贺根(挪威)7844318354威尔逊(英国)55145564445李科(中国)4 135 9 2 7 6461.一组数据x 1,x 2,…,x n 的方差和标准差 数据x 1,x 2,…,x n 的方差为①1n ∑i=1n(x i -x)2=②1n ∑i=1nx i 2-x 2,标准差为③√1n ∑i=1n (x i -x)2.2.总体方差和总体标准差(1)总体方差和标准差:如果总体中所有个体的变量值分别为Y 1,Y 2,…,Y N ,总体的平均数为Y ,则称S 2=④1N ∑i=1N(Y i -Y)2为总体方差,S=⑤√S 2为总体标准差.(2)总体方差的加权形式:如果总体的N 个变量值中,不同的值共有k(k ≤N)个,不妨记为Y 1,Y 2,…,Y k ,其中Y i 出现的频数为f i (i=1,2,…,k),则总体方差为S 2=⑥1N ∑i=1kf i (Y i -Y)2.3.样本方差和样本标准差如果一个样本中个体的变量值分别为y 1,y 2,…,y n ,样本平均数为y ,则称s 2=⑦1n ∑i=1n(y i -y)2为样本方差,s=⑧2为样本标准差.4.标准差的意义标准差刻画了数据的⑨离散程度或⑩波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.特别提醒对标准差和方差概念的理解(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.(2)标准差、方差的取值范围:[0,+∞).标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性. (3)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差. 5.分层随机抽样的方差设样本容量为n,平均数为x ,其中两层的个体数量分别为n 1,n 2,两层的平均数分别为x 1,x 2,方差分别为s 12,s 22,则这个样本的方差为s 2=n 1n[s 12+(x 1-x )2]+n2n [s 22+(x 2-x )2].思考:甲班和乙班各有学生20人、40人,甲班的数学成绩的平均分为80分,方差为2,乙班的数学成绩的平均分为82分,方差为4,那么甲班和乙班这60人的数学成绩的平均分是80+822=81分吗?方差是2+42=3吗?为什么?提示 不是,因为甲班和乙班在这60人中的权重是不同的.探究一 方差和标准差的计算例1 某度假酒店为了了解会员对酒店的满意度,从中抽取了50名会员进行调查,把会员对酒店的“住宿满意度”与“餐饮满意度”都分成五个评分标准:1分(很不满意);2分(不满意);3分(一般);4分(满意);5分(很满意),其统计结果如下表(住宿满意度为x,餐饮满意度为y).餐饮满意度 人数住宿满意度12 3 4 51 1 12 1 0 2 2 13 2 1 3 1 2 5 34 4 0 35 4 3 5123(1)求“住宿满意度”分数的平均数;(2)求“住宿满意度”为3分时的5个“餐饮满意度”人数的方差和标准差. 解析 (1)5×1+9×2+15×3+15×4+6×550=3.16.(2)当“住宿满意度”为3分时的5个“餐饮满意度”人数的平均数为1+2+5+3+45=3,其方差 s 2=(1-3)2+(2-3)2+(5-3)2+(3-3)2+(4-3)25=2,所以其标准差为2√2≈1.414. 思维突破方差和标准差的算法1-1 已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x ,方差为s 2,则( ) A.x =4,s 2<2 B.x =4,s 2>2 C.x >4,s 2<2D.x >4,s 2>2答案 A ∵某7个数的平均数为4, ∴这7个数的和为4×7=28, ∵加入一个新数据4, ∴x =28+48=4.又∵这7个数的方差为2,且加入一个新数据4, ∴这8个数的方差s 2=7×2+(4-4)28=74<2,故选A.探究二 分层随机抽样的方差和标准差例2 将某班40名学生平均分成两组,两组学生某次考试的成绩情况如下表所示:组别 平均数 标准差 第一组 90 4 第二组806求该班学生这次考试成绩的平均数和标准差.解析 根据题意,得全班平均成绩 x =90×2040+80×2040=85.第一组的平均数x 1=90,方差s 12=16; 第二组的平均数x 2=80,方差s 22=36.则该班学生的方差s 2=2040×[s 12+(x 1-x )2]+2040×[s 22+(x 2-x )2]=12×[16+(90-85)2]+12×[36+(80-85)2]=51, ∴标准差s=√51.综上可得,该班学生这次考试成绩的平均数和标准差分别为85和√51. 思维突破计算分层随机抽样的方差s 2的步骤(1)确定x 1,x 2,s 12,s 22;(2)确定x ;(3)应用公式s 2=n1n [s 12+(x 1-x)2]+n2n [s 22+(x 2-x)2]计算s 2.2-1 已知某省只有二、三、四线城市,其数量之比为1∶3∶6,2019年8月份调查得知该省所有城市房产均价为1.2万元/平方米,方差为20,二、三、四线城市的房产均价分别为2.4万元/平方米,1.8万元/平方米,0.8万元/平方米,三、四线城市房价的方差分别为10,8,则该省二线城市的房价的方差为 . 答案 118.52解析 设该省二线城市的房价的方差为s 2,由题意可知,20=11+3+6×[s 2+(1.2-2.4)2]+31+3+6×[10+(1.2-1.8)2]+61+3+6×[8+(1.2-0.8)2],解得s 2=118.52,即该省二线城市的房价的方差为118.52.探究三 样本的数字特征的综合应用例3 某饮水机厂生产的A,B,C,D 四类产品,每类产品均有经济型和豪华型两种型号,某一月的产量如下表(单位:台):ABCD经济型 5 000 2 000 4 500 3 500 豪华型 2 000 3 000 1 500 500(1)在这一个月生产的饮水机中,用分层随机抽样的方法抽取n 台,其中有A 类产品49台,求n 的值;(2)用随机抽样的方法从C 类经济型饮水机中抽取10台进行质量检测,经检测它们的得分如下:7.9,9.4,7.8,9.4,8.6,9.2,10,9.4,7.9,9.4,从D 类经济型饮水机中抽取10台进行质量检测,经检测它们的得分如下:8.9,9.3,8.8,9.2,8.6,9.2,9.0,9.0,8.4,8.6,根据分析,你会选择购买C 类经济型饮水机还是D 类经济型饮水机?解析 (1)由题意得,饮水机的总数为5 000+2 000+2 000+3 000+4 500+1 500+3 500+500=22 000(台),则n22 000=497 000,解得n=154. (2)由题意知:x C =7.9+9.4+7.8+9.4+8.6+9.2+10+9.4+7.9+9.410=8.9,s C 2=2×(7.9-8.9)2+4×(9.4-8.9)2+(7.8-8.9)2+(8.6-8.9)2+(9.2-8.9)2+(10-8.9)210=0.56, x D =8.9+9.3+8.8+9.2+8.6+9.2+9.0+9.0+8.4+8.610=8.9,s D 2=2×(8.6-8.9)2+2×(9.0-8.9)2+2×(9.2-8.9)2+(8.4-8.9)2+(8.8-8.9)2+(8.9-8.9)2+(9.3-8.9)210=0.08,所以x C =x D ,s C 2>s D 2,所以我会选择购买D 类经济型饮水机.思维突破数据分析的要点要正确处理此类问题,首先要抓住问题中的关键词语,全方位地进行必要的计算、分析,而不能习惯性地仅从平均数的大小去决定哪一组的成绩好,解决像这样的实际问题还得从实际的角度去分析.3-1某校高三文科500名学生参加了3月份的高考模拟考试,学校为了了解高三文科学生的历史、地理学习情况,从500名学生中抽取100名学生的成绩进行统计分析,抽出的100名学生的地理、历史成绩如下表:地理人[80,100][60,80)[40,60)数历史[80,100]8m9[60,80)9n9[40,60)8157若历史成绩在区间[80,100]内的占30%.(1)求m,n的值;(2)请根据上面抽出的100名学生的地理、历史成绩,填写下面地理、历史成绩的频数分布表:[80,100][60,80)[40,60)地理历史根据频数分布表中的数据估计历史和地理的平均成绩及方差(同一组数据用该组区间的中点值作代表),并估计哪个学科的成绩更稳定.解析(1)由历史成绩在区间[80,100]内的占30%,可知8+m+9=0.3,100解得m=13,∴n=100-8-9-8-15-9-9-7-13=22.(2)地理、历史成绩的频数分布表如下:[80,100][60,80) [40,60) 地理 25 50 25 历史 3040 30x 地理=90×25+70×50+50×25100=70,s 地理2=1100×[25×(90-70)2+50×(70-70)2+25×(50-70)2]=200,x 历史=90×30+70×40+50×30100=70,s 历史2=1100×[30×(90-70)2+40×(70-70)2+30×(50-70)2]=240, ∴x 地理=x 历史,s 地理2<s 历史2,∴地理学科的成绩更稳定.1.甲、乙、丙、丁四人参加某运动会射击项目的选拔赛,四人的平均成绩和方差如下表所示:甲乙 丙 丁 平均成绩x 8.3 8.8 8.8 8.7 方差s 23.53.62.25.4若从这四个人中选择一人参加该运动会射击项目比赛,则最佳人选是( ) A.甲 B.乙 C.丙 D.丁答案 C 由题表中数据可知,丙的平均成绩最高,且方差最小,说明技术稳定,且成绩好. 2.已知一个样本中的数据为1,2,3,4,5,则该样本的标准差s 为( ) A.1B.√2C.√3D.2答案 B ∵样本容量n=5, ∴x =15×(1+2+3+4+5)=3,∴s=√15×[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=√2.3.在高一期中考试中,甲、乙两个班的数学成绩统计如下表:班级 人数 平均数 方差 甲 20 x 甲 2 乙30x 乙3其中x 甲=x 乙,则两个班数学成绩的方差s 2为( ) A.3B.2C.2.6D.2.5答案 C 由题意可知两个班的数学成绩的平均数为x =x 甲=x 乙,则两个班数学成绩的方差s 2=2020+30[2+(x 甲-x )2]+3020+30[3+(x 乙-x )2]=2020+30×2+3020+30×3=2.6.4.在教学调查中,甲、乙、丙三个班的数学测试成绩分布如图,假设三个班的平均分都是75分,s 1,s 2,s 3分别表示甲、乙、丙三个班数学测试成绩的标准差,则有( )A.s 3>s 1>s 2B.s 2>s 1>s 3C.s 1>s 2>s 3D.s 3>s 2>s 1答案 D 题中所给图是成绩分布图,平均分是75分,在题图1中,集中在75分附近的数据最多,题图3中,从50分到100分均匀分布,所有成绩不集中在任何一个数据附近,题图2中,介于两者之间.由标准差的意义可得s 3>s 2>s 1.数据分析——利用频率分布直方图估计样本的方差随着高校强基计划招生活动的持续开展,我市高中生掀起了参与数学兴趣小组的热潮.为调查我市高中生对数学学习的喜好程度,从甲、乙两所高中各自随机抽取了40名学生,记录他们在一周内平均每天学习数学的时间,并将其分成了6个区间:(0,10]、(10,20]、(20,30]、(30,40]、(40,50]、(50,60],整理得到如下频率分布直方图:(1)试估计甲高中学生一周内平均每天学习数学的时间的中位数m 甲(精确到0.01); (2)判断从甲、乙两所高中各自随机抽取的40名学生一周内平均每天学习数学的时间的平均值x 甲与x 乙及方差s 甲2与s 乙2的大小关系(只需写出结论),并计算其中的x 甲、s 甲2(同一组中的数据用该组区间的中点值作代表).解析 (1)由题中甲高中频率分布直方图可得第一组频率是0.1,第二组频率是0.2,第三组频率是0.3,所以中位数在第三组,即m 甲=20+0.5-0.1-0.20.3×10≈26.67.(2)根据题中两个频率分布直方图可得x 甲<x 乙,s 甲2>s 乙2,x 甲=5×0.01×10+15×0.02×10+25×0.03×10+35×0.02×10+45×0.015×10+55×0.005×10=27.5,s 甲2=140×[(5-27.5)2×4+(15-27.5)2×8+(25-27.5)2×12+(35-27.5)2×8+(45-27.5)2×6+(55-27.5)2×2]=178.75.素养探究:此类题考查了频率分布直方图,根据两组直方图特征判断平均数、中位数和方差的大小关系.求中位数、平均数和方差的关键是熟练掌握相关数据的求法,准确计算得解,在此过程中体现了数学运算和数据分析的核心素养.为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如下表:天数 151~ 180 181~210 211~240 241~270 271~300 301~330 331~360 361~390灯管数1 11 18 20 25 16 72(1)试估计这种日光灯的平均使用寿命; (2)若定期更换,则选择多长时间统一更换合适?解析 (1)各组区间的中点值分别约为165,195,225,255,285,315,345,375,由此可算得这种日光灯的平均使用寿命约为165×1%+195×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天).答:估计这种日光灯的平均使用寿命为268天.(2)1100×[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+25×(285-268)2+16×(315-268)2+7×(345-268)2+2×(375-268)2]=2 128.60. 故其标准差为√2 128.60≈46.故在222天到314天之间统一更换较合适.1.样本a,3,5,7的平均数是b,且a,b 是方程x 2-5x+4=0的两根,则这个样本方差是( ) A.3B.4C.5D.6答案 C2.高三学生李丽在五次数学模拟考试中的成绩(单位:分)为x,y,105,109,110.已知该同学五次数学成绩的平均数为108,方差为35.2,则|x-y|的值为( ) A.15 B.16 C.17 D.18 答案 D3.若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( ) A.8B.15C.16D.32答案C已知样本数据x 1,x2,…,x10的标准差s=8,则s2=64,数据2x1-1,2x2-1,…,2x10-1的方差为22s2=22×64,所以其标准差为√22×64=2×8=16,故选C.4.(多选题)PM2.5是衡量空气质量的重要指标.下图是某地9月1日到10日的PM2.5日均值(单位:μg/m3)的折线图,则下列说法正确的是()A.这10天中PM2.5日均值的众数为33B.这10天中PM2.5日均值的中位数是32C.这10天中PM2.5日均值的中位数大于平均数D.这10天中PM2.5日均值前4天的方差大于后4天的方差答案ABD由题图得,这10天中PM2.5日均值的众数为33,中位数为31+332=32,平均数是39.9,故中位数小于平均数;PM2.5日均值前4天的数据波动比后4天的波动大,故前4天的方差大于后4天的方差.故选ABD.5.若五个数据:1,2,3,4,a的平均数是3,则a=,这五个数的标准差是.答案5;√2解析∵1+2+3+4+a5=3,∴a=5.∴方差s2=15×[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2,∴标准差s=√2.6.统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下表:运动员第1次第2次第3次第4次第5次甲8791908993乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为.答案2解析x甲=15×(87+91+90+89+93)=90,x 乙=15×(89+90+91+88+92)=90,s 甲2=15×[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4, s 乙2=15×[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2. ∴s 甲2>s 乙2,∴乙运动员的成绩较为稳定.7.已知样本9,10,11,x,y 的平均数是10,方差是4,则xy= . 答案 91 解析 由题意得{9+10+11+x +y =5×10,15×[(9-10)2+(10-10)2+(11-10)2+(x-10)2+(y-10)2]=4,即{x +y =20,(x -10)2+(y -10)2=18,解得{x =7,y =13或{x =13,y =7,所以xy=91.8.随着“互联网+交通”模式的迅猛发展,“共享单车”在很多城市相继出现.某运营公司为了了解某地区用户对其所提供的服务的满意度,随机调查了10名用户,得到用户的满意度评分分别为92,84,86,78,89,74,83,78,77,89. (1)计算样本的平均数x 和方差s 2;(2)在(1)的条件下,若用户的满意度评分在(x -s,x +s)之间,则满意度等级为“A 级”.试估计该地区满意度等级为“A 级”的用户所占的百分比. 参考数据:√33≈5.74.解析 (1)由题意知,x =110×(92+84+86+78+89+74+83+78+77+89)=83,s 2=110×[(92-83)2+(84-83)2+(86-83)2+(78-83)2+(89-83)2+(74-83)2+(83-83)2+(78-83)2+(77-83)2+(89-83)2]=33.(2)由(1)知,用户的满意度评分在(83-√33,83+√33)之间时,满意度为“A 级”,即用户的满意度评分在(77.26,88.74)之间时, 满意度为“A 级”,因为调查的10名用户满意度评分数据中,在(77.26,88.74)内的共有5名, 所以该地区满意度等级为“A 级”的用户所占的百分比约为510×100%=50%.9.某学校共有学生2 000人,其中高一800人,高二、高三各600人,学校对学生在暑假中每天的读书时间做了调查统计,全体学生每天的读书时间的平均数为x =3,方差为s 2= 2.003,其中高一学生、高二学生每天读书时间的平均数分别为x 1=2.6,x 2=3.2,又已知三个年级学生每天读书时间的方差分别为s 12=1,s 22=2,s 32=3,则高三学生每天读书时间的平均数x 3=( )A.3.3或2.7B.3.3C.2.7D.4.5或3.2答案 A 由题意可得2.003=8002 000×[1+(3-2.6)2]+6002 000×[2+(3.2-3)2]+6002 000×[3+(x 3-3)2], 解得x 3=3.3或x 3=2.7.10.甲、乙、丙三名学生在一项集训中的40次测试分数都在[50,100]内,将他们的测试分数分别绘制成频率分布直方图,如图所示,记甲、乙、丙的分数标准差分别为s 1,s 2,s 3,则它们的大小关系为( )A.s 1>s 2>s 3B.s 1>s 3>s 2C.s 3>s 1>s 2D.s 3>s 2>s 1答案 B 比较题中三个频率分布直方图知,甲为“双峰”直方图,两端数据最多,最分散,方差最大;乙为“单峰”直方图,数据最集中,方差最小;丙为“单峰”直方图,但数据分布相对均匀,方差介于甲、乙之间.综上可知s 1>s 3>s 2.11.(多选题)甲、乙两班举行电脑汉字录入比赛,参赛学生每分钟录入汉字的个数经统计计算后填入下表,某同学根据表中数据分析得出的结论正确的是( )班级 参加人数 中位数 方差 平均数 甲 55 149 191 135 乙55151110135A.甲、乙两班学生成绩的平均数相同B.甲班的成绩波动比乙班的成绩波动大C.乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150个为优秀)D.甲班成绩的众数小于乙班成绩的众数答案 ABC 甲、乙两班学生成绩的平均数都是135,故两班学生成绩的平均数相同,故A中结论正确;s 甲2=191>110=s 乙2,甲班成绩不如乙班稳定,即甲班的成绩波动较大,故B 中结论正确;甲、乙两班人数相同,但甲班的中位数为149,乙班的中位数为151,从而易知乙班每分钟输入汉字数不少于150个的人数要多于甲班,故C 中结论正确;由题表看不出两班学生成绩的众数,故D 中结论错误.故选ABC.12.由正整数组成的一组数据为x 1,x 2,x 3,x 4,其平均数和中位数都是2,且标准差等于1,则这组数据为 (从小到大排列). 答案 1,1,3,3解析 不妨设x 1≤x 2≤x 3≤x 4且x 1,x 2,x 3,x 4为正整数.由题意知{x 1+x 2+x 3+x 44=2,x 2+x 32=2,即{x 1+x 2+x 3+x 4=8,x 2+x 3=4,又x 1,x 2,x 3,x 4为正整数,∴x 1=x 2=x 3=x 4=2或x 1=1,x 2=x 3=2,x 4=3或x 1=x 2=1,x 3=x 4=3.∵s=√14×[(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2]=1, ∴x 1=x 2=1,x 3=x 4=3. 由此可得4个数分别为1,1,3,3.13.某学校统计教师职称及年龄,中级职称教师的人数为50,其平均年龄为38岁,方差是2,高级职称的教师3人58岁,5人40岁,2人38岁,求该校中级职称和高级职称教师年龄的平均数和方差.解析 由题意可知高级职称教师的平均年龄x 高=3×58+5×40+2×383+5+2=45(岁),年龄的方差s 高2=13+5+2×[3×(58-45)2+5×(40-45)2+2×(38-45)2]=73,所以该校中级职称和高级职称教师的平均年龄为 x =5050+10×38+1050+10×45≈39.2(岁),该校中级职称和高级职称教师的年龄的方差是 s 2=5050+10×[2+(38-39.2)2]+1050+10×[73+(45-39.2)2]≈20.64.14.(多选题)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据信息如下,则一定符合该标志的是( ) A.甲地:中位数为2,极差为5 B.乙地:总体平均数为2,众数为2 C.丙地:总体平均数为1,总体方差大于0 D.丁地:总体平均数为2,总体方差为3答案 AD 对于A,因为甲地的中位数为2,极差为5,故最大值不会大于2+5=7.故A 正确; 对于B,若乙地过去10天分别为0,0,0,2,2,2,2,2,2,8,则满足总体平均数为2,众数为2,但不满足每天新增疑似病例不超过7人,故B 错误;对于C,若丙地过去10天分别为0,0,0,0,0,0,0,0,1,9,则满足总体平均数为1,总体方差大于0, 但不满足每天新增疑似病例不超过7人,故C 错误;对于D,利用反证法,若至少有一天疑似病例超过7人,则最小方差为110×(8-2)2=3.6>3.与题设相矛盾,故连续10天,每天新增疑似病例不超过7人.故D 正确.故选AD. 15.在一次科技知识竞赛中,某学校的两组学生的成绩如下表:分数 50 60 70 80 90 100人数甲组 2 5 10 13 14 6 乙组 4 4 16 2 12 12请根据你所学过的统计知识,判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由. 解析 ①甲组成绩的众数为90,乙组成绩的众数为70,从成绩的众数比较看,甲组成绩好些. ②x 甲=12+5+10+13+14+6×(50×2+60×5+70×10+80×13+90×14+100×6)=150×4 000=80, x 乙=14+4+16+2+12+12×(50×4+60×4+70×16+80×2+90×12+100×12)=150×4 000=80,s 甲2=12+5+10+13+14+6×[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=172,s 乙2=14+4+16+2+12+12×[4×(50-80)2+4×(60-80)2+16×(70-80)2+2×(80-80)2+12×(90-80)2+12×(100-80)2]=256.∵x 甲=x 乙,s 甲2<s 乙2,∴甲组成绩比乙组成绩更稳定,故甲组成绩好些.③甲、乙两组成绩的中位数、平均数都是80分.其中,甲组成绩在80分以上(包括80分)的有33人,乙组成绩在80分以上(包括80分)的有26人.从这一角度看,甲组的成绩较好. ④从题中的成绩统计表看,甲组成绩大于等于90分的有20人,乙组成绩大于等于90分的有24人,所以乙组成绩集中在高分段的人数多.同时,乙组得满分的人数比甲组得满分的人数多6人.从这一角度看,乙组的成绩较好.。
9.2.4 总体离散程度的估计 教学设计(1)-人教A版高中数学必修第二册
9.2.4 总体离散程度的估计教学设计(1)-人教A版高中数学必修第二册一、教学目标1.了解总体离散程度的概念和计算方法;2.掌握离散系数的计算方法;3.能够运用离散系数解决实际问题。
二、教学内容1.总体离散程度的概念;2.离散系数的计算方法;3.实际问题的解决方法。
三、教学重点1.总体离散程度的概念;2.离散系数的计算方法。
四、教学难点1.离散系数的计算方法;2.实际问题的解决方法。
五、教学过程1. 导入与引入(5分钟)引导学生思考:学过方差和标准差后,我们知道它们分别可以描述一个数据集的离散程度和分布情况。
那么,如果我们想要描述一个总体的离散程度,应该怎么办呢?导入新知:今天,我们将学习总体离散程度的估计方法。
通过计算总体的离散程度,我们可以更好地了解数据的分布情况。
2. 概念讲解(15分钟)引导学生思考:对于一个总体,我们希望得到它的离散程度。
你认为我们可以用什么指标来表示总体的离散程度呢?引入概念:离散系数是一个常用的指标,用来衡量总体的离散程度。
它的计算方法是通过总体标准差和总体均值之间的比值来得到的。
如果离散系数较小,说明总体的离散程度较小,数据较为集中;如果离散系数较大,说明总体的离散程度较大,数据较为分散。
示例展示:通过一个实际例子,向学生演示离散系数的计算方法。
3. 离散系数计算方法(25分钟)引导讨论:通过示例演示,引导学生讨论离散系数的计算方法。
步骤一:计算总体的标准差。
步骤二:计算总体的均值。
步骤三:用总体的标准差除以总体的均值,得到离散系数。
示例练习:提供几个练习,让学生独立计算离散系数。
4. 实际问题解决方法(25分钟)引导思考:离散系数是一个可以应用于实际问题的指标。
你能想到哪些实际问题可以通过计算离散系数来解决呢?示例讲解:给出几个实际问题,分析问题的背景和要求,引导学生运用离散系数解决问题。
5. 拓展应用(10分钟)拓展思考:离散系数在实际应用中还有哪些拓展的可能性?小组讨论:将学生分成小组,让他们思考离散系数在其他领域的应用,并在小组内展开讨论。
第9章 9.2.4 总体离散程度的估计
[s2+(1.2-2.4)2]+
3 1+3+6
[10+(1.2-1.8)2]+
1+63+6[8+(1.2-0.8)2],
解答s2=118.52,即二线城市的房价的方差为118.52.]
栏目导航
数据的数字特征的综合应用 [探究问题] 1.对一组数据进行统计分析,应该从哪几个方面进行? [提示] 平均数反映数据的平均水平,用众数反映数据的最大 集中点,用中位数反映数据的集中趋势和一般水平,用标准差或方 差反映数据的离散程度. 2.对比两组数据时,要从哪几个方面进行? [提示] 从众数、中位数、平均数和方差等几个方面.
栏目导航
2.已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为
() A.1
B. 2
C. 3
D.2
B [∵样本容量n=5,∴-x =15(1+2+3+4+5)=3, ∴s=
15[1-32+2-32+3-32+4-32+5-32]= 2.]
栏目导航
3.某学员在一次射击测试中射靶10次,命中环数如下:
90×12+100×12)
=510×4 000=80.
栏目导航
s
2
甲
=
1 2+5+10+13+14+6
[2×(50-80)2+5×(60-80)2+10×(70
-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=172,
s
2
乙
=
1 4+4+16+2+12+12
[4×(50-80)2+4×(60-80)2+16×(70
[解] 甲的平均成绩和方差如下: -x 甲=18(1.70+1.65+1.68+1.69+1.72+1.73+1.68+1.67)=1.69, s2甲=81[(1.70-1.69)2+(1.65-1.69)2+…+(1.67-1.69)2]=0.000 6. 乙的平均成绩和方差如下: -x 乙=18(1.60+1.73+1.72+1.61+1.62+1.71+1.70+1.75)=1.68,
人教版高中数学必修第二册9.2 9.2.4 总体离散程度的估计
上一页
返回导航
下一页
第九章 统计
33
解:(1)-x 甲=16 ×(99+100+98+100+100+103)=100(cm);
- x
乙=16
×(99+100+102+99+100+100)=100(cm).
s2甲 =16 ×[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2
上一页
返回导航
下一页
第九章 统计
24
计算分层随机抽样的方差 s2 的步骤 (1)确定 x 1, x 2,s21 ,s22 ; (2)确定 x ; (3)应用公式 s2=nn1 [s21 +( x 1- x )2]+nn2 [s22 +( x 2- x )2]计算 s2.
上一页
返回导航
下一页
第九章 统计
上一页
返回导航
下一页
第九章 统计
32
甲、乙两机床同时加工直径为100 cm的零件,为检验质量, 从中抽取6件,测量数据为(单位:cm): 甲:99 100 98 100 100 103 乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差; (2)根据计算说明哪台机床加工零件的质量更稳定.
上一页
返回导航
下一页
第九章 统计
高中数学第9章统计9-2用样本估计总体9-2-4总体离散程度的估计课件新人教A版必修第二册
(2)由题意, x =210(2.5×4+7.5×8+12.5×5+17.5×2+22.5×1)=
9.5.
s2
=
1 20
[(2.5
-
9.5)2×4
+
(7.5
-
9.5)2×8
+
(12.5
-
9.5)2×5
+
ቤተ መጻሕፍቲ ባይዱ
(17.5
-
9.5)2×2+(22.5-9.5)2×1]=28.5.
题型二
标准差、方差的性质
典例 2 (1)已知一组数据x1,x2,…,xn的方差是a,求另一组数 据x1-2,x2-2,…,xn-2的方差;
[解析] 由题意可知-x 甲=60,甲队队员在所有队员中所占权重为 1+1 4=15,
-x 乙=70,乙队队员在所有队员中所占权重为1+4 4=45, 则甲、乙两队全部队员的平均体重为-x =15×60+45×70=68(kg), 甲、乙两队全部队员的体重的方差为 s2=15[200+(60-68)2]+45[300+(70-68)2]=296.
[解析] 把甲同学抽取的样本的平均数记为-x ,方差记为 s2x;把乙同 学抽取的样本的平均数记为-y ,方差记为 s2y;把合在一起后的样本的平 均数记为-a ,方差记为 s2.
则-a =10×150+ +88×6≈5.4,
s2=10×[s2x+-x --a 120]++88×[s2y+-y --a 2] =10×[9+5-5.42]+ 188×[16+6-5.42] ≈12.4. 即样本的平均数为5.4,方差为12.4.
[解析] (1)由图可知,甲打靶的成绩为9,5,7,8,7,6,8,6,7,7,乙打靶的 成绩为2,4,6,8,7,7,8,9,9,10.
新教材高中数学第九章统计9.2.4总体离散程度的估计课件新人教A版必修第二册ppt
(2)先比较平均数的大小,再比较方差的大小.
解:(1)甲的极差为 103-98=5,乙的极差为 102-99=3.
甲 = (99+100+98+100+100+103)=100,
乙 = (99+100+102+99+100+100)=100,
- .
③样本方差、样本标准差的定义:如果一个样本中个体的变
量值分别为 y1,y2,…,yn,样本平均数为,则称
为样本方差,s= 为样本标准差.
s2= ∑
=
-
④特征:标准差、方差刻画了数据的离散程度或波动幅度,标
准差越大,数据的离散程度越大;标准差越小,数据的离散程度
答案:(1)B (2)6
【思考辨析】
判断下列说法是否正确,正确的在后面的括号内画“ ”,错误
的画“×”.
(1)极差对一组数据中的极端值非常敏感.( √ )
(2)方差与原始数据的单位一致.( × )
(3)标准差、方差越小,数据的离散程度越大,即数据离平均数
波动的幅度越大.( × )
(4)平均数和标准差一起能反映数据取值的更多信息.( √ )
越小.在刻画数据的分散程度上,方差和标准差是一样的.但在
解决实际问题中,一般多采用标准差.
3.做一做:
(1)甲、乙两位同学都参加了由学校举办的7场篮球比赛,平均
得分均为16分,标准差分别为5.09和3.72,则甲、乙两同学在这
次篮球比赛活动中,发挥得更稳定的是(
)
9.2.4 总体离散程度的估计
3
7
-
72
8
-
72
2
9
-
72
10
5
-
72
2 4
-
72
10
-
72
4
加权平均数和加权方差
x 数据 xx211 x2 xn
频数 f1 f 2
fn
数据 x1 x2 xn 频率 p1 p2 pn
加权平均数
x
x1
f
1
x2
f
2
xn
n
f n
3、6、9、12、15。 求这三组数据的平均数、方差和标准差。
平均数
方差
标准差
1、2、3、4、5
3
2
2
11、12、13、14、15
13
2
2
3、6、9、12、15
9
18
32
对照以上结果,你能从中发现哪些有趣的结论?
已知一组数据x1,
x2 ,
,
xn的平均数为x,
标准差为s,
方差为s
2
s s 1若一组新数据为x1 b, x2 b, , xn b.则它们的平均数为x___b____
( xn
x)2
7 - 72 8 - 72 7 - 72 9 - 72 5 - 72 4 - 72 9 - 72 10 - 72 7 - 72 4 - 72
10
4
数据 7
8
9
5
4
10
频数 3
9.2.4总体离散程度的估计
有没有更好的方法刻画数据的离散程度?
观察下图,思考成绩波动情况与各成绩到平均成绩的距离有什么 关系?
新知探究
发现:若射击成绩稳定,则大多数射击成绩离平均成绩不会太远;
反之则会离平均成绩较远;因此可以通过这两组射击成绩与它们 的平均成绩的“平均距离”来度量成绩的波动幅度
如何定义“平均距离”?
假设一组数据是x1,x2,…,xn,用 x 表示这组数据的平均数.我们用每
50 我们计算出总样本的方差为51.4862,并据此估计高一年级学生的身高的 总体方差为51.4862.
新知探究
归纳总结:分层随机抽样的方差
设样本中不同层的平均数分别为x1, x2 ,, xn ,方差为s12, s22 ,
, sn2,相应的权重分别为1,2,,n ,则这个样本的方差为
n
s2 i[si2 (xi x)2 ](x 为样本平均数).
x22
xn2)
2
nx
2 x( x1
x2
xn
)]
1 n
n i 1
xi2
2
x
2
2x
1 n
n i 1
xi2
2
x
方差等于逐项数据平方和的平均数减去平均数的平方
新知探究
完成教材P215练习题1,2,3
新知探究
例1 若在身高调查中采用抽样调查,抽取男生23人,其平均数和方
差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为
新知探究
试归纳计算方差的基本步骤:
①计算平均值 ②计算每个数据与平均值的差的平方 ③将所有平方相加 ④将上述平方和除以数据个数
新知探究
想一想,方差的单位是什么?与原始单位一致吗?
9.2.4总体离散程度的估计课件高一下学期数学人教A版(2)
甲
20
-
x甲
2
乙
30
-
x乙
3
其中x-甲=x-乙,则两个班数学成绩的方差为( C )
A.3
B.2
C.2.6
D.2.5
解析:由题意可知两个班的数学成绩平均数为x-=x-甲=x-乙, 则两个班数学成绩的方差为
s2=202+030[2+(x-甲-x-)2]+203+030[3+(x-乙-x-)2]
=202+030×2+203+030×3=2.6.答案:C
i 1
23
2
( xi x x z)
i 1
23
23
23
= ( xi x)2 2( x z) ( xi x) ( x z)2,
i 1
i 1
i 1
23
23
= ( xi x)2 ( x z)2 .
i 1
i 1
23
2 23
23
同理 ( yi y y z) = ( yi y)2 ( y z)2 .
2 y
,
s2
1 50
[23sx2
+23(
x
z)2
27s
2 y
+27(
y
z)2 ]
1 50
{23[s
2 x
+( x
z)2 ]
27[s
2 y
+(
y
z)2 ]}.
由 x=170.6, y=160.6,
根据按比例分配分层随机抽样总样本平均数与各层样本平均数的关系, 可得总样本平均数为 z 23 x 27 y
的方差为___1_2_4___.
解析:由题意知,样本的平均数x-=20×7200+ +3300×50=58, 故样本的方差 s2=202+030[42+(70-58)2]+203+030[62+(50-58)2]=124. 答案:124
人教A版9.2.4总体离散程度的估计课件(共31张)
若总体的N个变量中,不同的值共有k(k N)个,不妨
记为Y1,Y2 Yk ,其中Yi出现的频数为fi (i 1,2,, k)
则总体方差为
S2
1 N
k i1
fi (Yi
2
Y) .
• 样本方差和样本标准差
若一个样本中个体的变量值分别为y1, y2,, yn, 总体平均数为y,则称
为样本方差,
s2
i 1
i 1
27
同理可得 2( yj y)( y z ) 0 . j 1
因此,
s2
1 50
23
[(
i 1
xi
x )2
23
(x
i 1
z )2
27
(yj
j 1
y)2
27
(y
j 1
z )2 ]
1 50
{23[sx2
(x
z
)2
]
27[sy2
(
y
z
)2 ]}.
①
由 x 170.6, y 160.6 ,根据按比例分配分层随机抽样总样本平均数与各层样
+
92-
314 3
2
361.2
S乙2 =
1 6
108-112.52
+ 116-112.52
+ 89-112.52
+ 123-112.52
+ 126-112.52
+
113-112.52
=146.25 ,
S甲2 S乙2 ,所以乙比甲成绩稳定.故选:B
3.(多选题)随着互联网和物流行业的快速发展,快递业务已经成为人们日常生活当中不可或缺的重要组成部分.下 图是 2012—2020 年我国快递业务量变化情况统计图,则关于这 9 年的统计信息,下列说法错误的是( )
9.2.4总体离散程度的估计课件(人教版)
答案:B 解析: 数据 x1 , x2 , x3 ,…, xn 是上海普通职工 n(n 3, n N* ) 个人的年收入, xn1 为世界首富的年收入, xn1 会远大于 x1 , x2 , x3 ,…, xn 中任意一个, 这 n 1 个数据中,年收入平均数大大增大;中位数可能不变,也可能稍微变大; 数据的集中程度受到 xn1 比较大的影响,因而更加离散,方差变大.故选 B.
等待时间
[0, 5)
[5,10)
[10,15)
[15, 20)
[20, 25]
频数
4
8
5
2
1
用上述分组资料计算出病人平均等待时间的估计值 x _________,病人等待时间 方差的估计值 s2 ________.
答案:9.5;28.5 解析: x 1 (2.5 4 7.58 12.5 5 17.5 2 22.51) 9.5 ,
a1
a2
a3
a13 90 ,
其方差为
s2
1 15
(96
90)2
(58
90)2
a1
902
a2
90)2
a13
902
88
.
12.从甲、乙两种玉米的苗中各抽 10 株,分别测它们的株高如下:(单位:cm) 甲:25 41 40 37 22 14 19 39 21 42; 乙:27 16 44 27 44 16 40 40 16 40. (1)哪种玉米的苗长得高? (2)哪种的苗长得齐?
100 5
5
11.一个项目由 15 个专家评委投票表决,剔除一个最高分 96,一个最低分 58 后 所得到的平均分为 92,方差为 16,那么原始得分的方差为_______.
新教材高中数学第9章统计9.2.4 总体离散程度的估计
讲 课
则称 s2
人
:
邢
1 n
n
(yi
i1
y )2 为样本方差,s s2 为样本标准差
启 强
8
学习新知
思考:对于一个容量为2的样本:x1,x2(x1<x2),
则 x x1 x2 , s
2
x2 x1 2
在数轴上,这两个统计数据有什么几何意义?由此 说明标准差的大小对数据的离散程度有何影响?
标准差刻画了数据的离散程度或波动幅度,标准差 越大,数据的离散程度越大,数据较分散;标准差越小, 数据的离散程度越小 ,数据较集中在平均数周围显
数据的平均数设想通过各数据到其平均数的平均距离
来反映样本数据的分散程度,那么这个平均距离如何
计算? | x1 x | | x2 x |
| xn x |
n
为了避免式中含有绝对值,通常改用平方来代替,即
(x1 x)2 (x2 x)2 n
(xn
x )2
即1 n
n i 1
( xi
x )2
我们称上式为这组数据的方差
i1
x2
我们称上式为这组数据的标准差(standard deviation).
那么标准差的取值范围是什么? 标准差为0的数据有何特点?
s≥0,标准差为0的数据都相等.
讲
课
人
:
邢
启 强
7
学习新知
如果总体中所有个体的变量值分别为Y1,Y2,…,YN, 总体平均数为 Y ,则称
S2
1 N
N
(Yi
i1
Y )2
人
: 邢 启 强
平方根来描述.
15
课堂小结
(5)标准差的大小不会越过极差.
9.2.4 总体离散程度的估计
解:把男生样本的平均数记为
x
,方差记为
s
2 x
;把女
生的平均数记为
y
,方差记为
s
2 y
;把总样本数据的平
均数记为 z ,方差记为 s2 .
z 23x 27 y 165.2 23 27
讲 课 人
s2
1 50
{23[sx2
(x
z )2]
27[s
2 y
(y
z
)2 ]}
51.4862
:
邢
启 强
11
巩固练习
讲
课
人
:
邢
启 强
18
典型例题
例4 以往招生统计显示,某所大学录取的新生 高考总分的中位数基本稳定在550分,若某同学 今年高考得了520分,他想报考这所大学还需收 集哪些信息?
要点: (1)查往年录取的新生的平均分数.若平均数小于中位 数很多,说明最低录取线较低,可以报考; (2)查往年录取的新生高考总分的标准差.若标准差较 大,说明新生的录取分数较分散,最低录取线可能较低, 可以考虑报考.
讲
课
人
:
邢
启 强
19
讲 课
计算出样本平均数
x
=
8.79
,样本标准差s≈
6.20.
人
:
邢
启 强
14
实际应用
如图所示,可以发现,这100个数据中大部分落在 区间[x s, x s] 内,在区间 [x 2s, x 2s]外的只有7个. 也就是说,绝大部分数据落在 [x 2s, x 2s] 内.
x s 2.59,
则x=
x1 + x2 , 2
s=
9.2.4总体离散程度的估计
x12
2x1
x
2
x
x22
2x2
x
2
x
xn2
2xn
x
2
x
1 n
x12 x22 xn2
1
2
x
x1
x2
xn
1 n
2
2
2
x x x
1 n
n i1
xi 2
2
2x
2
x
1 n
n i1
xi 2
2
x
方差的单位是原始数据的单位的平方,与原始数据不一致.
标准差的单位与原始数据一致.在解决实际问题中,一般多采用
如果射击成绩稳定,那么大多数的射击成绩离平均成绩 不会太远;否则,会比较远.因此,可以用这个量度量成绩的 波动幅度.
假设一组数据是 x1, x2,, xn, 用 x 表示这组数据的平均数.
我们用每个数据与平均数的差的绝对值作为“距离”,即
xi x i 1,2,, n
作为 xi 到 x 的“距离”.
甲成绩比较分散,乙成绩相对集中.即甲的成绩波动幅度比 较大,而乙的成绩比较稳定.
思考:如何度量成绩的这种差异呢? 一、极差:
甲命中环数的极差=10-4=6, 乙命中环数的极差=9-5=4.
甲的成绩波动范围比乙的大,极差在一定程度上刻画了 样本数据的离散程度. 思考:为什么说“一定程度”呢?
因为极差只使用了数据中最大、最小两个值的信息,对 其他数据的取值情况没有涉及,所以极差所含的信息量很少.
1 50
23 i1
2 27
xi x x z
j1
2 yj y y z
s2
1 50
23 i1
高一下学期数学人教A版必修第二册9.2.4总体离散程度的估计课件
我们知道,如果射击的成绩很稳定,那么大多数的射击成绩离 平均成绩不会太远;相反,如果射击的成绩波动幅度很大,那么大 多数的射击成绩离平均成绩会比较远.
因此,我们可以通过这两组射击成绩与它们的平均成绩的“平 均距离”来度量成绩的波动幅度.
平均距离?
思考 如何定义“平均距离”?
1 n
可以得到这组数据x1,
x2,…,
xn到
的 x“
平均距离”为
n
|xi
i 1
x|.
为了避免式中含有绝对值,通常改用平方来代替,即
1 n
n i 1
( xi
x)2
方差
方差刻画了数据的离散程度或波动幅度,方差越大,数据的离散程度 越大;方差越小,数据的离散程度越小.
教材知识梳理
1.假设一组数据为x1,x2,…,xn,则这组数据的平均数x =
x
-
z
27
)2+
j=1
(yj-
y
27
)2+
j=1
(
y
-
z
)2]=510{23[s2x+(
x
- z )2]+27[s2y+( y - z )2]}.
①
由 x =170.6,y =160.6,根据按比例分配分层随机抽样总样本平均数与各
层样本平均数的关系,可得总样本平均数为
z =232+327 x +232+727 y =23×170.6+ 5027×160.6=165.2.
3.(多选)甲、乙两班举行电脑 汉字录入比赛,参赛学生每 分钟录入汉字的个数经统计 计算后填入右表:
班级 参加人数 中位数 方差 平均数
甲
55
149 191 135
乙
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)哪种玉米苗长得齐?
解 s甲2 =110×[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+ (19-30)2+(39-30)2+(21-30)2+(42-30)2]=104.2, 同理可计算得 s乙2 =128.8, ∴s甲2 <s2乙,即甲种玉米苗长得齐.
第九章 9.2 用样本估计总体
学习目标
XUE XI MU BIAO
1.理解方差、标准差的含义,会计算方差和标准差. 2.掌握求分层随机抽样总样本的平均数及方差的方法.
内容索引
NEI RONG SUO YIN
知识梳理 题型探究 随堂演练
1 知识梳理
PART ONE
知识点 方差、标准差
x1+x2+…+xn
s2 为样本标准差.
4.标准差刻画了数据的 离散程度 或 波动幅度 ,标准差 越大 ,数据的离散程度
越大;标准差 越小 ,数据的离散程度越小.
思考 方差、标准差有什么区别?
答案 在刻画数据的分散程度上,方差和标准差是一样的,但解决实际问题中,
一般多采用标准差.
思考辨析 判断正误
SI KAO BIAN XI PAN DUAN ZHENG WU
二、分层随机抽样的方差
例2 甲、乙两支田径队体检结果为:甲队的体重的平均数为60 kg,方差为200,乙队 体重的平均数为70 kg,方差为300,又已知甲、乙两队的队员人数之比为1∶4,那么 甲、乙两队全部队员的平均体重和方差分别是什么?
解 由题意可知 x 甲=60,甲队队员在所有队员中所占权重为 w 甲=1+1 4=15, x 乙=70,乙队队员在所有队员中所占权重为 w 乙=1+4 4=45, 则甲、乙两队全部队员的平均体重为 x =w 甲 x 甲+w 乙 x 乙=15×60+45×70=68(kg), 甲、乙两队全部队员的体重的方差为 s2=w 甲[s2甲+( x 甲- x )2]+w 乙[s乙2 +( x 乙- x )2] =15[200+(60-68)2]+45[300+(70-68)2]=296.
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,
其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=
1 N
k
fi(Yi-
Y
)2
i=1Βιβλιοθήκη .3.如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为 y,则称s2=
1 n
n
(yi-
y
)2
i=1
为样本方差,s=
反思 感悟
分层随机抽样的方差 设样本中不同层的平均数分别为 x 1, x 2,…, x n,方差分别为 s21,s22,…,
n
sn2,相应的权重分别为 w1,w2,…,wn,则这个样本的方差为 s2= wi[s2i +
i=1
( x i- x )2]( x 为样本的平均数).
跟踪训练2 某培训机构在假期招收了A,B两个数学补习班,A班10人,B班30人,经过 一周的补习后进行了一次测试,在该测试中,A班的平均成绩为130分,方差为115, B班的平均成绩为110分,方差为215.求在这次测试中全体学生的平均成绩和方差.
标准差为 s 乙= s2乙= 75.25≈8.67(分).
(2)哪一组的成绩较稳定?
解 由于乙组的方差(标准差)小于甲组的方差(标准差), 因此乙组的成绩较稳定. 从(1)中得到的极差也可看出乙组的成绩比较稳定.
反思 感悟
在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了 数据相对平均数的离散程度.在平均数相同的情况下,方差越大,离散程度 越大,数据波动性越大,稳定性越差;方差越小,数据越集中、越稳定.
跟踪训练1 从甲、乙两种玉米苗中各抽取10株,分别测得它们的株高如下(单位:cm): 甲 25 41 40 37 22 14 19 39 21 42 乙 27 16 44 27 44 16 40 40 16 40 求:(1)哪种玉米苗长得高?
解 x 甲=110×(25+41+40+37+22+14+19+39+21+42)=30, 同理可计算得 x 乙=31, ∴ x 甲< x 乙,即乙种玉米苗长得高.
1.数据的极差越小,样本数据分布越集中、稳定.( √ ) 2.数据的方差越大,样本数据分布越集中、稳定.( × ) 3.数据的标准差越小,数据分布越集中、波动幅度越小.( √ )
4.在实际问题中要做出有效决策时,主要参照样本数据的平均数和标准差或方差.
(√)
2 题型探究
PART TWO
一、方差、标准差的计算与应用
例1 某班20位女同学平均分为甲、乙两组,她们的劳动技术课考试成绩如下(单位:分): 甲组 60,90,85,75,65,70,80,90,95,80; 乙组 85,95,75,70,85,80,85,65,90,85. (1)试分别计算两组数据的极差、方差和标准差;
解 甲组:最高分为95分,最低分为60分,极差为95-60=35(分), 平均数为 x 甲=110×(60+90+85+75+65+70+80+90+95+80)=79(分), 方差为 s甲2 =110×[(60-79)2+(90-79)2+(85-79)2+(75-79)2+(65-79)2+(70-79)2+ (80-79)2+(90-79)2+(95-79)2+(80-79)2]=119,
标准差为 s 甲= s2甲= 119≈10.91(分).
乙组:最高分为95分,最低分为65分,极差为95-65=30(分), 平均数为 x 乙=110×(85+95+75+70+85+80+85+65+90+85)=81.5(分), 方差为 s乙2 =110×[(85-81.5)2+(95-81.5)2+(75-81.5)2+(70-81.5)2+(85-81.5)2+(80 -81.5)2+(85-81.5)2+(65-81.5)2+(90-81.5)2+(85-81.5)2]=75.25,
1.假设一组数据为x1,x2,…xn,则这组数据的平均数 x =
n
,方差
1 n
n
(xi-
x
)2
为s2= i=1
,标准差s=
1 n
n
xi-
x
2
i=1
.
2.如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为 Y,则称S2
1 N
N
(Yi-
Y
)2
= i=1
为总体方差,S=
S2 为总体标准差.