高中数学苏教版必修三教学案:第2章 2.3 总体特征数的估计-含答案
高中数学第2章统计2.3总体特征数的估计互动课堂学案苏教版必修3
2.3 总体特征数估计互动课堂疏导引导〔1〕平均数定义假设给定一组数据x 1,x 2,…,x n ,那么称x =n1∑=ni 1x i (i=1,2,3,…,n)为这组数据x 1,x 2,…,x n ∑=ni 1x i =n1(x 1+x 2+……x n ).平均数反映了一组数据集中趋势,我们常用一组数据平均数来衡量这组数据水平. 当一组数据中重复数据过多时,假设用上面公式求这组数据平均数,其过程就会显得比拟复杂与冗长,为了简化计算过程,我们引入下面这种计算平均数方法:一般地,假设取值为x 1,x 2,…,x n 频率分别为p 1,p 2, …,p n ,那么其平均数为x 1p 1+x 2p 2+…+x n p n .这一公式实质上就是公式一个变形,它主要用于含有重复数据数据组求平均数.除此之外,当所给数据在某一常数a 上下波动时,我们也可利用公式:x='x +a,其中'x =n1(x 1′+x 2′+…+x n ′),x 1′=x 1-a,x 2′=x 2-a,x 3′=x 3-a,…,x n ′=x n -a ;常数a 通常取接近于这组数据平均数较“整〞数.例如:求数据70,71,72,73平均数时,我们可以先求出0,1,2,3平均数,然后将此平均数加上70即得该组数据平均数. 〔2〕平均数性质①假设给定一组数据x 1,x 2,…,x n 平均数为x ,那么ax 1,ax 2, …,ax n 平均数为a x;②假设给定一组数据x1,x2, …,x n平均数为x,那么ax1+b,ax2+b, …,ax n+b平均数为a x+b;(3〕用样本平均数估计总体平均数从一个总体中随机抽取一个容量一定包含大量数据样本,利用样本平均数计算公式求出样本平均数,由此得出总体平均数就是所求样本平均数.在这里两次从总体中抽取容量相等样本,分别求出样本平均数,两个样本平均数会不一样,所以用样本平均数估计总体平均数时,样本平均数只是总体平均数近似值.案例1 下面是某一个工厂所有工作人员在某个月工资,总经理6 000元,技术工人甲900元,技术工作人员乙800元,杂工640元,效劳员甲700元,效劳员乙640元,会计820元.(1)计算所有工作人员平均工资.(2)去掉总经理后,再计算平均工资.(3)在(1)与(2)中两种平均工资哪一种能代表一般工人收入水平,为什么?【探究】计算平均工资是用工资总数除以领工资人数即可.1(6 【解析】(1)所有工作人员平均工资为x=7 000+900+800+640+700+640+820)=1 500(元).(2)去掉总经理后平均工资为1(900+800+640+700+640+820)=750(元).'x=6(3)能代表一般工人收入水平是去掉总经理后平均工资750元.因为除去总经理之外,工作人员工资均在900元以下,因此不能以1 500元来代表职工平均工资水平.规律总结 一般地,在一组数据中,平均数、众数、中位数能够反映该组数据集中趋势与平均水平,但有时需要去掉极端值(极大值或极小值),这样计算平均数那么更能反映平均水平,这就是有些比赛活动中往往会去掉一个最大值与一个最小值再去计算平均成绩原因. 设一组样本数据x 1,x 2,…,x n ,其平均数为x ,那么称s 2=n1∑=ni 1(x i -x )2为这个样本方差,其算术平方根s=为样本标准差,分别简称样本方差、样本标准差.疑难疏引 〔1〕为了更好地比拟两组数据集中程度,我们可以利用这两组数据方差对两组数据进展比拟.方差较大数据波动较大;方差较小数据波动较小.当所给数据有单位时,所求得平均数与原数据单位一样,不要漏写单位.方差单位为所给数据单位平方,方差算术平方根称作标准差,它与原数据单位一样,因而能更好地刻画数据离散程度. 〔2〕方差性质①假设给定一组数据x 1,x 2,…,x n ,方差为s 2,那么ax 1,ax 2,…,ax n 方差为a 2s 2;②假设给定一组数据x 1,x 2,…,x n ,方差为s 2,那么ax 1+b,ax 2+b,…,ax n +b 方差为a 2s 2,特别地,当a=1时,那么有x 1+b,x 2+b,…,x n +b 方差为s 2,这说明将一组数据每一个数据都减去一样一个常数,其方差是不变,即不影响这组数据波动性;③方差刻画了数据相对于均值平均偏离程度.对于不同数据集,当离散程度越大时,方差越大;④方差单位是原始测量数据单位平方,对数据中极值较为敏感. 〔3〕我们可以通过计算样本方差与标准差对总体方差与标准差进展估计,也可以通过对两个总体样本方差大小差异情况,对两个总体波动情况进展推断与比拟,当甲x =,2甲s <2乙s 时,甲为优秀.〔4〕样本方差.标准差计算简化. 方差计算公式s 2可简化为:〔Ⅰ〕s 2=n 1[21x +22x +…+2n x ]-nx 2,或写成s 2=n1(21x +22x +…2n x )-x 2.即方差等于原数据平方平均数减去平均数平方.〔Ⅱ〕s 2=n1[(2'1x +2'2x +…+2'n x )-n 2'x ].当一组数据中数据较大时,直接计算它们方差那么比拟麻烦,如果数据相互比拟接近,为了减少参与计算数据,可仿照简化平均数计算方法,将每个数据同时减去一个与它们平均数接近常数a,得到一组新数据x 1′=x 1-a,x 2′=x 2-a,…,x n ′=x n -a,那么,s 2=n1[(2'2x +2'2x +…+2'n x )-n 2'x ]也可写成s 2=n1(2'1x +2'2x +…+2'n x )-2'x .即方差等于新数据平方平均数减去新数据平均数平方. 原数据x 1,x 2,…,x n方差与新数据x′1=x 1-a,x′2=x 2-a, …,x′n =x n -a 方差相等,即x′1,x′2…,x′n 方差s′2=n1·[(x′1-'x )2+(x′2-'x )2+…+(x′n -'x )2]等于原数据x 1,x 2,…,x n 方差s 2.案例2 某班40人随机平均分成两组,两组学生一次考试成绩情况如下表:组别 统计量平均 标准差第一组 90 6 第二组804求全班平均成绩与标准差. 【探究】设第一组20名学生成绩为 x i (i=1,2…,20),第二组20名学生成绩为y i =(i=1,2,…,20), 依题意有:90=201(x 1+x 2+…+x 20), 80=201(y 1+y 2+…+y 20),故全班平均成绩为: 401〔x 1+x 2+…+x 20+y 1+y 2+…+y 20〕=401(90×20+80×20)=85; 又设第一组学生成绩标准差为s 1,第二组学生成绩标准差为s 2,那么21s =201(21x +22s +…+220x -20x 2), 22s =201(y 12+y 22+…+220y -20y 2)(此处,x =90,x =80) 又设全班40名学生标准差为s,平均成绩为z (z =85), 故有s 2=401(21x +22x +…+220x +y 12+y 22+…+220y -40z 2) =401(2021s +20x 2+2022s +20y 2-40z 2) =21(62+42+902+802-2×852)=51. s=51.规律总结 平均数与方差,都是重要数字特征数,是对总体一种简明描述,它们所反映情况有着重要实际意义,所以,不仅需要掌握其计算公式与方法,还要学会通过这些数据分析其含义,从而为正确决策提供依据.案例3 某校拟派一名跳高运发动参加一项校际比赛,对甲、乙两名跳高运发动进展了8次选拔比赛,他们成绩(单位:m)如下: 甲:1.70,1.65,1.68,1.69,1.72,1.73,1.68,1.67; 乙:1.60,1.73,1.72,1.61,1.62,1.71,1.70,1.75.经预测,跳高1.65 m 就很可能获得冠军.该校为了获取冠军,可能选哪位选手参赛?假设预测跳高1.70 m 方可获得冠军呢?【探究】参加比赛选手成绩得突出,且成绩稳定,这就需要比拟这两名选手平均成绩与成绩方差. 甲平均成绩与方差如下:甲x =81(1.70+1.65+1.68+1.69+1.72+1.73+1.68+1.67)=1.69,2甲s =81[(1.70-1.69)2+(1.65-1.69)2+…+(1.67-1.69)2]=0.000 6.乙平均成绩与方差如下:乙x =81(1.60+1.73+1.72+1.61+1.62+1.71+1.70+1.75)=1.68,2乙s =81[(1.60-1.68)2+(1.73-1.68)2+…+(1.75-1.68)2]=0.003 15.显然,甲平均成绩好于乙平均成绩,而且甲方差小于乙方差,说明甲成绩比乙稳定.由于甲平均成绩高于乙,且成绩稳定,所以假设跳高1.65 m1.70 m 以上,虽然乙平均成绩不如甲,成绩稳定性也不如甲,假设跳高1.70 m 方可获得冠军时,应派乙参加比赛.规律总结 在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值离散程度〔即方差或标准差〕.方差〔标准差〕大,说明取值分散性大,方差〔标准差〕小,说明取值分散性小或说取值比拟集中、稳定. 活学巧用1.(2004北京春季高考,理10文10)期中考试以后,班长算出了全班40个人数学成绩平均分为M.如果把M 当成一个同学分数,与原来40个分数一起,算出这41个分数平均值为N,那么M∶N 为〔 〕 A.4140 B.1 C.4041解析:考察阅读理解能力,分析问题、解决问题能力及统计初步知识. 设40位同学成绩为x i (i=1,2,…,40), 那么M=, N=故M∶N=1. 答案:B2.某工人在30天中加工一种零件日产量有2天是51件,3天是52件,6天是53件,8天是54件,7天是55件,3天是56件,1天是57件.计算该工人30天平均日产量.解:在上面30个数据中,51出现2次,52出现3次,53出现6次,54出现8次,55出现7次,56出现3次,57出现1次.由于这组数据都比50稍大一点,故将数据51,52,53,54,55,56,57同时减去50,得到1,2,3,4,5,6,7.它们出现次数依次是2,3,6,8,7,3,1. 那么,这组新数据平均数是'x =3011830173221=⨯++⨯+⨯ ≈4, ∴x ='x +a≈54〔件〕,即这个工人30天平均日产量为54件.点评:“同时减去50〞改为“同时减去53〞更方便.3.某餐厅共有8名员工,某月工资如以下图所示,那么以下说法中不正确是〔 〕A.该餐厅员工工资一般水平不是1 125元,尽管平均数是1 125B.因为众数为320元,所以该餐厅员工工资一般水平是320元C.因为中位数为410元,所以该餐厅员工工资一般水平是410元D.去掉一个最大数6 000元,去掉一个最小数320元,剩下6个数平均数为447元,该餐厅员工工资一般水平一定是477元 答案:D4.某班一次数学测验成绩如下:得100分6人,得90分15人,得80分18人,得70分6人,得60分3人,得50分2人,试计算这次测验全班平均成绩. 解法一:x =501(6×100+15×90+18×80+6×70+3×60+2×50)=81.8(分).解法二:取a=80,将原数据都减去80得新数据及出现次数为 新数据 20 10 0 -10 -20 -30 出现次数 6 15 18 6 3 2 ∴'x =501[6×20+15×10+18×0+6×(-10)+3×(-20)+2×(-30)]=1.8.∴x ='x +a=1.8+80=81.8(分),即这次测验全班平均成绩为81.8分.5.计算下面数据方差〔结果保存到小数点后第1位〕: 3,-1,2,1,-3,3.解析:这组数据平均数不是整数,选用公式s 2=n1[(21x +22x +…+2n x )-n x 2]比拟方便.s 2=61[32+(-1)2+22+12+(-3)2+32-6×()2]=61[9+1+4+1+9+9-6×(65)2]=61×33-3625≈5.5-0.7=4.8. 6.在去年足球甲A 联赛上,一队每场比赛平均失球数是1.5,全年比赛失球个数标准差为1.1;二队每场比赛平均失球数为2.1,全年比赛失球个数标准差为0.4.你认为以下说法中哪一种是正确? 〔1〕平均说来一队比二队技术好; 〔2〕二队比一队技术水平更稳定;〔3〕一队有时表现很差,有时表现又非常好; 〔4〕二队很少不失球.解:此题主要考察对平均数与标准差概念理解.平均数反映了一组数据平均水平,而方差那么反映了一组数据波动性大小.一队每场比赛平均失球数比二队每场比赛平均失球数少,说明一队技术比二队技术好;一队全年比赛失球个数标准差较大,说明一队表现时好时坏,起伏较大;二队平均失球数多,全年比赛失球个数标准差很小,说明二队表现较稳定,经常失球.答案:〔1〕〔2〕〔3〕〔4〕都正确7.(2005山东青岛第二次质量检测)对于一组数据x i (i=1,2,3…,n),如果将它们改变为x i -c(i=1,2,3, …,n),其中c≠0,那么下面结论中正确是( )B.平均数变了,而方差保持不变C.平均数不变,而方差变了解析:x =n 1∑=ni 1x i ,'x =n1∑=ni 1(x i -c)=n1∑=ni 1x i -n1·nc=x -c,而s 2=n1∑=ni 1(x-x i )2,s′2=n1∑=ni 1['x -(x i -c)]2=n1∑=ni 1[x -c-(x i -c)]2=n1∑=ni 1(x -x i )2=s 2,所以其平均数变了,而方差保持不变.应选B. 答案:B8.(2005江苏南通调研考试)一组数据中每一个数据都减去80,得一组新数据,假设这组数据平均数是1.2,方差是4.4,那么原来一组数据平均数与方差分别是〔 〕B.78.8, C 解析:由平均数与方差公式:x =,s 2=nx x x x x x n 22221)()()(+++-+- 知,在每一个数都减去80后,平均数也减去80,而方差不变,所以选A. 答案:A9.某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学成绩有误,甲实得80分却记为50分,乙实得70分却记为100分,更正后平均分与方差分别是〔 〕A.70,25B.70,50 C D.65,25 解析:易得x 没有改变,x =70, 而s 2=4811[]48[〔21x +22x +…+502+1002+…+248x 〕-48x 2]=75, s′2=481[(21x +22x +…+802+702+…+248x )-48x 2] =481[〔75×48+48x 2-12 500+11 300〕-48x 2] =75-481200 =75-25=50. 答案:B10.甲、乙两台机床同时生产直径为40㎜零件.为了检验产品质量,从两台机床生产产品中各抽取10件进展了测量,结果如下: 甲/mm 乙/mm 甲/mm 乙/mm能用几种方法比拟这两台机床性能?分析:经简单计算可以得出:甲、乙两台机床生产这10件产品直径平均数都为40 mm.所以,不能从平均数这一角度来比拟这两台机床性能,即不能从数据平均水平上来比拟,只能从数据离散程度上进展比拟.要从数据离散程度上进展比拟,常见方法有以下几种:解法一:利用初中所学折线统计图.由折线统计图我们可以直观地表示出这两组数据离散程度,甲机床生产产品波动幅度比乙大.所以,乙机床性能好于甲.解法二:利用这两组数据极差进展比拟.甲:40.2-39.8=0.04;乙:40.1-39.9=0.02.显然,乙组数据极差小于甲组数据极差.所以,乙机床性能好于甲.解法三:2s=0.026(mm2),标准差为s甲=0.161(mm);乙方差为甲2s=0.006(mm2),标准差为s乙=0.077(mm).由上可知:不管是方差还乙是标准差甲均比乙大,这就说明乙机床生产产品要更标准些.所以,乙机床性能好于甲.。
2019-2020年高中数学2.3《总体特征数的估计》教案苏教版必修3
2019-2020年高中数学2.3《总体特征数的估计》教案苏教版必修3学习要求1. 知道平均数是对调查数据的一种简明的描述,它表示变量一切可能值的算术平均值,从而实现对总体可靠度的估计,学习时仔细体会它的实际意义。
2. 熟练掌握平均数的计算公式。
【课堂互动】自学评价案例 某校高一(1)班同学在老师的布置下,用单摆进行测试,以检验重力加速度.全班同学两人一组,在相同的条件下进行测试,得到下列实验数据(单位:m/s 2):9.62 9.54 9.78 9.94 10.01 9.66 9.88 9.68 10.32 9.76 9.45 9.99 9.81 9.56 9.78 9.72 9.93 9.94 9.65 9.79 9.42 9.68 9.70 9.84 9.90 怎样利用这些数据对重力加速度进行估计? 【分析】我们常用算术平均数(其中(=1,2,…,n) 为n 个实验数据)作为重力加速度的“最理想”的近似值.它的依据是什么?处理实验数据的原则是使这个近似值与实验数据之间的离差最小. 设这个近似值为,那么它与n 个实验值(=1,2,…,n)的离差分别为,,…,.由于上述离差有正有负,故不宜直接相加.可以考虑将各个离差的绝对值相加,研究||+||+…+||取最小值时的值.但由于含绝对值,运算不太方便,所以考虑离差的平方和,即()2+()2+…+()2,当此和最小时,对应的的值作为近似值,因为 ()2+()2+…+()2=22221212)(2n n a a a x a a a nx +⋅⋅⋅++++⋅⋅⋅++-,所以当时离差的平方和最小,故可用作为表示这个物理量的理想近似值,称其为这n 个数据,,…,的平均数或均值,一般记为 .用计算器操作,验证:求得重力加速度的最佳近似值为 m/s 2. 【小结】1. 个实数的和简记为2.已知个实数,则称为这个数据的平均数(average)或均值(mean)3.若取值为的频率分别为,则其平均数为【精典范例】例1 某校高一年级的甲、乙两个班级(均为50人)的语文测试成绩如下(总分:150),试确定这次考试中,哪个班的语文成绩更好一些。
高中数学第2章统计2.3总体特征数的估计共同成长学案苏教版必修3(2021学年)
高中数学第2章统计2.3总体特征数的估计共同成长学案苏教版必修3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第2章统计 2.3 总体特征数的估计共同成长学案苏教版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第2章统计2.3 总体特征数的估计共同成长学案苏教版必修3的全部内容。
2。
3 总体特征数的估计共同成长见仁见智某中学从甲、乙两名跳远运动员中挑选一人参加该市举行的中学生运动会,在最近10次的选拔赛中,他们的成绩(单位:cm)如下:甲:585,596,610,598,612,597,604,600,613,601;乙:613,618,580,618,593,587,590,598,585,624.历届比赛表明,成绩达到596cm就可能夺冠,成绩达到610cm就能打破记录。
同学A说:经计算,甲、乙两人的平均成绩相同,两人谁参加比赛都可以;同学B说:让乙参加比赛夺冠的可能性大;同学C说:让乙参加比赛打破记录性的可能性较大;同学D说:要打破记录,应让甲参加。
你的观点是什么呢?为什么?合作共赢请你和你的同学先一起阅读下面的材料,然后回答问题。
在风帆比赛中,成绩以低分为优胜。
比赛共11场,并以最佳的9场成绩计算最终的名次.在1996年美国亚特兰大奥运会上,风帆比赛前7场比赛结束后,排名前5位的选手的积分情况如下表。
(1)分别计算这5位选手前7场比赛的平均分和标准差.(2)由此表和(1)中的这5位选手前7场比赛的平均分和标准差能得出什么结论。
(3)根据上述的探究、讨论的结果,请你们告诉大家,在这次比赛中谁能最后取得冠军,为什么?以上就是本文的全部内容,可以编辑修改。
高中数学 第2章 统计 2.3 总体特征数的估计讲义 苏教版必修3-苏教版高一必修3数学教案
2.3 总体特征数的估计一组数据中重复出现次数最多的数称为这组数的众数. 2.中位数把一组数据按从小到大的顺序排列,把处于中间位置的那个数称为这组数据的中位数.当数据个数为奇数时,中位数是按从小到大的顺序排列的中间的那个数.当数据个数为偶数时,中位数是按从小到大的顺序排列的最中间两个数的平均数.3.平均数(1)若给定一组数据a 1,a 2,…,a n ,则称a =1n ∑i =1n a i =a 1+a 2+…+a nn为这n 个数据的平均数或均值.(2)若一组数据中取值为a 1,a 2,…,a n 的频率分别为p 1,p 2,…,p n ,则其平均数为a 1p 1+a 2p 2+…+a n p n .4.方差与标准差一般地,设样本数据分别是x 1,x 2,…,x n ,样本的平均数为x ,则称s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]为这个样本的方差,其算术平方根s =分别简称样本方差、样本标准差.5.极差一组数据的最大值与最小值的差称为极差.1.下面是高一(8)班十位同学的数学测试成绩:82,91,73,84,98,99, 101,118,98,110,则该组数据的中位数是________.98 [将这组数据从小到大排列为73,82,84,91,98,98,99, 101,110,118,则最中间的两个数为98,98,故中位数为98.]2.在一段时间里,一个学生记录了其中10天他每天完成家庭作业所需要的时间(单位:分钟),结果如下:80,70,70,70,60,60,80,60,60,70.在这段时间里,该学生平均每天完成家庭作业所需时间是________分钟. 68 [平均每天所需时间为80×2+70×4+60×410=68.]3.某老师从星期一到星期五收到的信息数分别为10,6,8,5,6,则该组数据的方差s 2=________.3.2 [5个数据的平均数x =10+6+8+5+65=7.所以s 2=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=3.2.]4.已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为________. 2 [平均数x =15(1+2+3+4+5)=3,所以s =15[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2] = 2.]平均数、众数、中位数【例1】 (1)一个球队所有队员的身高如下(单位:cm):178,178,182,182,178,180,178,180,181,180,181,180,180,182.则这个球队的队员平均身高是________cm(精确到1 cm).(2)有容量为100的样本,数据分组及各组的频数、频率如下:[12.5,14.5),6,0.06;[14.5,16.5),16,0.16;[16.5,18.5),18,0.18;[18.5,20.5),22,0.22;[20.5,22.5),20,0.20;[22.5,24.5),10,0.10;[24.5,26.5],8,0.08.则该样本数据的平均数为________.(1)180 (2)19.42 [(1)法一:利用平均数的定义计算: 平均身高x =114(178+178+182+182+178+180+178+180+181+180+181+180+180+182)=114×2 520=180(cm).法二:利用加权平均数公式计算: 平均身高x =114(178×4+182×3+180×5+181×2)=114×2 520=180(cm).法三:利用新数据法进行计算:取a =180,将各数据同时减去180,得到一组新数据: -2,-2,2,2,-2,0,-2,0,1,0,1,0,0,2. 这组新数据的平均数为x ′=114(-2×4+2×3+0×5+1×2)=0,所以平均身高x =a +x ′=180+0=180(cm).(2)利用频率平均数公式计算:样本数据平均数x =13.5×0.06+15.5×0.16+17.5×0.18+19.5×0.22+21.5×0.20+23.5×0.10+25.5×0.08=19.42.]1.一般情况下,要计算一组数据的平均数,可使用平均数公式x =1n(x 1+x 2+…+x n )来计算.2.如果x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数是m x +A .当数据较大,且大部分数据在某一常数左右波动时,本例中“法三”可以减少运算量,故此法比较简便.3.一般地,如果在n 个数中,x 1出现的频数为f 1,x 2出现的频数为f 2,…,x k 出现的频数为f k (其中f 1+f 2+…+f k =n ),那么x =1n(x 1f 1+x 2f 2+…+x k f k )=1n i =1kx i f i 叫做这n 个数的频数平均数,也称加权平均数,其中f 1,f 2,…,f k 叫做权.4.一般地,若取值为x 1,x 2,…,x n 的频率分别为p 1,p 2,…,p n ,那么其平均数为x =x 1p 1+x 2p 2+…+x n p n .如本例(2)中求平均数方法.提醒:当条件给出某几个范围内的数据的频率或频数时,可用组中值求平均数. 1.某商场买来一车苹果,从中随机抽取了10个苹果,其重量(单位:克)分别为150,152,153,149,148,146,151,150,152,147,由此估计这车苹果单个重量的平均值是________.149.8克 [平均数为x =150+152+153+149+148+146+151+150+152+14710=149.8(克).]2.将一组数据同时减去3.1,得到一组新数据,若原数据的平均数为x ,则新数据的平均数是________.x -3.1 [设原来数据为a 1,a 2,…,a n ,则a 1+a 2+…+a n =n x ,从而新数据的平均数为(a 1-3.1)+(a 2-3.1)+…+(a n -3.1)n=n x -3.1nn=x -3.1.]极差、方差与标准差(1)极差;(2)方差;(3)标准差.[解] (1)该组数据中最大值为9,最小值为5,故该组数据的极差为9-5=4. (2)求方差可以有三种方法:法一:因为x =110(7×4+6×2+8×2+5+9)=7,所以s 2=110×[(7-7)2+(6-7)2+…+(7-7)2]=1.2,法二:同“法一”,求得x =7,所以s 2=110[(72+62+82+…+72)-10×72]=1.2,法三:将各数据减去7,得一组新数据:0,-1,1,1,-2,2,0,0,-1,0,则x ′=0,所以x =x ′+7=7.所以s 2=110[02+(-1)2+12+…+02]-10×02=1.2.(3)由(2)知,标准差s =s 2= 1.2=305. 1.极差是数据的最大值与最小值的差,它反映了一组数据变化的最大幅度,它对一组数据中的极端值非常敏感.2.方差的计算(1)s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2];(2)s 2=1n (x 21+x 22+…+x 2n -n x 2); (3)s 2=1n(x 21+x 22+…+x 2n )-x 2. 3.方差的性质(1)数据x 1,x 2,…,x n 与数据x 1+a ,x 2+a ,…,x n +a 的方差相等.(2)若数据x 1,x 2,…,x n 的方差为s 2,则数据ax 1+b ,ax 2+b ,…,ax n +b 的方差为a 2s 2(a ,b ∈R ).(3)标准差、方差的范围为[0,+∞). 4.标准差的计算方差的算术平方根即标准差,要求标准差先求出方差,再开方取其算术平方根即可. 提醒:方差、标准差的单位不一致要注意区别.3.若一组样本数据2,3,7,8,a 的平均数为5,则该组数据的标准差s =________. 1305 [由平均数为5,得a =5×5-(2+3+7+8)=5,则s 2=15(32+22+22+32+02)=265,s =265=1305.] 4.已知样本x 1,x 2,x 3,x 4,x 5的方差为3,则样本4x 1+1,4x 2+1,4x 3+1,4x 4+1,4x 5+1的标准差是________.4 3 [根据方差的性质知4x 1+1,4x 2+1,4x 3+1,4x 4+1,4x 5+1的方差为42×3=48. 所以其标准差为48=4 3.]平均数、方差与标准差的应用了8次选拔比赛,他们的成绩(单位:m)如下:甲:1.70,1.65,1.68,1.69,1.72,1.73,1.68,1.67; 乙:1.60,1.73,1.72,1.61,1.62,1.71,1.70,1.75.经预测,成绩超过1.65 m 就很有可能获得冠军,该校为了获取冠军,可能选哪位选手参赛?若预测成绩超过了1.70 m 方可获得冠军呢?思路点拨:[解] 甲的平均成绩和方差:x 甲=18×(1.70+1.65+…+1.67)=1.69,s 2甲=18×[(1.70-1.69)2+(1.65-1.69)2+…+(1.67-1.69)2]=0.000 6.乙的平均成绩和方差:x 乙=18×(1.60+1.73+…+1.75)=1.68,s 2乙=18×[(1.60-1.68)2+(1.73-1.68)2+…+(1.75-1.68)2]=0.003 15.显然,甲的平均成绩高于乙的平均成绩,而且甲的方差小于乙的方差,说明甲的成绩比乙稳定,由于甲的平均成绩高于乙,且成绩稳定,所以若成绩超过1.65 m就很可能获得冠军,应派甲参赛.在这8次选拔比赛中乙有5次成绩在1.70 m以上,虽然乙的平均成绩不如甲,成绩的稳定性也不如甲,但当成绩超过1.70 m方可获得冠军时,应派乙参加比赛.在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(方差或标准差),方差(标准差)越大,说明取值分散性越大,方差(标准差)越小,说明取值分散性越小,取值比较集中、稳定.5.假定以下数据是甲、乙两个供货商的交货天数:甲:10,9,10,10,11,11,9,11,10,10;乙:8,10,14,7,10,11,10,8,15,12.根据以上数据估计两个供货商的交货情况:哪个供货商交货时间短一些?哪个供货商是比较具有一致性与可靠性的供货商?思路点拨:先分别计算出甲、乙两组数据的平均数及方差,再作判断.[解] x甲=110(10+9+…+10)=10.1,s2甲=110(102+92+…+102)-10.12=0.49;x乙=110(8+10+…+12)=10.5,s2乙=110(82+102+…+122)-10.52=6.05>s2甲.从交货天数的平均值来看,甲供货商的交货时间短一些;从方差来看,甲供货商的交货时间较稳定.因此甲供货商是比较具有一致性与可靠性的供货商.6.从甲、乙两种玉米中各抽10株,分别测得它们的株高如下(单位:cm):甲:25,41,40,37,22,14,19,39,21,42;乙:27,16,44,27,44,16,40,40,16,40.问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?思路点拨:看哪种玉米的苗长得高,只要比较甲、乙两种玉米的平均高度即可;要比较哪种玉米的苗长得齐,只要看两种玉米高的方差即可,因为方差是体现一组数据波动大小的特征数.[解] (1)x甲=110(25+41+40+37+22+14+19+39+21+42)=30(cm),x乙=110(27+16+44+27+44+16+40+40+16+40)=31(cm),因为x甲<x乙.故乙种玉米苗长得高.(2)s2甲=110[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=104.2(cm2).s 2乙=110[(27-31)2+(16-31)2+(44-31)2+(27-31)2+(44-31)2+(16-31)2+(40-31)2+(40-31)2+(16-31)2+(40-31)2]=128.8(cm 2).因为s 2甲<s 2乙,所以甲种玉米的苗长得齐.1.本节课的重点是会求样本的众数、中位数、平均数、标准差、方差,难点是理解用样本的数字特征来估计总体数字特征的方法.2.本节课要掌握以下几类问题(1)当平均数大于中位数时,说明数据中存在较大的极端值;反之,说明数据中存在较小的极端值.(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.1.已知1,2,3,4,x 1,x 2,x 3的平均数是8,那么x 1+x 2+x 3的值是( ) A .56 B .48 C .46D .24C [由条件知,1+2+3+4+x 1+x 2+x 3=8×7, 所以x 1+x 2+x 3=46.]2.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4. 则:(1)平均命中环数为________; (2)命中环数的标准差为________. (1)7 (2)2 [(1)x =110(7+8+7+9+5+4+9+10+7+4)=7. (2)s 2=110[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,所以s =s 2=4=2.]3.已知一个样本为1,3,2,5,x ,它的平均数是3,则这个样本的标准差是________. 2 [x =1+3+2+5+x5=3,∴x =4. 由方差公式有:s 2=15[(1-3)2+(3-3)2+(2-3)2+(5-3)2+(4-3)2]=2,∴s = 2.]4.有两位射击运动员在一起射击,测试中各射靶10次,每次命中的环数如下: 甲:8,7,9,7,5,4,10,9,7,4;乙:5,9,8,7,7,6,6,8,7,7.如果这是一次选拔性考核,应当选择谁?思路点拨:平均数反映总体的平均水平,而方差反映了总体的稳定程度,我们可用平均数与方差从不同的方面估计总体.[解] x甲=110(8+7+9+7+5+4+10+9+7+4)=7,x乙=110(5+9+8+7+7+6+6+8+7+7)=7.s2甲=110[(8-7)2+(7-7)2+(9-7)2+(7-7)2+(5-7)2+(4-7)2+(10-7)2+(9-7)2+(7-7)2+(4-7)2]=4.s2乙=110[(5-7)2+(9-7)2+(8-7)2+(7-7)2+(7-7)2+(6-7)2+(6-7)2+(8-7)2+(7-7)2+(7-7)2]=1.2.由x甲=x乙知两个射击运动员的平均成绩是一样的.由s2甲>s2乙知,甲的成绩不如乙的成绩稳定.综合考虑,应选择乙.。
2.3总体特征数的估计教案苏教版必修3
总体特征数的估计
教学 目标 教学 重难 点 教学 参考 授课 方法
掌握从实际问题中提取数据,利用数据计算平均值,并对总体水平作出估计的思想 理解样本数据的方差、标ห้องสมุดไป่ตู้差的意义并且会计算数据的方差、标准差,使学生掌握通过合理 抽样对总体稳定性作出科学的估计的思想。
书
教参 多 媒 体 专用教室 学 基础练习: 1. 反映数据波动性的 特征数是 二次备课
教学 过程 设计
教
学
二次备课
教学 过程 设计
典 例剖析 课后练习 例 1 甲、乙两名射击运动员参加某大型运动会的预选 1.某班有 48 名学生, 赛,他们分别射击了 5 次,成绩如下表(单位:环) 在一次考试中统计出 平均分为 70 分, 方差 甲 10 8 9 9 9 为 75,后来发现有 2 乙 10 10 7 9 9 名同学的成绩有误, 如果甲、乙两人只有 1 人入选,则入选的应是__ 例 2 某班 40 人随机分为两组,第一组 18 人,第二组 甲实得 80 分却记为 50 分, 乙实得 70 分却 22 人,两组学生在某次数学检测中的成绩如下表: 记为 100 分,更正后 分 组 平均成绩 标准差 平均分和方差分别 第一组 90 6 是 . 第二组 80 4 2. 在总体中抽取了一 求全班的平均成绩和标准差 个样本,为了便 例 3 甲、乙两台机床在相同的条件下同时生产一 于统计,将样本 种零件,现在从中各抽测 10 个,它们的尺寸分别为 中的每个数据乘 (单位:mm) : 以 100 后进行分 甲: 10.2 10.1 10.9 8.9 9.9 10.3 9.7 析,得出新样本 10 9.9 10.1 平均数为 3, 则估 乙 : 10.3 10.4 9.6 9.9 10.1 10 9.8 计总体的平 均数 9.7 10.2 10 为 . 分别计算上面 两个样本的平均数与方差,如果图 纸上的设计尺寸为 10 mm,从计算结果看,用哪台机 3. 从观测所得的到数 床加工这种零件较合适? 据中取出 m 个 a, n 个 b,p 个 c 组 5. 右图是 2008 年“隆力奇”杯第 13 届 CCTV 青年歌 成一个样本,那 手电视 么这个样本的平 大奖赛上某两位选手的部分得分的茎叶统计图,去掉 均 数 一个最 是 . 高分和一个最低分后,所剩的数据 均值分别为 .
高一数学 2.3《总体特征数的估计》学案(苏教版必修3)
教学目标(1)理解为什么能用样本数据的平均值估计总体的水平;(2)初步了解如何(1)理解为什么能用样本数据的平均值估计总体的水平;(3)掌握从实际问题中提取数据,利用样本数据计算其平均值,并对总体水平作出估计的方法.一、问题情境1.情境:某校高一(1)班同学在老师的布置下,用单摆进行测试,以检查重力加速度.全班同学两人一组,在相同条件下进行测试,得到下列实验数据(单位:2/s m )9.62 9.54 9.78 9.94 10.01 9.66 9.88 9.68 10.329.76 9.45 9.99 9.81 9.56 9.789.72 9.93 9.94 9.65 9.79 9.42 9.68 9.70 9.84 9.902.问题:怎样利用这些数据对重力加速度进行估计?基础知识:1.平均数最能代表一个样本数据的集中趋势,也就是说它与样本数据的离差最小; 2.数据12,,,n a a a ⋯的平均数或均值,一般记为na a a a n ⋯++=21__; 3.若取值为12,,,n x x x ⋯的频率分别为12,,,n p p p ⋯,则其平均数为1122n n x x p x p x p =+++….练习:(1)第66页练习第2,3,4 ;(2) 若M 个数的平均数是X ,N 个数的平均数是Y ,则这M N +个数的平均数是(3)如果两组数12,,,n x x x ⋯和12,,,n y y y ⋯的样本平均数分别是x 和y ,那么一组数1122,,,n n x y x x y ++⋯+的平均数是 .二、典型例题例1.某单位年收入在10 000到15 000、15 000到20 000、20 000到25 000、25 000到30 000、30 000到35 000、35 000到40 000及40 000到50 000元之间的职工所占的比分别为10%,15%,20%,25%,15%,10%和5%,试估计该单位职工的平均年收。
高中数学第2章统计2.3总体特征数的估计2.3.2方差与标准差教案苏教版必修3
2.3.2 方差与标准差整体设计教材分析“方差与标准差〞这节课在上节课平均数根底上,从实例“有甲、乙两种钢筋,检查它们抗拉强度〞中平均数不是反映总体质量、水平唯一特征数,在平均值相差不大情况下,数据稳定程度可以作为评价对象质量上下又一重要因素,从而说明引入方差、标准差必要性,同时使学生养成从多个角度看问题习惯,锻炼了学生创造性思维.为了让学生充分体会“稳定性〞意义,教材中用数轴表示两组数据,形象地表现出数据“聚散〞程度,并用极差反映数据稳定性.当两组数据极差相差不大时,就不适宜用极差来表示稳定性,这时可用“方差与标准差〞作为比拟数据稳定性特征数.初中已学过方差概念,现在教学不能停留在原有水平上,要将用方差刻画数据稳定程度理由讲清楚,充分提醒用方差作为比拟数据稳定性水平特征数思维过程.通过方差单位与原数据单位比拟,通过实际问题分析,让学生了解到用方差反映稳定性水平缺乏之处是与原数据单位不一致,且平方后可能夸张偏差程度等,从而引入“标准差〞概念,这一过程应让学生在形成问题和解决问题过程中加以探索.三维目标1.通过对具体案例分析掌握样本数据平均数、方差与标准差根本概念和计算方法,培养学生分析问题和解决问题能力,激发学生探究数学问题兴趣和动机.2.在解决统计问题过程中,进一步体会用样本估计总体思想,形成对数据处理过程进展初步评价意识.3.引导学生对一些生活中实际问题学习, 进一步培养学生数学素养和增强学生数学应用意识及认真、耐心、细致学习态度和学习习惯.4.渗透数学来源于实践,反过来又作用于实践观点.重点难点教学重点:1.通过实例理解样本数据方差与标准差意义和作用,学会计算数据样本方差与标准差.2.根据方差与标准差对事件进展科学决策,形成对数据处理过程进展初步评价意识.教学难点:1.方差与标准差计算方法及运算准确性.2.用样本根本数字特征估计总体根本数字特征,从中进一步理解统计根本思想.课时安排1课时教学过程导入新课平均数向我们提供了样本数据重要信息,但是,平均数有时也会使我们作出对总体片面判断.某地区统计报表显示,此地区年平均家庭收入是10万元,给人印象是这个地区家庭收入普遍比拟高.但是,如果这个平均数是从200户贫困家庭和20户极富有家庭收入计算出来,那么它就既不能代表贫困家庭年收入,也不能代表极富有家庭年收入.因为这个平均数掩盖了一些极端情况.而这些极端情况显然是不能被无视.因此,只有平均数还难以概括样本数据实际情况.举例:有甲、乙两种钢筋,现从中各抽取一个样本〔如下表〕检查他们抗拉强度〔单位:kg/mm2〕,通过计算发现,两个样本平均数均为125.哪种钢筋质量较好?两种钢筋平均数都是125,那么,它们有没有什么差异呢推进新课作出图形,作直观比拟:直观上看,还是有差异.乙强度比拟分散,甲强度相对集中.因此,我们还需要从另外角度来考察这两组数据.例如,在作统计图、表时提到过极差甲强度极差=135-110=25,乙强度极差=145-100=45.它在一定程度上说明了样本数据分散程度,与平均数一起,可以给我们许多关于样本数据信息,显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分〞统计谋略.新知探究1.方差(variance)概念:考察样本数据分散程度大小,最常用统计量是方差,一般用s2表示.假设样本数据是x1,x2,…,x n,x表示这组数据平均数.结合上节课有关离差讨论可知,离差越小,稳定性就越高. 因此,通常用如下公式计算方差:.因为方差与原始数据单位不同,且平方后可能夸张了离差程度,因此将其算术平方根作为样本标准差〔standard deviation〕,分别简称样本方差、样本标准差.1,x2,…,x n标准差算法是:S1 算出样本数据平均数x;S2 算出每个样本数据与样本平均数差x i-x(i=1,2,…,n);S3 算出S2中x i-x(i=1,2,…,n)平方;S4 算出S3中n个平方数平均数;S5 算出S4中平均数算术平方根,即为样本标准差.关于方差、标准差一点说明:〔1〕方差、标准差是用来描述样本数据离散程度,它反映了各个样本数据聚集于样本平均数周围程度.方差与标准差越小,说明各个样本数据在样本平均数周围越集中;反之,方差标准差越大,说明各个样本数据在样本平均数周围越分散.〔2〕在实际应用中,方差与标准差常被理解为稳定性.例如在上面比拟两种钢筋抗拉强度时,方差与标准差越小意味着该产品质量越稳定;在描述成绩时,方差与标准差越小,说明成绩越稳定.〔3〕学生思考“标准差取值范围是什么?标准差为0样本数据有什么特点?〞由标准差定义容易得出标准差是非负;标准差为0意味着所有样本数据都相等特性,且与样本平均数也相等,可以构造一个样本容量为2样本:x1,x2(x1<x2),这样可以体会出两个样本数据分散程度与样本标准差之间关系.应用例如例1 根据以下四组样本数据,说明它们异同点.(1) 5 5 5 5 5 5 5 5 5;(2) 4 4 4 5 5 5 6 6 6;(3) 3 3 4 4 5 6 6 7 7;(4) 2 2 2 2 5 8 8 8 8.分析:从数据数字特征出发.解:四组数据平均数都是5.0,标准差分别是0.00,0.82,1.49,2.83.虽然它们有一样平均数,但是它们有不同标准差,说明数据分散程度是不一样.点评:样本方差、标准差能说明数据分散程度.例2 甲、乙两种水稻试验品种连续5年平均单位面积产量如下〔单位:t/hm2〕,试根据这组数据估计哪一种水稻品种产量比拟稳定.分析:稳固求方差和标准差方法.解:甲品种样本平均数为10,样本方差为[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02,乙品种样本平均数也为10,样本方差为[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.24.因为0.24>0.02,所以,由这组数据可以认为甲种水稻产量比拟稳定.点评:x甲=x乙,易产生这两种水稻产量一样稳定错觉.这说明在实际问题中,仅靠期望值〔即平均数〕不能完全反映问题,还要研究其偏离平均值离散程度〔及方差或标准差〕:标准差大说明取值分散性大,标准差小说明取值分散性小或者说取值比拟稳定、集中.2.要对“根据这组数据估计…〞统计意义作必要说明:第一,统计研究是以一定样本为依据,对于确定样本得到确定统计结果;第二,统计结果具有随机性,选择不同样本可能得到不同统计结果.最后还可让学生思考除了品种优劣,影响水稻产量还有哪些因素?根据一组数据得到结果是否可靠?这些问题提出会激发学生对统计学理论兴趣.例3 为了保护学生视力,教室内日光灯在使用了一段时间后必须更换.某校使用100只日光灯在必须换掉前使用天数如下,试估计这种日光灯平均使用寿命和标准差.分析:用每一个区间内组中值作为相应日光灯使用寿命,再求平均使用寿命.解:各组中值分别为165.5,195.5,225.5,255.5,285.5,315.5,345.5,375.5,由此算得平均数约为165.5×1%+195.5×11%+225.5×18%+255.5×20%+285.5×25%+315.5×16%+345.5×7%+375.5×2%=268.4≈268〔天〕.这些组中值方差为1001×[1×(165.5-268.4)2+11×(195.5-268.4)2+18×(225.5-268.4)2+20×(255.5-268.4)2+ 25×(285.5-268.4)2+16×(315.5-268.4)2+7×(345.5-268.4)2+2×(375.5-268.4)2]=2 128.60(天2),故所求标准差约为6.2128≈46〔天〕.答:估计这种日光灯平均寿命约为268天,标准差约为46天.点评:此例目是:掌握连续性随机变量平均值和标准差一种估计方法,即组中值估计法.因为前一节例3已介绍了连续性随机变量平均值估计方法,所以处理此例时应让学生回忆前例并主动探索解决问题方法.例4 容量是40样本中各数据与30差平方和是250,样本标准差是1.5,求样本平均数.分析:根据样本平均数、样本方差、样本标准差公式解题.解:∵(x 1-30)2+(x 2-30)2+…+(x 40-30)2=250,所以(x 12+x 22+…+x 402)-60(x 1+x 2+…+x 40)+40×302=250.即(x 12+x 22+…+x 402)-60×40x +40×900=250, ① 又∵140[(x 1-x )2+(x 2-x )2+…+(x 40-x )22=2.25, 即(x 12+x 22+…+x 402)-2x(x 1+x 2+…+x 40)+40x 2=90, 即(x 12+x 22+…+x 402)-80x 2+40x 2=90,② ①-②得40x 2-2 400x+40×900=160, 即x 2-60x +896=0,( x -32)( x -28)=0, 所以,x =32或x =28.点评:理解样本方差含义,抓住关键点:x 1+x 2+…+x 40=40x ,通过数形结合,结合消元x 1+x 2+…+x 40合理解决问题.例5 一组数据方差是s 2,将这组数据每个数据都加上10,求所得新数据方差.分析:利用方差公式解题.解:设原数据:x 1,x 2,…,x n ,平均数是x ,方差是s 2, 那么新数据为:x 1+10,x 2+10,…,x n +10,平均数为那么方差为n1[(x 1+10-x -10)2+(x 2+10-x -10)2+…+(x n +10-x -10)2]=n1[(x 1-x )2+(x 2-x )2+…+(x n -x )2]=s 2.变式训练某班有50名学生,某次数学考试成绩经计算得到平均分数是70分,标准差是s ,后来发现登记有误,某甲得70分却记为40分,某乙50分误记为80分,更正后重新计算得标准差为s 1,那么s 与s 1之间大小关系是〔 〕A.s=s 1B.s<s 1C.s>s 1解析:由题意,平均数不变,所以只要看与平均数离差平方变化情况.因为方差刻画了数据相对于平均值平均偏离程度.s 中有:(40-70)2+(80-70)2=1 000,s 1中有:(70-70)2+(50-70)2=400所以s>s 1.答案:C点评:由本例及变式可推理归纳方差性质:〔1〕假设给定一组数据x 1,x 2,…,x n ,方差为s 2,那么ax 1,ax 2,…,ax n 方差为a 2s 2;〔2〕假设给定一组数据x 1,x 2,…,x n ,方差为s 2,那么ax 1+b,ax 2+b,…,ax n +b 方差为a 2s 2,特别地,当a=1时,那么有x 1+b,x 2+b,…,x n +b 方差为s 2,这说明将一组数据每一个数据都减去一样一个常数,其方差是不变,即不影响这组数据波动性;〔3〕方差刻画了数据相对于平均值平均偏离程度.对于不同数据集,当离散程度越大时,方差越大;〔4〕方差单位是原始测量数据单位平方,对数据中极值较为敏感.知能训练课本本节练习解答:1.甲、乙两个班样本平均数为160,但甲班极差为3,乙班极差为30,故甲班波动较小.2. s 2=3=81[(k 1-k )2+(k 2-k )2+…+(k 8-k )2], 而883)...(28)3(2...)3(2)3(2821821⨯-+++=-+-+-k k k k k k =2k -3, s 12=18[(2k 1-6-2k+6)2+(2k 2-6-2k+6)2+…+(2k 8-6-2k+6)2]=4s 2=12.3.甲较稳定.4.甲平均值为10,方差为0.055;乙平均值为10,方差为0.105.点评:从练习中再次体会数据离散程度影响对事件客观判断,体会从平均数、离散程度角度对事件作出科学判断方法.课堂小结1.数据离散程度影响对事件客观判断,体会从平均数、离散程度角度对事件作出科学判断方法,方差与标准差越小,说明各个样本数据在样本平均数周围越集中;反之,方差与标准差越大,说明各个样本数据在样本平均数两边越分散;2.衡量离散程度常用计算方法——方差与标准差,熟悉用计算器计算方差与标准差方法,切实掌握相关计算公式、方法、步骤并对有关数据进展合理解释;3.样本有效选择对判断有重要影响,知道影响判断、决策因素是多方面,在对总体作出判断之前,要充分考虑各种因素,切实体会统计思想方法;4.样本数据既具有随机性又具有规律性,在很广泛条件下,简单随机抽样样本数字特征如众数、中位数、平均数、方差与标准差随样本容量增加及时稳定于总体相应数字特征,总体数字特征是一定,不存在随机性.作业课本习题2.3 3、5、7.设计感想本节课一定要让学生体会平均数反映是一组数据平均水平,而方差和标准差那么反映了一组数据波动大小.在实际学习、工作中用得非常多,比方选择运发动参加大型比赛时,要看他以前每次测试平均成绩,但成绩稳定性也非常重要;学习上也是如此,稳定了可以给最后考试提供稳定心理.用这种与生活息息相关性激发学生学数学无限兴趣就是教师最大收获.习题详解1. x =301(2×5.1+3×5.2+6×5.3+8×5.4+7×5.5+3×5.6+1×5.7)≈5.39. 该厂这个月平均日产值约为5.39万元.2.在全部数据中找出最小值4.0和最大值7.4,两者之差为3.4,确定全距为3.5,以组距0.5将区间[4.0,7.5]分成7个组.x =1001(4.25×1+4.75×2+5.25×15+5.75×28+6.25×33+6.75×18+7.25×3)=6.03,估计试验田里麦穗平均长度约为6.0 cm.3.〔1〕甲机床次品数平均值为1.5,乙机床次品数平均值为1.2,故乙机床次品数平均值较小;〔2〕甲方差为1.65,乙方差为0.82,故乙机床生产状况较为稳定.4.估计甲机床平均次品率约为(0×0.7+1×0.1+2×0.1+3×0.1)÷1 000=0.06%,乙机床平均次品率约为(0×0.5+1×0.3+2×0.2+3×0)÷1 000=0.07%,故甲机床产品质量较好.5.〔1〕此样本中金属棒平均长度约为5.99;〔2〕频率分布表如下:频率直方图如下:〔3〕6×(1-0.2%)≈5.99,6×(1+0.2%)≈6.01,故合格金属棒有15根,合格率约为15÷40≈37.5%.6.〔1〕频率分布表如下:频率分布直方图如下:(2)由组中值估计总体平均数为 (57×5+65×14+73×25+81×11+89×5)×601=72.6,约73次. 实际总体平均数约为72,误差约为1.20.52 kg ,未施新化肥土地平均每块土地产量为17.36 kg ,且施了新化肥土地产量方差约为83.33,未施新化肥土地产量方差约为154.88,说明用了新化肥不仅平均产量高,而且产量稳定,故可认为新化肥取得了成功.。
2013年河北省辛集市第三中学高二数学教案2.3《总体特征数的估计》(苏教版必修3)
教学目标一、知识与技能:理解为什么能用样本数据的平均值估计总体的水平;初步了解如何运用数学知识和方法进行统计研究,提高统计的准确性和科学性;二、过程与方法:通过具体实例的数字特征说明定义,并作出合理的解释及应用三、情感态度和价值观:体会从实际问题中提取数据,利用样本数据计算其平均值,并对总体水平作出估计的方法. 教学重点掌握从实际问题中提取数据,利用样本数据计算其平均值,并对总体水平作出估计的 方法. 教学难点能应用相关知识解决简单的实际问题. 教学过程一、问题情境 1.情境:在测量某物理量的过程中,因仪器和观察的误差,使得n 次测量分别得到a 1,a 2,…a n ,共n 个数据,如何确定该所测量物理量的“最佳近似值”? 二、学生活动处理实验数据的原则是使这个近似值与实验数据之间的离差最小.设这个近似值为x ,那么它与n 个实验值),,2,1(n i a i ⋯=的离差分别为1a x -,2a x -,3a x -,…,n a x -.由于上述离差有正有负,故不宜直接相加.可以考虑离差的平方和,即22221)()()(n a x a x a x -+⋯+-+-=22221212)(2nn a a a x a a a nx ⋯+++⋯++-, 所以当na a a x n⋯++=21时,离差的平方和最小,故可用na a a n⋯++21作为表示这个物理量的理想近似值.三、建构数学1.平均数最能代表一个样本数据的集中趋势,也就是说它与样本数据的离差最小;2.数据12,,,n a a a ⋯的平均数或均值,一般记为na a a a n⋯++=21__;3.若取值为12,,,n x x x ⋯的频率分别为12,,,n p p p ⋯,则其平均数为1122n n x x p x p x p =+++….四、数学运用例1. 若M 个数的平均数是X ,N 个数的平均数是Y ,则这M N +个数的平均数是-MX NYM N++;练习:如果两组数12,,,n x x x ⋯和12,,,n y y y ⋯的样本平均数分别是x 和y ,那么一组数1122,,,n n x y x x y ++⋯+的平均数是2x y+ . 例2.下面是某校学生日睡眠时间抽样频率分布表(单位:h),试估计该学生的日平均睡眠时间.分析:要确定这100名学生的平均睡眠时间,就必须计算其总睡眠时间,由于每组中的个体睡眠时间只是一个范围,可以用各组区间的组中值近似地表示.解法1:总睡眠时间约为6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=739(h)故平均睡眠时间约为7.39h.解法2:求组中值与对应频率之积的和6.25×0.05+6.75×0.17+7.25×0.33+7.75×0.37+8.25×0.06+8.75×0.02=7.39(h)答:估计该校学生的日平均睡眠时间约为7.39h.练习:某单位年收入在10 000到15 000、15 000到20 000、20 000到25 000、25 000到30 000、30 000到35 000、35 000到40 000及40 000到50 000元之间的职工所占的比分别为10%,15%,20%,25%,15%,10%和5%,试估计该单位职工的平均年收入.分析:上述百分比就是各组的频率.解:估计该单位职工的平均年收入为12 500×10%+17 500×15%+22 500×20%+27 500×25%+32 500×15%+37 500×10%+45 000×5%=26125(元)答:估计该单位人均年收入约为26125元.课上练习:第66页练习第2,3,4 ;五、回顾小结:1.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(平均数),会用样本的基本数字特征估计总体的基本数字特征;2.平均数对数据有“取中”的作用,代表一组数据的平均水平;3.形成对数据处理过程进行初步评价的意识.六、课外作业:课本第69页第1、2、4、6题.82页---12《学案与测评》反馈平台2,检测评估2,3,5,7,10备选例题§2.3.2方差与标准差教学目标一、知识与技能:通过实例是学生理解样本数据的方差、标准差的意义和作用;学会计算数据的方差、标准差;使学生掌握通过合理抽样对总体的稳定性水平作出科学估计的思想.二、过程与方法:通过具体例子来说明意义及内涵,并加以计算把握三、情感态度与价值观:体会反应离散程度的量的思想方法教学重点用样本数据的方差和标准差估计总体的方差与标准差.教学难点理解样本数据的方差、标准差的意义和作用,形成对数据处理过程进行初步评价的意识.教学过程一、问题情境1假如你是挑选人,你挑哪一位?为什么?二、学生活动:看平均成绩,但三个平均成绩都是9.4,这样需要看三人发挥的稳定程度 1、看极差:甲0.8,乙0.4,丙0.6 乙入选2、看与平均数的差别:甲:02+0.42+0.42=0.32;乙:0.22+02+0.22=0.08;丙:0.42+0.22+0.22=0.24;乙入选三、建构数学1.方差:一般地,设一组样本数据1x ,2x ,…,n x ,其平均数为-x ,则称2211()ni is x x n ==-∑为这个样本的方差.因为方差与原始数据的单位不同,且平方后可能夸大了离差的程度,我们将方差的算术平方根称为这组数据的标准差.2.标准差:21)(1-=-=∑x x n s ni i 标准差也可以刻画数据的稳定程度. 3.方差和标准差的意义: 描述一个样本和总体的波动大小的特征数,标准差大说明波动大.四、数学运用 1.例题:例1.甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm 2),试根据[(9.8-10)2 +(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02.乙品种的样本平均数也为10,样本方差为[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.24 因为0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定。
高中数学第2章统计2.3总体特征数的估计名师导航学案苏教版必修3
2.3整体特点数的预计名师导航三点分析在初中我们知道,整体均匀数 ( 又称为整体希望值 ) 描绘了一个整体的均匀水平,因为对好多整体来说,它的均匀数不易求得,常用简单求得的样本均匀数:x 1 ( x1x2x n ) 对它进行预计,并且常用两个样本均匀数的大小去近似地比较n相应的两个整体均匀数的大小.一、均匀数1.均匀数定义12n 1 n1若给定一组数据 x,x,, x,则称 x x i(i=1,2,3,, n) 为这组数据 x ,n i 1x2,, x n的均匀数 ( 或均值 ). 往常用样本均匀数来预计整体均匀数. 当所给数据中没有重复n1数据时,我们一般用此公式来求这组数据的均匀数. 这里x i+ +x ). 均匀数反(x +x12ni 1n映了一组数据的集中趋向,我们常用一组数据的均匀数来权衡这组数据的水平.当一组数据中的重复数据过多时,若用上边公式求这组数据的均匀数,其过程就会显得比较复杂和冗长,为了简化计算过程,我们引入下边这类计算均匀数的方法:一般地,若取值为 x1,x2,,x n的频次分别为p1,p2,,p n,则其均匀数为x1p1+x2p2+ +x n p n.这一公式本质上就是公式a1a2an的一个变形,它主要用于含有重复数据的数据组n求均匀数 .除此以外,当所给数据在某一常数 a 的上下颠簸时,我们也可利用公式: x x a , 其中 x 1(x 1′ +x2′ + +x n′ ) ,x1′ =x1-a,x 2′ =x2-a,x 3′ =x3-a ,, x n′ =x n-a ;常数 a 通n常取靠近于这组数据的均匀数较“整”的数.比如 : 求数据70,71, 72,73 的均匀数时,我们能够先求出0, 1, 2,3 的均匀数,然后将此均匀数加上70 即得该组数据的均匀数 .2.均匀数的性质(1)若给定一组数据x1,x2,, x n的均匀数为x ,则ax1,ax2,,ax n的均匀数为a x ;(2)若给定一组数据x, x,, x的均匀数为x ,则ax +b,ax+b,, ax +b 的均匀12n12n数为 a x +b;二、极差、方差与标准差在初中我们知道,极差、方差和标准差是描绘一个样本和整体的颠簸大小的特点数.1.极差的定义一组数据的最大值和最小值的差叫极差. 极差也能够对两组数据的集中程度进行对照,且比较简单 . 但两组数据的集中程度差别不大时,利用它就不易得出结论了. 并且它只利用了数据中的最大值和最小值,对极值过于敏感 . 但因为只波及到了两个数据,便于获取 . 所以极差在本质中也常常用到 .比如 : 数据 :25,41,37,22,14,19,39,21,42,40中的最大值为 42,最小值为14,它的极差为 42-14=28 .2 .方差的定义在一组数据x ,x, ,xn 中,各数据与它们的均匀数x 的差的平方的均匀数,叫做这组12数据的方差,记作2,即若给定一组数据x, x,, x221 n( x i x)2.s,则 s = s12nn i 1为了更好地比较两组数据的集中程度, 我们能够利用这两组数据的方差对两组数据进行比较 . 方差较大的数据颠簸较大;方差较小的数据颠簸较小. 当所给的数占有单位时,所求得的均匀数与原数据的单位同样,不要漏写单位. 方差的单位为所给数据单位的平方.3.方差的性质(1)若给定一组数据 x1, x2,, x n,方差为 s2,则 ax1, ax2,, ax n的方差为 a2s2;(2)若给定一组数据12n212n+b 的方差为x, x,, x ,方差为s,则 ax +b,ax+b,, ax22特别地,当 a=1 时,则有 x +b, x +b,, x+b 的方差为2a s ,s ,这说明将一组数据的每一12n个数据都减去同样的一个常数,其方差是不变的,即不影响这组数据的颠簸性;(3)方差刻画了数据相关于均值的均匀偏离程度. 关于不一样的数据集,当失散程度越大时,方差越大;(4)方差的单位是原始丈量数据单位的平方,对数据中的极值较为敏感.4.标准差刻画数据失散程度的胸怀,其理想形式应知足以下三条原则:(1)应充足利用所获取的数据,以便供给更切实的信息;(2)仅用一个数值来刻画数据的失散程度;(3)关于不一样的数据,当失散程度大时,该数值也大.我们上边提到的极差明显不知足第一条原则,因为它只利用了数据中最大和最小的两个值. 方差固然知足上边的三条原则,但是它有限制性 : 方差的单位是原始数据单位的平方,而刻画失散程度的一种理想胸怀应与原始观察数据拥有同样的单位. 解决这一限制性的方法就是取方差的算术平方根. 方差的算术平方根称作标准差,记作s,即s 1 n(x i x) 2标n i1准差的单位与原始丈量数据单位同样,能够减弱极值的影响.问题研究问题 1: 甲、乙两台机床同时生产直径为40 ㎜的部件 . 为了查验产品的质量,从两台机床生产的产品中各抽取10 件进行了丈量,结果以下:甲/mm40.039. 840.140.239. 940.040.239. 8 40.239. 8乙/mm40.040.039. 940.039. 940.140.139. 9能用几种方法比较这两台机床的性能?研究 : 经简单计算能够得出 : 甲、乙两台机床生产的这10 件产品的直径的均匀数都为40mm.所以,不可以从均匀数这一角度来比较这两台机床的性能, 即不可以从数据的均匀水平上来比较,只好从数据的失散程度长进行比较. 要从数据的失散程度长进行比较, 常有的方法有以下几种 :方法一 : 利用初中所学的折线统计图. 由折线统计图我们能够直观地表示出这两组数据的失散程度,甲机床生产的产品颠簸幅度比乙大. 所以,乙机床的性能好于甲 .方法二 : 利用这两组数据的极差进行比较. 甲:40.2-39.8=0.04 ;乙:40.1-39 .9=0.02 .显然,乙组数据的极差小于甲组数据的极差. 所以,乙机床的性能好于甲 .方法三 : 利用这两组数据的方差或标准差进行比较. 由方差和标准差的计算公式不难得出甲的方差为 s 甲2=0.026(mm2) ,标准差为 s 甲 =0.161(mm) ;乙的方差为 s 乙2=0.006(mm2) ,标准差为 s 乙=0.077(mm). 由上可知 : 无论是方差仍是标准差甲的均比乙的大,这就说明乙机床生产的产品要更标准些 . 所以,乙机床的性能好于甲 .问题 2: 某校拟派一名跳高运动员参加一项校际竞赛,对甲、乙两名跳高运动员进行了 8次选拔竞赛,他们的成绩( 单位 :m) 以下 :甲 :1.70,1.65,1.68,1.69,1.72,1.73,1.68,1.67;乙 :1.60,1.73,1.72,1.61,1.62,1.71,1.70,1.75.经展望,跳高 1.65m就很可能获取冠军. 该校为了获取冠军,可能选哪位选手参赛?若展望跳高 1.70 m 方可获取冠军呢?研究 : 参加竞赛的选手的成绩得突出,且成绩稳固 , 这就需要比较这两名选手的均匀成绩和成绩的方差 .甲的均匀成绩和方差以下 :x 甲1(1.70+1.65+1.68+1.69+1.72+1.73+1.68+1.67)=1.69, 8s21[ (1.70-1.69)22-1.69)2.甲 =+(1.65-1.69)+ +(1.67] =0.000 6 8乙的均匀成绩和方差以下 :x 乙1(1.60+1.73+1.72+1.61+1.62+1.71+1.70+1.75)=1.68, 8s乙2= 1[ (1.60-1.68)2+(1.73-1.68)2+ +(1.75-1.68)2] =0.003 15.8明显,甲的均匀成绩好于乙的均匀成绩,并且甲的方差小于乙的方差,说明甲的成绩比乙稳固 . 因为甲的均匀成绩高于乙,且成绩稳固,所以若跳高 1.65m 就很可能获取冠军 , 应派甲参赛 . 在这 8 次选拔赛中乙有 5 次成绩在 1.70 m以上,固然乙的均匀成绩不如甲,成绩的稳固性也不如甲,若跳高 1.70m 方可获取冠军时,应派乙参加竞赛.精题精讲例 1.在昨年的足球甲 A 联赛上,一队每场竞赛均匀失球数是 1.5 ,整年竞赛失球个数的标准差为 1.1 ;二队每场竞赛均匀失球数为 2.1 ,整年竞赛失球个数的标准差为0.4 .你以为以下说法中哪一种是正确的?(1)均匀说来一队比二队技术好;(2)二队比一队技术水平更稳固;(3)一队有时表现很差,有时表现又特别好;(4)二队极少不失球 .思路分析本题主要考察对均匀数和标准差的观点的理解. 均匀数反应了一组数据的均匀水平,而方差则反应了一组数据的颠簸性的大小 . 一队每场竞赛均匀失球数比二队每场竞赛均匀失球 数少, 说明一队的技术比二队的技术好; 一队整年竞赛失球个数的标准差较大,说明一队的表现时好时坏, 起伏较大;二队的均匀失球数多,整年竞赛失球个数的标准差很小,说明二队的表现较稳固,常常失球.答案 :(1)(2)(3)(4)都正确 .例 2.下边是某一个工厂全部工作人员在某个月的薪资,总经理6 000 元,技术工人甲900元,技术工作人员乙 800 元,杂工 640 元,服务员甲 700 元,服务员乙 640 元,会计 820元.(1) 计算全部工作人员的均匀薪资 . (2) 去掉总经理后,再计算均匀薪资 .(3)在 (1) 和 (2) 中两种均匀薪资哪一种能代表一般工人的收入水平,为何?思路分析计算均匀薪资是用薪资总数除以领薪资的人数即可.1 (6 000+900+800+640+700+640+820)=1答 案 :(1) 所 有 工 作 人 员 平 均 工 资 为 x500( 元 ).7(2) 去掉总经理后均匀薪资为 x1(900+800+640+700+640+820)=750( 元 ).(3)6750 元 . 因为除掉总经理能代表一般工人的收入水平的是去掉总经理后的均匀薪资 以外,工作人员的薪资均在900 元以下,所以不可以以 1 500 元来代表员工的均匀薪资水平 .绿色通道一般地,在一组数据中,均匀数、众数、中位数能够反应该组数据的集中趋向和均匀水平,但有时需要去掉极端值( 极大值或极小值 ), 这样计算均匀数则更能反应均匀水平,这就是有些竞赛活动中常常会去掉一个最大值和一个最小值再去计算均匀成绩的原由 .例 3.甲、乙两工人同时加工一种圆柱部件,在他们所加工的部件中各抽取 10 个进行直径检测,测得数据以下 ( 单位 :mm):甲 :19.9 , 19.7 , 19.8 ,20.0 , 19.9 , 20.2 , 20.1 , 20.3 , 20.2 , 20.1 ;乙 :20.0 , 20.2 , 19.8 ,19.9 , 19.7 , 20.2 , 20.1 , 19.7 , 20.2 , 20.4 .(1) 分别计算上边两个样本的均匀数和方差;(2)若部件规定直径为 20.0 ±0.5(mm),依据两个样本的均匀数和方差,说明谁加工的部件的质量较稳固 .思路分析利用均匀数和方差的计算公式进行计算,再比较谁的部件的质量较稳固 . 因为方差能说明一组数据颠簸性的大小, 则可经过比较这两个样本的方差的大小来比较两人加工部件的稳定性 .答案 :(1) x 甲 =20.02 , x 乙 =20.02,21 n( x i x) 222.利用 s =, 可得 s 甲 =0.033 6,s乙=0.041 6 n i 1∵s甲 2<s乙 2,∴甲工人加工部件的质量比较稳固.绿色通道比较两人加工部件的质量的稳固性,这里经过均匀数比较不出来,需要使用方差来比较,方差越大说明颠簸性较大,质量越不稳固. 一般地,方差和标准差往常用来反应一组数据的颠簸大小 . 在统计中,样本的方差和标准差往常用来预计整体数据的颠簸大小.例 4.从 2001 年 2 月 21 日 0 时起,中国电信履行新的电话收费标准,此中当地网营业区内通话费是 : 前 3min 为 0.2 元 ( 不足 3min 的按 3min 计算 ) ,此后每分钟加收0.1 元 ( 不足 1min 的按 1min 计算 ). 某礼拜天,一位学生检查了A、 B、 C、D、 E 五位同学某天打当地网营业区内电话的通话时间状况,原始数据如表1.表 1A B C D E第一次通话时间3min3min 45s3min 55s3min 20s6min第二次通话时间04min3min 40s4min 40s0第三次通话时间005min2min0表 2时间段频数累计频数0<t ≤33<t ≤44<t ≤55<t ≤6(1)问 D 同学这日的通话费是多少?(2) 设通话时间为 t min ,试依据表 1 填写频数 ( 落在某一时间段上的通话次数 ) 散布表(表 2).(3)调整前履行的原电话收费标准是 : 每 3 min 为 0.2 元 ( 不足 3 min 的按 3 min 计算 ).问: 这五位同学这日的本质均匀通话费与用原电话收费标准算出的均匀通话费对比,是增加了,仍是减少了?若增加,多多少?若减少,少多少?思路分析在解答本题时 , 要仔细分析题中所给的条件 , 分清不一样的时间段的话费状况 , 再进一步联合所学的数学知识 , 这样就不难求出结果 .答案 :(1)0.2+0.1+0.2+2×0.1+0.2=0.9(元) ,∴D同学这日通话费是0.9 元.(2)表 2时间段频数累计频数0<t ≤323<t ≤454<t ≤525<t ≤61 (3)设这五位同学这日的本质均匀通话费为x 元,按原电话收费标准算出的均匀通话费为x元,则 x =1(2 ×0.2+5 ×0.3+2 ×0.4+0.5)=0.64,x =15(2 ×0.2+8 ×0.4)=0.72 ,5x- x =0.72-0.64=0.08(元).∴这五位同学这日的本质均匀通话费比按原电话标准算出的均匀通话费减少了0.08元.绿色通道统计的学习重在应用,要学会从本质生活之中抽取数据,办理数据,解决本质问题. 本题中关于收费方式的正确理解是解决问题的重点.。
「精品」高中数学第2章统计2.3总体特征数的估计2.3.1平均数及其估计教学案苏教版必修3
2.3.1 平均数及其估计[新知初探]1.平均数的概念一组数据的总和除以数据的个数所得的商就是这组数据的平均数(或均值),一般记为:a =a 1+a 2+…+a nn.[点睛](1)平均数反映了一组数据的集中趋势,它是一组数据的“重心”,是度量一组数据波动大小的基准.(2)用样本平均数可估计总体平均数.(3)用平均数可以比较两组数据的总体情况,如成绩、产量等. 2.平均数的计算(1)定义法:已知x 1,x 2,x 3,…,x n 为某样本的n 个数据,则这n 个数据的平均数为x =x 1+x 2+x 3+…+x nn.(2)利用平均数性质:如果x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数是m x +a .(3)加减常数法:数据x 1,x 2,…,x n 都比较大或比较小,且x 1,x 2,…,x n 在固定常数a 附近波动,将原数据变化为x 1±a ,x 2±a ,…,x n ±a ,新数据的平均数为x ′,则所求原数据的平均数为x ′±a .(4)加权平均数法:样本中,数据x 1有m 1个,x 2有m 2个,…,x k 有m k 个,则x =m 1x 1+m 2x 2+…+m k x km 1+m 2+…+m k.(5)频率法:一般地,若取值为x 1,x 2,…,x n 的频率分别为p 1,p 2,…,p n ,则其平均数x =p 1x 1+p 2x 2+…+p n x n .(6)组中值法:若样本为n 组连续型数据,则样本的平均数=组中值与对应频率之积的和.[小试身手]1.(江苏高考)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 解析:x =4+6+5+8+7+66=6.答案:62.若数据x 1,x 2,x 3,…,x n 的平均数为2,则数据2x 1-1,2x 2-1,2x 3-1,…,2x n -1的平均数为________.答案:33.数据2,2,-4,-4,-4,3,3,3,3的平均数为________. 答案:49[典例] (1)某班45名同学的年龄(单位:岁)如下: 14 15 14 16 15 17 16 15 16 16 15 15 17 13 14 15 16 16 15 14 15 15 14 15 16 17 16 15 15 15 16 15 13 16 15 15 17 14 15 16 16 15 14 15 15, 求全班的平均年龄.(2)从高三年级中抽出50名学生参加数学竞赛,由成绩得到如图所示的频率分布直方图.试利用频率分布直方图估计高三年级学生的平均成绩. [解] (1)法一:利用平均数的公式计算.x =145×(14+15+…+15)=145×684=15.2(岁).法二:利用平均数的简化公式计算. 取a =15,将已知各数减去15,得-1 0 -1 1 0 2 1 0 1 1 0 0 2 -2平均数的计算-1 0 1 1 0 -1 0 0 -1 0 1 2 1 0 0 0 1 0 -2 1 0 0 2 -1 0 1 1 0 -1 0 0x′=145×(-1+0+…+0)=145×9=0.2(岁).x=x′+a=0.2+15=15.2(岁).法三:利用加权平均数公式计算.x=145×(13×2+14×7+15×20+16×12+17×4)=145×684=15.2(岁).即全班的平均年龄是15.2岁.(2)样本平均数是频率分布直方图的“重心”,即所有数据的平均数,取每个小矩形底边的中点值乘以每个小矩形的面积再求和即可.故平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.024×10)+95×(0.016×10)=76.2.[活学活用]1.某医院的急诊中心的记录表明以往到这个中心就诊的病人需等待的时间的分布如下:则到这个中心就诊的病人平均需要等待的时间估计为________.解析:x=2.5×0.2+7.5×0.4+12.5×0.25+17.5×0.1+22.5×0.05=9.5.答案:9.52.某班进行一次考核,满分5分,3分(包括3分)以上为合格,得1分,2分,3分,4分,5分的人数占该班人数的比例分别为5%,10%,35%,40%和10%,试求该班的平均得分.解:由于本题没有给出该班同学的人数,故无法用定义法求解.而题中给出了相应分数及所占比例,故可用频率平均数公式计算.x =1×0.05+2×0.10+3×0.35+4×0.40+5×0.10=3.4,故该班的平均分数为3.4分.[典例] 若x 1,x 2,…,x n 的平均数为x ,数据y 1,y 2,…,y n 的平均数为y ,求下列几组数据的平均数.(1)2x 1,2x 2,…,2x n ;(2)kx 1+a ,kx 2+a ,…,kx n +a ; (3)x 1+y 1,x 2+y 2,…,x n +y n .[解] 据题意x =1n(x 1+x 2+x 3+…+x n ),y =1n(y 1+y 2+…+y n ),设第一组数据平均数为z ,第二组数据平均数为甲,第三组数据平均数为乙. (1)z =1n (2x 1+2x 2+…+2x n )=2·1n(x 1+x 2+…+x n )=2x ,(2)甲=1n[(kx 1+a )+(kx 2+a )+…+(kx n +a )]=1n[k (x 1+x 2+…+x n )+na ]=k ·1n(x 1+x 2+…+x n )+a =k x +a .(3)乙=1n[(x 1+y 1)+(x 2+y 2)+…+(x n +y n )]=1n [(x 1+x 2+…+x n )+(y 1+y 2+…+y n )]=1n(x 1+x 2+…+x n )+1n(y 1+y 2+…+y n )=x +y .平均数的性质[活学活用]已知数据x 1,x 2,…,x n 的平均数为12,数据y 1,y 2,y 3,…,y n 的平均数为2,则数据2x 1+3,2x 2+3,…,2x n +3的平均数为________,数据ax 1+by 1,ax 2+by 2,…,ax n +by n 的平均数为________.答案:4 12a +2b层级一 学业水平达标1.已知1,2,3,4,a ,b ,c 的平均数是8,则a +b +c =________. 解析:据题意17(1+2+3+4+a +b +c )=8,∴a +b +c =46. 答案:462.已知2,4,2x,4y 四个数的平均数是5,而5,7,4x,6y 四个数的平均数是9,则xy 的值是________.解析:据题意⎩⎪⎨⎪⎧14+4+2x +4y =5,14+7+4x +6y =9,解之得⎩⎪⎨⎪⎧x =3,y =2.∴xy =6. 答案:63.在一次知识竞赛中,抽取40名选手,成绩分布如下:则选手的平均成绩是________.解析:x =140(6×2+7×5+8×7+9×11+10×15)=8.8.答案:8.81. 一位同学种了甲、乙两种树苗各1株,分别观察了9次、10次后,得到树苗高度的数据的茎叶图如图(单位:厘米).则甲种树苗高度平均为________;乙种树苗的高度平均为________;甲、乙两种树苗高度平均为________.解析:根据茎叶图可得,观察甲树苗9次得到的树苗高度分别为:14,20,21,23,24,30,32,33,37;观察乙树苗10次得到的树苗高度分别为:10,11,14,24,26,30,44,46,46,47,易得甲树苗高度平均为2349=26,乙树苗高度平均为29810=29.8,甲、乙两种树苗高度平均为119(234+298)=28.答案:26 29.8 285.50名同学参加数学竞赛,成绩的分组及各组的频数如下:(单位:分)[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.列出样本的频率分布表并求这50名同学的平均分.解:频率分布表如下:法一:总成绩约为45×2+55×3+65×10+75×15+85×12+95×8=3 810(分),故50名同学的数学平均分约为3 810÷50=76.2(分).法二:求组中值与对应频率之积的和.45×0.04+55×0.06+65×0.2+75×0.3+85×0.24+95×0.16=76.2(分).层级二应试能力达标1.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差是________.答案:-32.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是________.答案:91.5,91.53.一个企业,30%的员工年收入为1万元,65%的员工年收入为3万元,5%的员工年收入为11万元,则这个企业员工的年平均收入是________万元,年收入的中位数是________万元.解析:年平均收入为1×0.3+3×0.65+11×0.05=2.8,中位数为3. 答案:2.8 34.已知x 是x 1,x 2,…,x 100的平均数,a 是x 1,x 2,…,x 40的平均数,b 是x 41,x 42,…,x 100的平均数,则下列各式正确的是________.(填序号)①x =40a +60b 100;②x =60a +40b100;③x =a +b ;④x =a +b2.答案:①5.已知数据x 1,x 2,…,x 8的平均数为6,则数据2x 1-6,2x 2-6,…,2x 8-6的平均数为________. 答案:66.已知样本数据x 1,x 2,…,x n 的平均数为h ,y 1,y 2,…,y m 的平均数为k ,则把两组数据合并成一组以后,这组样本的平均数为____________.答案:nh +mk n +m7.一个高中研究性学习小组对本地区2014年至2016年快餐公司发展情况进行了调查,制成了该地区快餐公司个数情况的条形图和快餐公司盒饭年销售量的平均数情况条形图(如图),根据图中提供的信息可以得出这三年中该地区每年平均销售盒饭________万盒.解析:2014年:30×1.0=30(万),2015年:45×2.0=90(万),2016年:90×1.5=135(万),x =13(30+90+135)=85(万).答案:858.某餐厅共有7名员工,所有员工的工资情况如下表:解答下列问题:(1)餐厅所有员工的平均工资是________.(2)所有员工工资的中位数是________.(3)用平均数还是用中位数描述该餐厅员工工资的一般水平比较恰当?________.(4)去掉经理的工资后,其他员工的平均工资是________,是否也能反映该餐厅员工工资的一般水平?________.(填“能”或“不能”)解析:(1)平均工资为(3 000+700+500+450+360+340+320)÷7=810.(2)由表格可知中位数为450.(3)用中位数描述该餐厅员工工资的一般水平比较恰当.(4)去掉经理的工资后,其他员工的平均工资为(700+500+450+360+340+320)÷6=445.平均工资能反映该餐厅员工工资的一般水平.答案:(1)810 (2)450 (3)中位数(4)445 能9.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A 药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.52.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4服用B药的20位患者日平均增加的睡眠时间:3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.41.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解:(1)设A 药观测数据的平均数为x ,B 药观测数据的平均数为y . 由观测结果可得x =120×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,y =120×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得x >y ,因此可看出A 药的疗效更好. (2)由观测结果可绘制如下茎叶图:以上茎叶图可以看出,A 药疗效的试验结果有710的叶集中在茎2,3上,而B 药疗效的试验结果有710的叶集中在茎0,1上,由此可看出A 药的疗效更好.10.有一组数据:x 1,x 2,…,x n (x 1<x 2<…<x n )的算术平均数为10,若去掉其中最大的一个,余下数据的算术平均数为9;若去掉其中最小的一个,余下数据的算术平均数为11.(1)求出第一个数x 1关于n 的表达式及第n 个数x n 关于n 的表达式;(2)若x 1,x 2,…,x n 都是正整数,试求第n 个数x n 的最大值,并举出满足题目要求且x n 取到最大值的一组数据.解:(1)依条件得⎩⎪⎨⎪⎧x 1+x 2+…+x n =10n , ①x 1+x 2+…+x n -1=n -, ②x 2+x 3+…+x n =n -, ③由①-②得x n =n +9.又由①-③得x 1=11-n .(2)由于x 1是正整数,故x 1=11-n ≥1⇒1≤n ≤10,故x n =n +9≤19.当n =10时,x 1=1,x 10=19,x 2+x 3+…+x 9=80,此时,x 2=6,x 3=7,x 4=8,x 5=9,x 6=11,x 7=12,x 8=13,x 9=14.。
高中数学第2章统计2.3总体特征数的估计2.3.1平均数及其估计知识导引学案苏教版必修3
2.3.1 平均数及其估计案例探究为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5~18岁的男生的体重情况,结果如下(单位:kg)56.5 69.5 65 61.5 64.5 66.5 64 64.576 58.5 72 73.5 56 67 70 57.565.5 68 71 75 62 68.5 62.5 6659.5 63.5 64.5 67.5 73 68 55 7266.5 74 63 60 55.5 70 64.5 5864 70.5 57 62.5 65 69 71.5 7362 58 76 71 66 63.5 56 59.563.5 65 70 74.5 68.5 64 55.5 72.566.5 68 76 57.5 60 71.5 57 69.574 64.5 59 61.5 67 68 63.5 5859 65.5 62.5 69.5 72 64.5 75.5 68.564 62 65.5 58.5 67.5 70.5 65 6666.5 70 63 59.5根据上述数据我们可以画出样本的频率分布直方图,并对相应的总体分布作出估计.由于图中各小长方形的面积等于相应各组的频率,这个图形的面积反映了数据落在各个小组的频率的大小.在得到了样本的频率后,就可以对相应的总体情况作出估计.例如从这些样本数据的频率分布直方图可以看出,体重在(64.5,66.5)kg的学生比体重为其他值的学生数多,但他并没有告诉我们多多少.试问:怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?能否用一个数值来描写样本数据的离散程度?初中我们曾经学过众数、中位数、平均数等各种数字特征.应当说,这些数字都能够为我们提供关于样本数据的特征信息.我们常用算术平均数∑=niian11(其中a i(i=1,2,…,n)为n个实验数据)作为体重的最理想的近似值,它的依据是什么呢?处理实验数据的原则是使这个近似值与实验数据之间的离差最小,设这个近似值为x,那么它与n个实验值a i(i=1,2,…,n)的离差分别为x-a1,x-a2,x-a3,…,x-a n.由于上述离差有正有负,故不宜直接相加.可以考虑将各个离差的绝对值相加,研究|x-a1|+|x-a2|+…+|x-a n|取最小值时x的值.但由于含有绝对值,运算不太方便,所以,考虑离差的平方和,即(x-a1)2+(x-a2)2+…+(x-a n)2,当此和最小时,对应的x的值作为近似值.因为(x-a1)2+(x-a2)2+…+(x-a n)2=nx2-2(a1+a2+…+a n)x+a12+a22+…+a n2,所以当x=naaan)(21+++Λ时离差的平方和最小,故可用naaan)(21+++Λ作为表示体重的理想近似值,称其为这n个数据a1,a2,…,a n的平均数(average)或均值(mean),一般记为x=naaan)(21+++Λ.这样,我们可以用计算器求得,该地区内100名年龄为17.5~18岁的男生的体重的最佳近似值为x=65.5(kg).这样我们就得到了样本平均数的求解方法:样本数据的算术平均数,即x=nxxxn)(21+++Λ.Excel中函数“AVERAGE()”可直接用于计算给定数据的平均数.如求12,12.4,12.8,13,12.2,12.8,12.3,12.5,12.5的平均数,可直接把它们输到工作表中A1∶J1区域后,在某空白单元格中输入“=AVERAGE(A1∶H1)”即可,即得它们的平均数为12.5(如下图).自学导引1.在频率分布直方图中,众数是指最高矩形的中点的横坐标,中位数是指样本数据中累积频率为0.5时所对应的样本数据值,平均数是指样本数据的算术平均数.2.下列数字特征一定是数据组中数据的是()A.众数B.中位数C.标准差 D.平均数答案:A3.数据:1,1,3,3的众数和中位数分别是()A.1或3,2 B.3,2C.1或3,1或3 D.3,3答案:A4.频率分布直方图的重心是()A.众数 B.中位数C.标准差 D.平均数答案:D疑难剖析【例1】某校高一年级的甲、乙两个班级(均为50人)的语文测试成绩如下:(总分:150)甲班:112 86 106 84 100 105 98 102 94 107 87 112 94 94 99 90 120 98 95 119 108 100 96 115 111 104 95 108 111 105 104 107 119 107 93 102 98 112 112 99 92 102 93 84 94 94 100 90 84 114 乙班:116 95 109 96 106 98 108 99 110 103 94 98 105 101 115 104 112 101 113 96 108 100 110 98 107 87 108 106 103 97 107 106 111 121 97 107 114 122 101 107 107 111 114 106 104 104 95 111 111 110试确定这次考试中,哪个班的语文成绩更好些.思路分析:我们可用一组数据的平均数衡量这组数据的水平,因此,分别求得甲、乙两个班级的平均分即可.解析:用科学计算器或计算机分别求得甲班的平均分为101.1,乙班的平均分为105.4,故这次考试乙班成绩要好于甲班.【例2】某教师出了一份共3道题的测试卷,每题1分,全班得3分、2分、1分和0分的学生所占比例分别为0.3、0.5、0.1和0.1.(1)若全班共10人,则平均分是多少?(2)若全班共20人,则平均分是多少?(3)若该班人数未知,能求出该班的平均分吗?思路分析:上述所占比例就是各数据的频率.解:由题意,平均分=3×0.3+2×0.5+1×0.1=2.答:全班的平均分为2分.思维启示:各数据频率确定时,平均数不受样本容量的影响.【例3】某工厂人员及工资构成如下表:人员经理管理人员高级技工工人学徒合计周工资 2 200 250 220 200 100人数 1 6 5 10 1 23合计 2 200 1 500 1 100 2 000 100 6 900(1)指出这个问题中周工资的众数、中位数、平均数;(2)这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么?思路分析:根据众数、中位数、平均数各自的特点,选择合适的数据反映该厂的工资水平.解析:由表格可知:众数=200, ∵23的中间位置众数是12, ∴中位数=220.平均数=(2 200+1 500+1 100+2 000+100)÷23=300.虽然平均数为300元/周,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.思维启示:平均数受数据中的极端值的影响较大,妨碍了对总体估计的可靠性,这时平均数反而不如众数、中位数更能反映客观情况.拓展迁移【拓展点1】 以往的招生统计数据显示,某大学录取的新生高考总分的中位数基本上稳定在550分.你的一位校友在今年的高考中得了520分,你是立即劝阻他报考这所大学,还是先查阅一下这所大学招生的其他信息?解释一下你的选择. 提示:应该查阅一下这所大学的其他招生信息,例如平均信息、最低录取分数线信息等,尽管该校友的分数位于中位数之下,而中位数本身并不能提供更多录取分数分布的信息.在已知最低录取分数线的情况下,很容易作出判断;在已知平均数的情况下,如果平均数小于中位数很多,则说明最低录取分数线较低,可以推荐该校友报考这所大学,否则还要获取其他的信息(如标准差的信息)来作出判断.【拓展点2】 在一次人才招聘会上,有一家公司的招聘员告诉你,“我们公司的收入水平很高”,“去年,在50名员工中,最高年收入达到了100万,他们年收入的平均数是3.5万”.如果你希望获得年薪2.5万元,(1)你是否能够判断自己可以成为此公司的一名高收入者? (2)如果招聘员继续告诉你,“员工收入的变化范围是从0.5万到100万”,这个信息是否足以使你作出自己是否受聘的决定?为什么?(3)如果招聘员继续给你提供了如下信息,员工收入的中间0.5(即去掉最少的0.25和最多的0.25后所剩下的)的变化范围是1万到3万,你又该如何使用这条信息来作出是否受聘的决定?(4)你能估计出收入的中位数是多少吗?为什么均值比估计出的中位数高很多? 答案:(1)不能,因为平均收入和最高收入相差太多,说明高收入的职工只占极少数.现在已经知道至少有一个人的收入为x 50=100万元,那么其他员工的收入之和为∑=491i ix=3.5×50-100=75(万元),每人平均只有1.53万元.如果再有几个收入特别高者,那么初进公司的员工的工资会更低. (2)公司的员工的收入将会很低. (3)可以确定有0.75的员工工资在1万元以上,其中0.25的员工工资在3万元以上. (4)收入的中位数大约是2万元.因为有年收入100万这个极端值的影响,使得年平均收入比中位数高许多.。
2018-2019学年数学苏教版必修3教学案:第1部分 第2章 2.3 总体特征数的估计-含解析
2013年全国青年歌手电视大奖赛决赛中十位评委在第一轮决赛中给某选手打分是:9,9,8,9,10,9,8,10,9,9.问题1:根据初中学过的知识,能计算得分的平均数吗?提示:能.x=110(9+9+8+9+10+9+8+10+9+9)=9.问题2:想一想,还有其它计算平均分的方法吗?提示:有.x=110(8×2+9×6+10×2)=9.1.平均数的概念一组数据的总和除以数据的个数所得的商就是这组数据的平均数(或均值),一般记为:a=a1+a2+…+a nn.2.平均数的计算(1)定义法:n个数据a1,a2,…,a n的平均数为:a=a1+a2+…+a nn.(2)平均数公式:①在n个数据中,如果x1出现f1次,x2出现f2次,…,x k出现f k次(f1+f2+…+f k=n),则这n个数的平均数为:x=x1f1+x2f2+…+x k f kn.②若取值为x1,x2,…,x n的频率分别为p1,p2,…,p n,则其平均数为x=x1p1+x2p2+…+x n p n.2013年9月某军校大一新生军训期间,甲、乙两同学在相同条件下练习射击,每人打5发子弹,命中环数如下:问题1提示:x甲=8,x乙=8.问题2:利用x甲和x乙的大小关系能否判断两同学的射击水平的高低?提示:不能.因为x甲=x乙.问题3:观察比较上面表格中的两组数据,哪个同学的射击更稳定些?提示:甲各次的命中环数更靠近在命中的平均环数8附近,故甲的射击更稳定些.问题4:除观察分析外是否有更准确的方法判断上述问题?提示:有.极差、方差、标准差:(1)极差:一组数据的最大值与最小值的差.(2)方差与标准差:设一组样本数据x1,x2,…,x n,其平均数为x,则称s2=1n ∑i=1n(x i-x)2为这个样本的方差,其算术平方根s=1n∑i=1n(x i-x)2为样本的标准差,分别简称样本方差、样本标准差.其中,标准差的单位与原始测量单位相同,方差的单位是原始数据单位的平方.(3)方差及标准差的意义:刻画一组数据的稳定程度.1.众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数、众数都不具有的性质.2.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.[例1] 某公司的33名职工的月工资(以元为单位)如下:(2)假设副董事长的工资从5 000元提升到20 000元,董事长的工资从5 500元提升到 30 000元,那么新的平均数又是什么(精确到元)(3)你认为平均数能否反映这个公司员工的工资水平?结合此问题谈一谈你的看法. [思路点拨]先求出平均数,再根据平均数的意义及影响平均数的因素作答.[精解详析](1)平均数是x =133(5 500+5 000+2×3 500+3 000+5×2 500+3×2 000+20×1 500)=69 00033≈2 091(元).(2)平均数x ′=133(30 000+20 000+2×3 500+3 000+5×2 500+3×2 000+20×1500)=108 50033≈3 288(元).(3)在这个问题中,因为公司中少数人的工资额与大多数人的工资额差别较大,所以平均数不能反映这个公司员工的工资水平.[一点通]1.计算平均数时可直接套用公式计算.2.众数体现了样本数据的最大集中点,中位数是样本数据的“中心”,平均数则描述了数据的平均水平.1.一位同学种了甲、乙两种树苗各1株,分别观察了9次、10次后,得到树苗高度的数据的茎叶图如图(单位:厘米).则甲种树苗高度平均为________;乙种树苗的高度平均为________;甲、乙两种树苗高度平均为________.解析:根据茎叶图可得,观察甲树苗9次得到的树苗高度分别为:14,20,21,23,24,30,32,33,37;观察乙树苗10次得到的树苗高度分别为:10,11,14,24,26,30,44,46,46,47,易得甲树苗高度平均为2349=26,乙树苗高度平均为29810=29.8,甲、乙两种树苗高度平均为119(234+298)=28. 答案:26 29.8 282.某公司销售部有营销人员15人,销售部为了制定某种商品的月销售定额,统计了这15人某月的销售量如下:(1)(2)假设销售部负责人把每位营销员的月销售额定为320件,你认为是否合理?为什么?如不合理,请你制定一个较合理的销售定额,并说明理由.解:(1)平均数为: x =1×1 800+1×510+3×250+5×210+3×150+2×1201+1+3+5+3+2=320(件).中位数为210件;众数为210件.(2)不合理.因为15人中有13人的销售额达不到320件,320虽是所给数据的平均数,它却不能反映营销人员的一般水平,销售额定为210件合适一些,因为210既是中位数,又是众数,是大部分人能达到的定额.[例2] 从甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下(单位:cm): 甲:25 41 40 37 22 14 19 39 21 42乙:27 16 44 27 44 16 40 40 16 40 问:(1)哪种玉米苗长得高? (2)哪种玉米苗长得齐?[思路点拨] 计算均值与方差后,作出结论. [精解详析] (1)∵x 甲=110(25+41+40+37+22+14+19+39+21+42)=110×300=30(cm),x 乙=110(27+16+44+27+44+16+40+40+16+40) =110×310=31(cm). ∴x 甲<x 乙,即乙种玉米苗长得高. (2)s 2甲=110[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=110(25+121+100+49+64+256+121+81+81+144) =110×1 042=104.2, s 2乙=110[(2×272+3×162+3×402+2×442)-10×312] =110×1 288=128.8, ∴s 2甲<s 2乙,即甲种玉米苗长得齐.[一点通] 数据的离散程度可以通过极差、方差或标准差来描述.(1)极差是数据的最大值与最小值的差.它反映了一组数据变化的最大幅度,它对一组数据中的极端值非常敏感.(2)方差则反映了一组数据围绕平均数波动的大小.为了得到以样本数据的单位表示的波动幅度通常用标准差,即样本方差的算术平方根,是样本数据到平均数的一种平均距离.3.为了分析某篮球运动员在比赛中发挥的稳定程度,统计了该运动员在6场比赛中的得分,用茎叶图表示如图,则该组数据的方差为________.解析:该运动员6场的总得分为14+17+18+18+20+21=108,平均得分为1086=18,1 4 7 8 8 20 1方差=16[(14-18)2+(17-18)2+(18-18)2+(18-18)2+(20-18)2+(21-18)2]=5.答案:54.对划艇运动员甲、乙两人在相同条件下进行了6次测试,测得他们最大速度(单位:m/s)的数据如下:甲 27,38,30,37,35,31; 乙 33,29,38,34,28,36.根据以上数据,可以判断________更优秀. 解析:x甲=16(27+38+30+37+35+31)=33(m/s). s 2甲=16[(27-33)2+(38-33)2+…+(31-33)2]=946≈15.7(m 2/s 2). x乙=16(33+29+38+34+28+36)=33(m/s), s 2乙=16×[(33-33)2+(29-33)2+…+(36-33)2]=766≈12.7(m 2/s 2) ∴x甲=x 乙,s 2甲>s 2乙,说明甲乙两人的最大速度的平均值相同,但乙比甲更稳定,乙比甲更优秀.答案:乙[例3] (12分)从高三年级中抽出50名学生参加数学竞赛,由成绩得到如下的频率分布直方图,如图.试利用频率分布直方图估计: (1)这50名学生成绩的众数与中位数; (2)高三年级学生的平均成绩.[思路点拨] 由频率分布直方图读取数据后结合众数、中位数、平均数的含义作出分析. [精解详析] (1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小矩形的中间值的横坐标即为所求,所以众数应为分)由于中位数是所有数据中的中间值,故在频率分布直方图中中位数左边和右边的频数应相等,即频率也相等,从而小矩形的面积和相等.因此,在频率分布直方图中将所有小矩形的面积一分为二的直线所对应的成绩即为所求.∵0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,∴前三个小矩形的面积和为0.3,而第四个小矩形的面积为0.03×10=0.3,且0.3+0.3>0.5,∴中位数应位于第四个小矩形内.(6分)设中位数为x,又第四个小矩形的高为0.03,令0.03(x-70)=0.2得x≈76.7,故中位数为76.7. (8分)(2)样本平均数是频率分布直方图的“重心”,即所有数据的平均数,取每个小矩形底边的中点值乘以每个小矩形的面积再求和即可.(10分) 故平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.024×10)+95×(0.016×10)=76.2. (12分) [一点通]利用频率分布直方图估计数字特征:(1)众数是最高的矩形的底边的中点.(2)中位数左右两边直方图的面积应相等.(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.5.甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示:(1)请填写下表:(2)①从平均数和中位数相结合看,谁的成绩好些?②从平均数和命中9环以上(含9环)的次数相结合看,谁的成绩好些? ③从折线图中两人射击命中环数的走势看,谁更有潜力? 解:(1)由题图可知甲的平均数是7,中位数是7.5, 命中9环以上(含9环)的次数是3;乙的平均数是7,中位数是7,命中9环以上(含9环)的次数是1. (2)由(1)知,甲、乙的平均数相同.①甲、乙的平均数相同,甲的中位数比乙的中位数大,所以甲成绩较好.②甲、乙的平均数相同,甲命中9环以上(含9环)的次数比乙多,所以甲成绩较好. ③从折线图中看,在后半部分,甲呈上升趋势,而乙呈下降趋势,故甲更有潜力. 6.一名射击运动员射击8次所中环数如下: 9.9 10.3 9.8 10.1 10.4 10 9.8 9.7(1)求这8次射击的平均数x 是多少?标准差是多少?(2)环数落在①x -s 与x +s 之间;②x -2s 与x +2s 之间的各有几次,所占百分比各是多少?解:(1)x =9.9+10.3+9.8+10.1+10.4+10+9.8+9.78=10(环);s 2=18[(9.9-10)2+(10.3-10)2+(9.8-10)2+(10.1-10)2+(10.4-10)2+(10-10)2+(9.8-10)2+(9.7-10)2]=18(0.01+0.09+…+0.09)=0.448=0.055(环2) 所以s =0.055≈0.235(环) (2)①x -s =10-0.235=9.765,x +s =10+0.235=10.235,在这两个数据之间的数有5个,占到58=62.5%;②x -2s =10-0.235×2=9.53,x +2s =10+0.235×2=10.47,在这两个数据之间的数有8个,占到100%.1.利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致.但它们能粗略估计其众数、中位数和平均数.2.在实际问题中,仅靠平均数不能完全反映问题,因此还要研究样本数据偏离平均数的离散程度(即方差或标准差),标准差大说明样本数据分散性大,标准差小说明样本数据分散性小或者样本数据集中稳定.课下能力提升(十三)一、填空题1.一个样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,中位数为22,则x 等于________.解析:由于中间数有两个, 故x +232=22,即x =21. 答案:212.一组数据的方差是s 2,将这组数据中的每一个数据都乘以2,所得到的一组数据的方差是________.解析:s ′2=[(2x 1-2x )2+(2x 2-2x )2+…+(2x n -2x )2]n =4[(x 1-x )2+(x 2-x )2+…+(x n -x )2]n =4s 2答案:4s 23.甲、乙两名同学在5次体育测试中的成绩统计如茎叶图所示,若甲、乙两人的平均成绩分别是X 甲、X 乙,则下列结论正确的有________.甲 乙 8 7 2 7 8 6 8 2 8 291 5①X 甲<X 乙,乙比甲成绩稳定 ②X 甲>X 乙,甲比乙成绩稳定 ③X 甲>X 乙,乙比甲成绩稳定④X 甲<X 乙,甲比乙成绩稳定解析:∵甲同学的成绩为78,77,72,86,92,乙同学的成绩为78,82,88,91,95, ∴X 甲=78+77+72+86+925=81,X 乙=78+82+88+91+955=86.8,∴X 甲<X 乙,从茎叶图上数据的分布情况看,乙同学的成绩更集中于平均值附近,这说明乙比甲成绩稳定.答案:①4.若样本x 1+1,x 2+1,…,x n +1的平均数为10,其方差为2,则对于样本x 1+2,x 2+2,…,x n +2的平均数为________,方差为________.解析:∵(x 1+1)+(x 2+1)+…+(x n +1)n =10, 故x 1+x 2+…+x n =10n -n =9n , 故x 1+x 2+…+x n +2n =11n , ∴(x 1+2)+(x 2+2)+…+(x n +2)n=11, s 21=1n [(x 1+1-10)2+(x 2+1-10)2+…+(x n +1-10)2]=1n [(x 1-9)2+(x 2-9)2+…+(x n-9)2]=1n [(x 1+2-11)2+(x 2+2-11)2+…+(x n +2-11)2] =s 22.故所求的平均数为11,方差为2. 答案:11 25.某人5次上班途中所花的时间(单位:分钟)分别为x 、y 、10、11、9.已知这组数据的平均数为10,方差为2,则|x -y |的值为________.解析:x =x +y +10+11+95=10,可得x +y =20,①根据方差的计算公式s 2=15[(x -10)2+(y -10)2+12+12]=2,可得x 2+y 2-20(x +y )+200=8,②由①②得|x -y |=4. 答案:4 二、解答题6.一次选拔运动员的比赛中,测得7名选手的身高(单位:cm)分布茎叶图如图,测得平均身高为177 cm ,有一名运动员的身高记录不清楚,其末位数记为x .(1)求x ; (2)求方差s 2.解:(1)180+181+170+173+178+179+170+x =177×7,即1231+x =1239, ∴x =8.(2)s 2=17(72+42+1+1+22+32+42)=967.7.假定以下数据是甲、乙两个供货商的交货时间(单位:天): 甲:10 9 10 10 11 11 9 11 10 10 乙:8 10 14 7 10 11 10 8 15 12估计两个供货商的交货情况,并判断哪个供货商的交货时间短一些,哪个供货商的交货时间比较具有一致性与可靠性.解:x 甲=110(10+9+10+10+11+11+9+11+10+10)=10.1(天) s 2甲=110[(10-10.1)2+(9-10.1)2+(10-10.1)2+(10-10.1)2+(11-10.1)2+(11-10.1)2+(9-10.1)2+(11-10.1)2+(10-10.1)2+(10-10.1)2]=0.49(天2);x乙=110(8+10+14+7+10+11+10+8+15+12)=10.5(天), s 2乙=110[(8-10.5)2+(10-10.5)2+(14-10.5)2+(7-10.5)2+(10-10.5)2+(11-10.5)2+(10-10.5)2+(8-10.5)2+(15-10.5)2+(12-10.5)2]=6.05(天2).从交货时间的平均数来看,甲供货商的交货时间短一些;从交货时间的方差来看,甲供货商的交货时间较稳定,因此甲供货商的交货时间比较具有一致性与可靠性.8.(安徽高考)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图.17 0 3 x 8 9 180 1(1)计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x 1,x 2,估计x 1-x 2的值.解:(1)设甲校高三年级学生总人数为n . 由题意知30n=0.05,解得n =600.样本中甲校高三年级学生数学成绩不及格人数为5,据此估计甲校高三年级这次联考数学成绩的及格率为1-530=56. (2)设甲、乙两校样本平均数分别为x ′1,x ′2.根据样本茎叶图可知30(x ′1-x ′2)=30x ′1-30x ′2 =(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92 =2+49-53-77+2+92 =15.因此x ′1-x ′2=0.5.故x 1-x 2的估计值为0.5分.。
江苏省泰兴中学高二数学苏教版必修3教学案:第2章03总体特征数的估计
江苏省泰兴中学高二数学讲义(59)整体特点数的预计【教课目的】1、会用样本均匀数预计整体希望值;2、会用公式计算样本方差、标准差.【要点难点】要点:样本均匀数、方差、标准差的计算难点:用方差预计整体颠簸的大小【例题剖析】例 1 、某校高二年级进行一次数学测试,抽取正确起见,以后又抽取50 人,算出其均匀成绩为预计此次数学测试的均匀成绩.40 人,算出其均匀成绩为80 分,为83 分,经过两次抽样的结果,例 2、下边是某校学诞辰睡眠时间的频次散布表(单位:h),预计该校学生的日均匀睡眠时间 .睡眠时间人数频次[6, 6.5)50.05[6.5 , 7)170.17[7, 7.5)330.33[7.5 , 8)370.37[8, 8.5)60.06[8.5 , 9)20.02共计1001例 3、某单位收入在 10000 到 15000、 15000 到 20000, 20000 到 25000、 25000 到 30000、30000 到 35000、35000 到 40000 及 40000 到 50000 之间的员工所占的比为10%,15%,20%,25%, 15%, 10%, 5%,试预计该单位员工的均匀收入.统计量均匀分方差组别例 4、设甲、第 1 组8016乙两名射手第 2 组9036各打 10 发子弹,每发子弹击中环数以下:甲: 10, 6,9, 10, 8, 7,9, 10, 5, 10乙: 7, 7, 8,10, 9, 8,7,9, 10, 9试问哪一名射手的射击技术较好?例 5、某班 40 人随机均匀分红两组,两组学生一次考试的成绩状况以下表:求全班的均匀分、方差、标准差.[学后反省 ]1、整体希望值即_________ .2、样本方差S2;样本标准差S.方差和标准差是反应________________的特点数;方差越小,其整体的颠簸性[ 稳固练习 ]1、某车间一周里加工一种部件的日产量,有 2 天是 35 件,有 1 天是 41 件,有4天是 37件,这周的均匀日产量是2、若 M个数的均匀数是X, N 个数的均匀数是Y, 则这 M+N 个数的均匀数是3、已知数据x1, x2, , x n的均匀数x5,方差S2 4 ,则数据3x17,3x27, ,3x n 7 的均匀数和标准差分别为4、甲、乙两人在相同的条件下各射靶10 次,各次命中的环数以下:甲:7, 8, 6,8, 5,9, 10, 7, 4, 6;乙: 9, 5,7, 8, 7,6, 8, 6,7, 7,这两人射击成绩比较稳固的是5、一个水库成活了某种鱼5000 条,从中捕捞了 10 条,称得它们的质量分别是(单位:斤):2.6, 2.1, 2.4, 2.5, 2.2, 2.3, 2.5, 2.8, 2.3, 2.5,预计里共有这类鱼斤6、已知样本数据12,10此中12, x3 的均匀数为a,45,10 的均匀数为b ,x, x, x,x , x x, x, x则样本数据的均匀数为__________________.7、车间甲、乙两班工人都加工一种轴,轴的直径要求200.5 mm,现从两班所生产的轴中各取 10 件加以查验,测得数据以下:甲20.120.320.020.219.919.819.919.720.220.1乙20.019.919.719.820.120.219.719.720.220.0(1)分别计算两组数据均匀数;(2)求样本的方差;(3)说明哪一班工人生产的轴较好.江苏省泰兴中学高二数学课后作业(59)班级: _______姓名:____________学号:_______ 1、假如一组数x1,x2、x3、x4、x5的均匀数是x ,则另一组数x1+ 1、x2+2,x3+ 3,x4+4、 x5的均匀数是2、若k1, k2,L k8的方差为 6,则2( k13), 2(k23),L 2(k83) 的标准差为3、已知实数x1, x2, , x n( n 2)的希望为x,方差为S2,m1n(x i a) 2,若 a x ,n i 1则 S2与 m 的大小关系为_________________.4、从A、 B 两种棉花中各抽10 株,测得它们的株高以下:(CM)A、 25 41 40 37 22 14 19 39 21 42B、 27 16 44 27 44 16 40 16 40 40(1) 哪一种棉花的苗长得高?(2)哪一种棉花的苗长得齐整?5、一个水库养了某种鱼10 万条,从中捕捞了20 条,称得它们的质量以下( 单位:KG)1.15 1.04 1.11 1.07 1.10 1.32 1.25 1.19 1.15 1.21 1.18 1.14 1.09 1.25 1.21 1.29 1.16 1.24 1.12 1.16计算样本均匀数,并依据计算结果预计水库里全部这类鱼的总质量约是多少?6、甲、乙两台车床加工同一型号的产品,各生产1000 只产品中次品数分别用x、 y 表示 .经过一段时间的察看,发现x 和 y 的频次散布以下表,问:那一台车床的产质量量较好?x0123P0.70.10.10.1y0123P0.50.30.207、下边左图是某县参加2009年高考的学生身高条形统计图,从左到右的各条形表示的学生人数挨次记为右图是统计A1、A2、、 A10(如 A2表示身高(单位: cm )( 150, 155)内的学生人数) . 左图中身高在必定范围内学生人数的一个算法流程图 . 现要统计身高在160~180cm(含 160cm,不含 180cm)的学生人数,那么在流程图中的判断框内应填写的条件是____________若 A1=100,A2 =200,A3=300,A4=450,A5=550,A6=500,A7=350,A8=250,A9=50,A10=25 修业生的均匀身高.。
高中数学新苏教版精品教案《苏教版高中数学必修3 2.3 总体特征数的估计》
总体特征数的估计【课堂互动】自学评价案例有甲乙两种钢筋现从中各抽取一个样本如下表检查它们的抗拉强度单位:g/mm2,通过计算发现,两个样本的平均数均为125.甲110 1202130 125 12021125 135 125 135 125乙115 100 125 130 115125 125 145 125 145哪种钢筋的质量较好【分析】在平均数相同的情况下,观察上述数据表,发现乙样本的最小值100低于甲样本的最小值110,最大值145高于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定.在平均数相同的情况下,比拟两组数据的极差能大概判断它们的稳定程度.极差: 我们把一组数据的最大值与最小值的差称为极差.从数据表上可以看出,乙的极差较大,数据较分散;甲的极差小,数据较集中,这就说明甲比乙稳定.运用极差对两组数据进行比拟,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论.这时,我们考虑用更为精确的方法——方差.在上一课时中,学习了总体平均数的估计,其中提到平均数是“最理想〞近似值的缘由.同样我们可以考虑每一抗拉强度与平均抗拉强度的离差,离差越小,稳定性就越高.那么,怎样来刻画一组数据的稳定程度呢?在上一课时中,设n个实验值=1,2,…,n的近似值为,那么它与这n个实验值=1,2,…,n的离差。
由于上述离差有正有负,故不宜直接相加.可以考虑将各个离差的绝对值相加,但由于含绝对值,运算不太方便,所以考虑离差的平方和,当此和最小时,对应的的值作为近似值,所以当时离差的平方和最小,故可用作为表示这个物理量的理想近似值,称其为这n个数据,,…,的平均数或均值,在上述过程中,可以发现,一组数据与其平均数的离差的平方和最小,考虑用与其平均数的离差的平方和来刻画一组数据的稳定程度是可行的.即本案例中,可用各次抗拉强度与平均抗拉强度的差的平方和表示.由于比拟的两组数据的容量可能不同,因此应将上述平方和除以数据的个数,我们把由此所得的值称为这组数据的方差。
2019年苏教版数学必修三第2章 2.3 总体特征数的估计
2.3 总体特征数的估计学习目标:1.通过实例理解样本的数字特征,如平均数、方差、标准差.2.会计算所给样本的平均数、方差、标准差.(重点)3.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征,并作出合理的解释.(难点)[自 主 预 习·探 新 知]1.众数一组数据中重复出现次数最多的数称为这组数的众数. 2.中位数把一组数据按从小到大的顺序排列,把处于中间位置的那个数称为这组数据的中位数.当数据个数为奇数时,中位数是按从小到大的顺序排列的中间的那个数.当数据个数为偶数时,中位数是按从小到大的顺序排列的最中间两个数的平均数.3.平均数(1)若给定一组数据a 1,a 2,…,a n ,则称a =1n ∑i =1na i =a 1+a 2+…+a n n 为这n个数据的平均数或均值.(2)若一组数据中取值为a 1,a 2,…,a n 的频率分别为p 1,p 2,…,p n ,则其平均数为a 1p 1+a 2p 2+…+a n p n .4.方差与标准差一般地,设样本数据分别是x 1,x 2,…,x n ,样本的平均数为x ,则称s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]为这个样本的方差,其算术平方根s =为样本的标准差,分别简称样本方差、样本标准差.5.极差一组数据的最大值与最小值的差称为极差.[基础自测]1.下面是高一八班十位同学的数学测试成绩:82,91,73,84,98,99,101,118,98,110,则该组数据的中位数是________.【导学号:20132104】98 [将这组数据从小到大排列为73,82,84,91,98,98,99,101,110,118,则最中间的两个数为98,98,故中位数为98.]2.在一段时间里,一个学生记录了其中10天他每天完成家庭作业所需要的时间(单位:分钟),结果如下:80,70,70,70,60,60,80,60,60,70.在这段时间里,该学生平均每天完成家庭作业所需时间是________分钟. 68 [平均每天所需时间为80×2+70×4+60×410=68.]3.某老师从星期一到星期五收到的信息数分别为10,6,8,5,6,则该组数据的方差s 2=________.3.2 [5个数据的平均数x =10+6+8+5+65=7.所以s 2=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=3.2.]4.已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为________.【导学号:20132105】2 [平均数x =15(1+2+3+4+5)=3,所以s =15[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]= 2.] 5.已知母鸡产蛋的最佳温度在20℃左右,下面是在甲、乙两地6个时间测得的温度,你认为甲、乙两地哪个更适合母鸡产蛋?[解析] 计算两组数据的平均数、极差、方差(或标准差)对比判断.[解](1)x甲=16×(5+17+25+24+7+6)=14,x乙=16×(10+15+20+17+12+10)=14.(2)极差:甲地温度极差=25-5=20;乙地温度极差=20-10=10.(3)标准差:s甲=16×[(5-14)2+…+(7-14)2+(6-14)2]≈8.4,s乙=16×[(10-14)2+…+(12-14)2+(10-14)2]≈3.5.显然两地的平均温度相同,乙地温度的极差、标准差较小,说明了乙地温度波动较小,因此乙地比甲地更适合母鸡产蛋.[合作探究·攻重难](1)一个球队所有队员的身高如下(单位:cm):178,178,182,182,178,180,178,180,181,180,181,180,180,182.则这个球队的队员平均身高是________cm(精确到1 cm).【导学号:20132106】(2)有容量为100的样本,数据分组及各组的频数、频率如下:[12.5,14.5),6,0.06;[14.5,16.5),16,0.16;[16.5,18.5),18,0.18;[18.5,20.5),22,0.22;[20.5,22.5),20,0.20;[22.5,24.5),10,0.10;[24.5,26.5],8,0.08.则该样本数据的平均数为________.(1)180(2)19.42[(1)法一:利用平均数的定义计算:平均身高x=114(178+178+182+182+178+180+178+180+181+180+181+180+180+182)=114×2 520=180(cm).法二:利用加权平均数公式计算:平均身高x=114(178×4+182×3+180×5+181×2)=114×2 520=180(cm).法三:利用新数据法进行计算:取a=180,将各数据同时减去180,得到一组新数据:-2,-2,2,2,-2,0,-2,0,1,0,1,0,0,2.这组新数据的平均数为x′=114(-2×4+2×3+0×5+1×2)=0,所以平均身高x=a+x′=180+0=180(cm).(2)利用频率平均数公式计算:样本数据平均数x=13.5×0.06+15.5×0.16+17.5×0.18+19.5×0.22+21.5×0.20+23.5×0.10+25.5×0.08=19.42.][规律方法] 1.一般情况下,要计算一组数据的平均数,可使用平均数公式来计算.2.如果x1,x2,…,x n的平均数为,那么mx1+a,mx2+a,…,mx n+a 的平均数是.当数据较大,且大部分数据在某一常数左右波动时,本例中“法三”可以减少运算量,故此法比较简便.3.一般地,如果在n个数中,x1出现的频数为f1,x2出现的频数为f2,…,xk出现的频数为f k其中f1+f2+…+f k=n,那么叫做这n个数的频数平均数,也称加权平均数,其中f1,f2,…,f k叫做权.如本例中“法二”.4.一般地,若取值为x1,x2,…,x n的频率分别为p1,p2,…,p n,那么其平均数为.如本例中求平均数方法.[提醒] 当条件给出某几个范围内的数据的频率或频数时,可用组中值求平均数.[跟踪训练]1.某商场买来一车苹果,从中随机抽取了10个苹果,其重量(单位:克)分别为150,152,153,149,148,146,151,150,152,147,由此估计这车苹果单个重量的平均值是________.149.8克 [平均数为x =150+152+153+149+148+146+151+150+152+14710=149.8(克).]2.将一组数据同时减去3.1,得到一组新数据,若原数据的平均数为x ,则新数据的平均数是________.x -3.1 [设原来数据为a 1,a 2,…,a n ,则a 1+a 2+…+a n =n x ,从而新数据的平均数为(a 1-3.1)+(a 2-3.1)+…+(a n -3.1)n =n x -3.1nn=x -3.1.](1)极差;(2)方差;(3)标准差.【导学号:20132107】[解析] 利用极差、方差、标准差的计算公式求解.[解] (1)该组数据中最大值为9,最小值为5,故该组数据的极差为9-5=4.(2)求方差可以有三种方法:法一:因为x =110(7×4+6×2+8×2+5+9)=7,所以s2=110×[(7-7)2+(6-7)2+…+(7-7)2]=1.2,法二:同“法一”,求得x=7,所以s2=110[(72+62+82+…+72)-10×72]=1.2,法三:将各数据减去7,得一组新数据:0,-1,1,1,-2,2,0,0,-1,0,则x′=0,所以x=x′+7=7.所以s2=110[02+(-1)2+12+…+02]-10×02=1.2.(3)由(2)知,标准差s=s2= 1.2=30 5.[规律方法] 1.极差是数据的最大值与最小值的差,它反映了一组数据变化的最大幅度,它对一组数据中的极端值非常敏感.2.方差的计算(1)计算方差的公式有三个:3.方差的性质(1)数据x 1,x 2,…,x n 与数据x 1+a ,x 2+a ,…,x n +a 的方差相等. (2)若数据x 1,x 2,…,x n 的方差为s 2,则数据ax 1+b ,ax 2+b ,…,ax n +b 的方差为.(3)标准差、方差的范围为.4.标准差的计算,方差的算术平方根即标准差,要求标准差先求出方差,再开方取其算术平方根即可.[提醒] 方差、标准差的单位不一致要注意区别. [跟踪训练]3.若一组样本数据2,3,7,8,a 的平均数为5,则该组数据的标准差s =________.1305 [由平均数为5,得a =5×5-(2+3+7+8)=5,则s 2=15(32+22+22+32+02)=265,s =265=1305.]4.已知样本x 1,x 2,x 3,x 4,x 5的方差为3,则样本4x 1+1,4x 2+1,4x 3+1,4x 4+1,4x 5+1的标准差是________.43 [根据方差的性质知4x1+1,4x2+1,4x3+1,4x4+1,4x5+1的方差为42×3=48.所以其标准差为48=4 3.](单位:cm):甲:25,41,40,37,22,14,19,39,21,42;乙:27,16,44,27,44,16,40,40,16,40.问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?【导学号:20132108】[解析]看哪种玉米的苗长得高,只要比较甲、乙两种玉米的平均高度即可;要比较哪种玉米的苗长得齐,只要看两种玉米高的方差即可,因为方差是体现一组数据波动大小的特征数.[解](1)x甲=110(25+41+40+37+22+14+19+39+21+42)=30(cm),x乙=110(27+16+44+27+44+16+40+40+16+40)=31(cm),因为x甲<x乙.故乙种玉米苗长得高.(2)s2甲=110[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=104.2(cm2).s2乙=110[(27-31)2+(16-31)2+(44-31)2+(27-31)2+(44-31)2+(16-31)2+(40-31)2+(40-31)2+(16-31)2+(40-31)2] =128.8(cm2).因为s2甲<s2乙,所以甲种玉米的苗长得齐.[规律方法] 反映总体的一般情况时用平均数来说明,反映总体的离散程度时则用方差或标准差来衡量.在不同的要求下注意对它们的选择.[跟踪训练]5.假定以下数据是甲、乙两个供货商的交货天数: 甲:10,9,10,10,11,11,9,11,10,10; 乙:8,10,14,7,10,11,10,8,15,12.根据以上数据估计两个供货商的交货情况:哪个供货商交货时间短一些?哪个供货商是比较具有一致性与可靠性的供货商?[解析] 先分别计算出甲、乙两组数据的平均数及方差,再作判断. [解] x 甲=110(10+9+…+10)=10.1,s 2甲=110(102+92+…+102)-10.12=0.49;x 乙=110(8+10+…+12)=10.5,s 2乙=110(82+102+…+122)-10.52=6.05>s 2甲.从交货天数的平均值来看,甲供货商的交货时间短一些;从方差来看,甲供货商的交货时间较稳定.因此甲供货商是比较具有一致性与可靠性的供货商.6.某校拟派一名跳高运动员参加一项校级比赛,对甲、乙两名跳高运动员进行了8次选拔比赛,他们的成绩(单位:m)如下:甲:1.70,1.65,1.68,1.69,1.72,1.73,1.68,1.67; 乙:1.60,1.73,1.72,1.61,1.62,1.71,1.70,1.75.经预测,成绩超过1.65 m 就很有可能获得冠军,该校为了获取冠军,可能选哪位选手参赛?若预测成绩超过1.70 m 方可获得冠军呢?【导学号:20132109】[解析] 参加比赛的选手的成绩得突出,且成绩稳定,这就需要比较这两名选手的平均成绩和成绩的方差.[解] 甲的平均成绩和方差如下:x 甲=18×(1.70+1.65+1.68+1.69+1.72+1.73+1.68+1.67)=1.69, s 2甲=18×[(1.70-1.69)2+(1.65-1.69)2+…+(1.67-1.69)2]=0.000 6.乙的平均成绩和方差如下:x 乙=18×(1.60+1.73+1.72+1.61+1.62+1.71+1.70+1.75)=1.68, s 2乙=18×[(1.60-1.68)2+(1.73-1.68)2+…+(1.75-1.68)2]=0.003 15. 显然,甲的平均成绩高于乙的平均成绩,而且甲的方差小于乙的方差,说明甲的成绩比乙稳定.由于甲的平均成绩高于乙,且成绩稳定,所以若成绩超过1.65 m 就很可能获得冠军,应派甲参赛.在这8次选拔赛中乙有5次成绩在1.70 m 以上,虽然乙的平均成绩不如甲,成绩的稳定性也不如甲,当成绩超过1.70 m 方可获得冠军时,应派乙参加比赛.2-3-1所示.图2-3-1(1)请填写下表:[解析] 从折线图可以看出甲、乙各射靶10次的环数分别为 甲:9,5,7,8,7,6,8,6,7,7; 乙:2,4,6,8,7,7,8,9,9,10. 把两组数据从小到大排列为甲:5,6,6,7,7,7,7,8,8,9;乙:2,4,6,7,7,8,8,9,9,10.甲的中位数为7+72=7,乙的中位数为7+82=7.5.x甲=110(5+6×2+7×4+8×2+9)=7,x乙=110(2+4+6+7×2+8×2+9×2+10)=7.s2甲=110[(5-7)2+(6-7)2×2+(7-7)2×4+(8-7)2×2+(9-7)2]=1.2,s2乙=110(22+42+62+72+72+82+82+92+92+102)-72=5.4.甲极差为9-5=4.乙极差为10-2=8.[解](1)(2)①甲、乙平均数相同,s2甲<s2乙,所以甲的成绩比乙稳定.②甲、乙平均数相同,命中9环以上的次数甲比乙少,故乙的成绩比甲好些.③甲的成绩在平均数上下波动,而乙处于上升势头,从第4次以后就没有出现比甲少的情况,所以乙比甲更有潜力.[规律方法]根据统计图中获取的有关信息来求对应数字特征.众数看最高长方形,中位数看中界线,平均数则要计算得到.,在平均数相同的条件下,可通过比较方差来判断“优选”“判定”性问题,方差越小,波动越小,成绩更好.[跟踪训练]7.为选派一名学生参加全市实践活动技能竞赛,A 、B 两位同学在校实习基地现场进行加工直径为20 mm 的零件的测试,他俩各加工的10个零件的相关数据依次如图2-3-2与下表所示.(单位:mm)图2-3-2(1)考虑平均数与完全符合要求的个数,你认为________的成绩好些; (2)计算出s 2B 的大小,考虑平均数与方差,说明谁的成绩好些;(3)考虑图中折线走势及竞赛中测试零件个数远远超过10个的实际情况,你认为派谁去参赛较合适?说明你的理由.【导学号:20132110】[解析] 从图中可得到B 同学加工的10个零件的数据依次为:20.0,20.0,20.0,19.9,20.0,20.0,19.9,19.9,20.1,20.2.又从表中可得这组数据的平均数为20.利用方差公式s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]可解得s 2B ,与s 2A 作比较之后可以作出判定.[解] (1)B .(2)∵s2B=110[5(20-20)2+3(19.9-20)2+(20.1-20)2+(20.2-20)2]=0.008,且s2A=0.026,∴在平均数相同的情况下,B的波动性小,∴B的成绩好些.(3)从图中折线走势可知,尽管A的成绩前面起伏较大,但后来逐渐稳定,误差小,预测A的潜力大,可选派A去参赛.8.某校从参加高一年级期末考试的学生中抽出60名学生,将其成绩(均为整数)分成六段[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]后,画出如图2-3-3所示频率分布直方图.图2-3-3观察图2-3-3,回答下列问题:(1)求第四小组的频率,并补全这个频率分布直方图;(2)估计这次考试的及格率(60分及以上为及格);(3)估计这次考试的平均分.[解析](1)求出第四小组的频率,再补全频率分布直方图,第四小组频率等于1减去其它各组频率所得的差.(2)及格率为60分以上的分数所在的第三、四、五、六组的频率和.(3)各组组中值乘以各组频率再相加所得的和即为这次考试的平均分.[解](1)因为各组的频率和为1,所以第四组的频率f4=1-(0.025+0.015×2+0.01+0.005)×10=0.3.频率分布直方图如图所示.(2)依题意,60分及以上的分数所在的第三、四、五、六组的频率和为0.75. 所以估计这次考试及格率为75%.(3)平均分为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.[当堂达标·固双基]1.已知1,2,3,4,x1,x2,x3的平均数是8,那么x1+x2+x3的值是________.46[由条件知,1+2+3+4+x1+x2+x3=8×7.所以x1+x2+x3=46.]2.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4. 则:(1)平均命中环数为________;(2)命中环数的标准差为________.(1)7(2)2[(1)x=110(7+8+7+9+5+4+9+10+7+4)=7.(2)s2=110[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,所以s=s2=4=2.]3.已知一个样本为1,3,2,5,x,它的平均数是3,则这个样本的标准差是________.【导学号:20132111】2[x=1+3+2+5+x5=3,∴x=4.由方差公式有:s 2=15[(1-3)2+(3-3)2+(2-3)2+(5-3)2+(4-3)2]=2,∴s = 2.]4.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场做的9个分数的茎叶图后来有一个数据模糊,无法辨认,在图2-3-4中以x 表示:图2-3-4则7个剩余分数的方差为________.367 [由茎叶图知去掉一个最高分和一个最低分后,所剩数据依次是87,90,90,91,91,94,90+x .∴这组数据的平均数是87+90+90+91+91+94+90+x7=91,∴x =4.∴这组数据的方差是17(16+1+1+0+0+9+9)=367.]5.有两位射击运动员在一起射击,测试中各射靶10次,每次命中的环数如下:甲:8,7,9,7,5,4,10,9,7,4; 乙:5,9,8,7,7,6,6,8,7,7.如果这是一次选拔性考核,应当选择谁?【导学号:20132112】[解析] 平均数反映总体的平均水平,而方差反映了总体的稳定程度,我们可用平均数与方差从不同的方面估计总体.[解] x 甲=110(8+7+9+7+5+4+10+9+7+4)=7, x 乙=110(5+9+8+7+7+6+6+8+7+7)=7.s2甲=110[(8-7)2+(7-7)2+(9-7)2+(7-7)2+(5-7)2+(4-7)2+(10-7)2+(9-7)2+(7-7)2+(4-7)2]=4.s2乙=110[(5-7)2+(9-7)2+(8-7)2+(7-7)2+(7-7)2+(6-7)2+(6-7)2+(8-7)2+(7-7)2+(7-7)2]=1.2.由x甲=x乙知两个射击运动员的平均成绩是一样的.由s2甲>s2乙知,甲的成绩不如乙的成绩稳定.综合考虑,应选择乙.。
苏教版数学高一-必修3学案 2.3总体特征数的估计
2.3 总体特征数的估计课时目标1.会求样本的众数、中位数、平均数、标准差、方差.2.理解用样本的数字特征来估计总体数字特征的方法.3.会应用相关知识解决简单的统计实际问题.1.众数、中位数、平均数 (1)众数的定义:一组数据中重复出现次数最多的数称为这组数的众数. (2)中位数的定义及求法把一组数据按从小到大的顺序排列,把处于最中间位置的那个数称为这组数据的中位数.①当数据个数为奇数时,中位数是按从小到大顺序排列的中间位置的那个数. ①当数据个数为偶数时,中位数为排列的最中间的两个数的平均数. (3)平均数n 个数据a 1,a 2,…,a n 的平均数或均值记作a =________________=1n ∑ni =1a i .2.一组数据的________与________的差称为极差.3.设一组样本数据x 1,x 2,…,x n ,其平均数为x ,则称____________________为这个样本的________,其算术平方根s =1n ∑ni =1(x i -x )2为样本的________,分别简称样本方差、样本标准差.一、填空题1.下列说法正确的是________.①在两组数据中,平均值较大的一组方差较大;①平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小; ①方差的求法是求出各个数据与平均值的差的平方后再求和; ①在记录两个人射击环数的两组数据中,方差大的表示射击水平高.2.已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a ,中位数为b ,众数为c ,则a ,b ,c 的大小关系为__________.3.甲、乙两位同学都参加了由学校举办的篮球比赛,他们都参加了全部的7场比赛,平均得分均为16分,标准差分别为5.09和3.72,则甲、乙两同学在这次篮球比赛活动中,发挥得更稳定的是________.4.一组数据的方差为s2,将这组数据中的每个数据都扩大3倍,所得到的一组数据的方差是________.5.如图是2010年某校举行的元旦诗歌朗诵比赛中,七位评委为某位选手打出分数的茎叶统计图,去掉一个最高分和一个最低分,所剩数据的平均数和方差分别为________.6.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x A和x B,样本标准差分别为s A和s B,则下列各式正确的是________.①x A>x B,s A>s B;①x A<x B,s A>s B;①x A>x B,s A<s B;①x A<x B,s A<s B.7.已知样本9,10,11,x,y的平均数是10,方差是4,则xy=________.8.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲108999乙10107999.若a1,a2,…,a20,这20个数据的平均数为x,方差为0.20,则数据a1,a2,…,a20,x这21个数据的方差为________.二、解答题10.(1)已知一组数据x1,x2,…,x n的方差是a,求另一组数据x1-2,x2-2,…,x n -2的方差;(2)设一组数据x1,x2,…,x n的标准差为s x,另一组数据3x1+a,3x2+a,…,3x n+a 的标准差为s y,求s x与s y的关系.11.甲、乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图所示:(1)请填写表:平均数方差中位数命中9环及9环以上的次数甲乙(2)①从平均数和方差相结合看(分析谁的成绩更稳定);①从平均数和中位数相结合看(分析谁的成绩好些);①从平均数和命中9环及9环以上的次数相结合看(分析谁的成绩好些);①从折线图上两人射击命中环数的走势看(分析谁更有潜力).能力提升12.下面是一家快餐店所有工作人员(共7人)一周的工资表:总经理大厨二厨采购员杂工服务员会计3 000元450元350元400元320元320元410元(2)计算出的平均工资能反映一般工作人员一周的收入水平吗?(3)去掉总经理的工资后,再计算剩余人员的平均工资,这能代表一般工作人员一周的收入水平吗?13.师大附中三年级一班40人随机平均分成两组,两组学生一次考试的成绩情况如下表:平均成绩标准差第一组906第二组8041.平均数、众数、中位数都是描述数据的集中趋势的,其中平均数是最重要的量.众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使得无法客观地反映总体特征;中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也成为缺点,因为这些极端值有时是不能忽视的.由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低.2.在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.3.极差、方差、标准差是描述数据的离散程度的,即各数据与其平均数的离散程度.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越统计量组别大;标准差、方差越小,数据的离散程度越小.2.3 总体特征数的估计知识梳理1.(3)a 1+a 2+…+a nn 2.最大值 最小值3.s 2=1n ∑ni =1(x i -x )2方差 标准差 作业设计1.①解析 ①中平均值和方差是数据的两个特征,不存在这种关系;①中求和后还需取平均数;①中方差越大,射击越不平稳,水平越低.2.c>b>a解析 由题意a =110(16+18+15+11+16+18+18+17+15+13)=15710=15.7,中位数为16,众数为18,即b =16,c =18,①c>b>a. 3.乙解析 方差或标准差越小,数据的离散程度越小,表明发挥得越稳定. ①5.09>3.72,故乙发挥得更稳定. 4.9s 2解析 s 20=1n [9x 21+9x 22+…+9x 2n -n(3x )2]=9·1n (x 21+x 22+…+x 2n -n x 2)=9·s 2(s 20为新数据的方差).5.85,1.6解析 由题意x =15(84+84+86+84+87)=85.s 2=15[(84-85)2+(84-85)2+(86-85)2+(84-85)2+(87-85)2]=15(1+1+1+1+4)=85=1.6. 6.①解析 样本A 数据均小于或等于10,样本B 数据均大于或等于10,故x A <x B , 又样本B 波动范围较小,故s A >s B . 7.91解析 由题意得⎩⎪⎨⎪⎧9+10+11+x +y =5×10,15[(9-10)2+(10-10)2+(11-10)2+(x -10)2+(y -10)2]=4, 即⎩⎪⎨⎪⎧x +y =20,(x -10)2+(y -10)2=18. 解得⎩⎪⎨⎪⎧ x =7y =13,或⎩⎪⎨⎪⎧x =13y =7.所以xy =91. 8.甲解析 x 甲=9,s2甲=0.4,x 乙=9,s2乙=1.2,故甲的成绩较稳定,选甲. 9.0.19解析 这21个数的平均数仍为20,从而方差为121×≈0.19.10.解 (1)设x 1,x 2,…,x n 的平均数为x ,则有: a =1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]. ①x 1-2,x 2-2,…,x n -2的平均数为x -2, 则这组数据的方差s 2=(x 1-2-x +2)2+…+(x n -2-x +2)2n =(x 1-x )2+…+(x n -x )2n=a.(2)设x 1,x 2,…,x n 的平均数为x ,则3x 1+a,3x 2+a ,…,3x n +a 的平均数为3x +a.s y =s2y =1n[(3x +a -3x 1-a)2+…+(3x +a -3x n -a)2] =1n·32·[(x -x 1)2+…+(x -x n )2] =9·s2x =3s x , ①s y =3 s x .11.解 由折线图,知 甲射击10次中靶环数分别为: 9,5,7,8,7,6,8,6,7,7.将它们由小到大重排为:5,6,6,7,7,7,7,8,8,9. 乙射击10次中靶环数分别为: 2,4,6,8,7,7,8,9,9,10.也将它们由小到大重排为:2,4,6,7,7,8,8,9,9,10.(1)x 甲=110×(5+6×2+7×4+8×2+9)=7010=7(环),x 乙=110×(2+4+6+7×2+8×2+9×2+10)=7010=7(环),s 2甲=110×[(5-7)2+(6-7)2×2+(7-7)2×4+(8-7)2×2+(9-7)2] =110×(4+2+0+2+4) =1.2,s 2乙=110×[(2-7)2+(4-7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2] =110×(25+9+1+0+2+8+9) =5.4.根据以上的分析与计算填表如下:s 2甲<s2乙, ①甲成绩比乙稳定. ①①平均数相同, 甲的中位数<乙的中位数, ①乙的成绩比甲好些.①①平均数相同,命中9环及9环以上的次数甲比乙少, ①乙成绩比甲好些.①甲成绩在平均数上下波动;而乙处于上升势头,从第四次以后就没有比甲少的情况发生,乙较有潜力.12.解 (1)平均工资即为该组数据的平均数x =17×(3 000+450+350+400+320+320+410)=17×5 250=750(元).(2)由于总经理的工资明显偏高,所以该值为极端值,因此由(1)所得的平均工资不能反映一般工作人员一周的收入水平.(3)除去总经理的工资后,其他工作人员的平均工资为: x ′=16×(450+350+400+320+320+410)=16×2 250=375(元).这个平均工资能代表一般工作人员一周的收入水平.13.解设第一组20名学生的成绩为x i(i=1,2,…,20),第二组20名学生的成绩为y i(i=1,2,…,20),依题意有:x=120(x1+x2+…+x20)=90,y=120(y1+y2+…+y20)=80,故全班平均成绩为:140(x1+x2+…+x20+y1+y2+…+y20)=140(90×20+80×20)=85;又设第一组学生成绩的标准差为s1,第二组学生成绩的标准差为s2,则s21=120(x21+x22+…+x220-20x2),s22=120(y21+y22+…+y220-20y2)(此处,x=90,y=80),又设全班40名学生的标准差为s,平均成绩为z(z=85),故有s2=140(x21+x22+…x220+y21+y22+…+y220-40z2)=140(20s21+20x2+20s22+20y2-40z2)=12(62+42+902+802-2×852)=51.s=51.所以全班同学的平均成绩为85分,标准差为51.。
高中数学第2章统计2.3总体特征数的估计2.3.2方差与标准差教学案苏教版必修3(2021学年)
2017-2018学年高中数学第2章统计2.3总体特征数的估计2.3.2 方差与标准差教学案苏教版必修3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2017-2018学年高中数学第2章统计 2.3总体特征数的估计 2.3.2 方差与标准差教学案苏教版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2017-2018学年高中数学第2章统计 2.3 总体特征数的估计 2.3.2 方差与标准差教学案苏教版必修3的全部内容。
2.3。
2 方差与标准差预习课本P69~71,思考并完成以1.什么叫一组数据的极差、方差、标准差?2.一组数据的方差和标准差具有什么作用?错误!1.极差、方差、标准差(1)极差:一组数据的最大值与最小值的差.(2)方差与标准差:设一组样本数据x1,x2,…,x n,其平均数为错误!,则称s2=错误!错误!(x i-错误!)2为这个样本的方差,其算术平方根s=错误!为样本的标准差.2.方差与标准差的作用标准差与方差描述一组数据围绕平均数波动的大小,标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.方差、标准差刻画了一组数据的稳定程度.错误!1.数据0,1,3,4,7的极差为________,方差为________.答案:7 62.一组数据1,2,3,4,a的平均数是3,则数据的方差为________,标准差为________.答案:2 23.若1,2,3,x的平均数是5,而1,3,3,x,y的平均数是6,则1,2,3,x,y的方差是________.解析:由5=错误!得x=14.同理y=9。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2013年全国青年歌手电视大奖赛决赛中十位评委在第一轮决赛中给某选手打分是:9,9,8,9,10,9,8,10,9,9.
问题1:根据初中学过的知识,能计算得分的平均数吗? 提示:能.
x =110
(9+9+8+9+10+9+8+10+9+9)=9.
问题2:想一想,还有其它计算平均分的方法吗? 提示:有.x =
1
10
(8×2+9×6+10×2)=9.
1.平均数的概念
一组数据的总和除以数据的个数所得的商就是这组数据的平均数(或均值),一般记为:
a =a 1+a 2+…+a n
n
.
2.平均数的计算
(1)定义法:n 个数据a 1,a 2,…,a n 的平均数为:
a =a 1+a 2+…+a n
n
.
(2)平均数公式:
①在n 个数据中,如果x 1出现f 1次,x 2出现f 2次,…,x k 出现f k 次(f 1+f 2+…+f k =n ),则这n 个数的平均数为:x =
x 1f 1+x 2f 2+…+x k f k
n
.
②若取值为x 1,x 2,…,x n 的频率分别为p 1,p 2,…,p n ,则其平均数为x =x 1p 1+x 2p 2+…+x n p n .
2013年9月某军校大一新生军训期间,甲、乙两同学在相同条件下练习射击,每人打5发子弹,命中环数如下:
问题1提示:x 甲=8,x 乙=8.
问题2:利用x 甲和x 乙的大小关系能否判断两同学的射击水平的高低? 提示:不能.因为x 甲=x
乙.
问题3:观察比较上面表格中的两组数据,哪个同学的射击更稳定些?
提示:甲各次的命中环数更靠近在命中的平均环数8附近,故甲的射击更稳定些. 问题4:除观察分析外是否有更准确的方法判断上述问题? 提示:有.
极差、方差、标准差:
(1)极差:一组数据的最大值与最小值的差. (2)方差与标准差:
设一组样本数据x 1,x 2
,…,x n ,其平均数为x ,则称s 2
=1n ∑i =1
n (x i -x )2
为这个样本的方差,
其算术平方根s =
1
n ∑
i =1
n
x i -x 2
为样本的标准差,分别简称样本方差、样本标准差.其
中,标准差的单位与原始测量单位相同,方差的单位是原始数据单位的平方.
(3)方差及标准差的意义: 刻画一组数据的稳定程度.
1.众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数、众数都不具有的性质.
2.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.。