高中数学必修三:-用样本数字特征估计总体数字特征)
人教版高中数学必修三第二章第2节用样本的数字特征估计总体的数字特征 课件 (2)
2)从标准差的定义和计算公式都可以得出:S 0。 当 S 0 时,意味着所有的样本数据都等于样本 平均数。
课后作业:
课本 P81 习题2.2 A组 6、7.
P79练习答案
解: 依题意计算可得
x1=900 s1≈23.8
x2=900 s2 ≈42.6
如果你是教练,你应当如何对这次射击情 况作出评价?如果这是一次选拔性考核,你应 当如何作出选择?
x甲7
x乙7
两人射击 的平均成绩是一样的. 那么两个
人的水平就没有什么差异吗?
频率 0.3
0.2
0.1 频率
4
频率
5 67 8 (甲)
9 10
0.4 0.3
0.2 0.1
4 5 6 7 8 9 10 (乙)
于,是 样本 x1,x2 数 , xn到 据 x 的 “平均 ”是 :距离
x1xx2xxnx
S
.
n
1.标准差定义:是样本数据到平均数的一种平 均距离。它用来描述样本数据的分散程度。在 实际应用中,标准差常被理解为稳定性。
假设样本数据是 x1,x2,xn, 平均数是 x
2、标准差算法及其公式为:
1)算出样本数据的平均数 。 2)算出每个样本数据与样本数据平均数的差: 3)算出(2)中 的平方。 4)算出(3)中n个平方数的平均数,即为样本方差。 5)算出(4)中平均数的算术平方根,即为样本标准差。
s1 n[x (1x)2(x2x)2 (xnx)2]
3.关于标准差的说明: 1)标准差较大,数据的离散程度较大;标准差较 小,数据的离散程度较小。
规律:标准差越大, 则a越大,数据的 离散程度越大;反 之,数据的离散程 度越小。
人教A版必修3《2.2.2用样本的数字特征估计总体的数字特征》优化训练ppt课件
组数据的中位数.
注意:在频率分布直方图中,中位数左边和右边的直方图 相等 ,由此可以估计中位数的值. 的面积________
x1+x2+„+xn x= n (3)如果有n个数x1,x2,„,xn,那么_________________
如下(单位:mL):
342,348,346,340,344,341,343,350,340,342
343.6 则样本的平均数是________.
解析:由于数据较大,又都在常数 342 附近波动,把各数
据都减去 342,得 0,6,4,-2,2,-1,1,8,-2,0,
1 则 x ′=10×(0+6+4-2+2-1+1+8-2+0)=1.6, 即 x = x ′+342=343.6.
人员
平均环数- x 方差s2
甲 8.6 3.5
乙 8.9 3.5
丙 8.9 2.1
丁 8.2 5.6
从这四个人中选择一人参加奥运会射击项目比赛,最佳人 选是( C )
A.甲
C.丙
B.乙
D.丁
【问题探究】
如何通过频率分布直方图估计众数、中位数和平均数? 答案:(1)众数是最高矩形底边的中点;(2)中位数左边和右
边的直方图的面积应相等,由此可以估计中位数的值;(3)平均
数是频率分布直方图的“重心”,它等于每个小矩形的面积乘
以小矩形底边中点的横坐标之和.
题型 1 众数、中位数、平均数的求法
【例 1】 在一次中学生田径运动会上,参加男子跳高的 17 名运动员的成绩如下表: 成绩/米 1.50 1.60 1.65 1.70 人数/名
1 这组数据的平均数是 x =17×(1.50×2+1.60×3+1.65×
用样本的数字特征估计总体的数字特征
用样本的数字特征估计总体的数字特征
在统计学中,样本是从总体中抽取的部分数据。
样本的数字特征是通过对样本数据的分析和计算得出的描述性统计量,可以用来估计总体的数字特征。
本文将介绍常用的样本数字特征,并讨论如何利用这些特征来估计总体的数字特征。
一、样本的数字特征
1. 平均数:样本的平均数是样本数据的总和除以样本的个数。
平均数是样本数据的中心位置的度量,可以用来估计总体的平均数。
2. 中位数:样本的中位数是将样本数据按照大小排列后,位于中间位置的数字。
中位数是样本数据的中心位置的度量,可以用来估计总体的中位数。
3. 众数:样本的众数是样本数据中出现次数最多的数字。
众数可以表示样本数据的最常见的数值,可以用来估计总体的众数。
4. 方差:样本的方差是样本数据与样本均值之差的平方的平均值。
方差反映了样本数据的离散程度,可以用来估计总体的方差。
5. 标准差:样本的标准差是样本方差的平方根。
标准差也反映了样本数据的离散程度,可以用来估计总体的标准差。
三、注意事项
1. 样本的数字特征只能提供对总体数字特征的估计,估计的准确程度取决于样本的大小和抽样方法的随机性。
样本越大,估计的准确性一般越高。
2. 在利用样本数字特征估计总体数字特征时,需要考虑样本的代表性。
抽样时要保证样本能够代表总体的各个特征和属性。
3. 样本数字特征只能给出对总体数字特征的一种估计,通过使用统计方法和推断技巧,可以给出估计结果的置信区间和可靠程度。
(完整版)用样本的数字特征估计总体的数字特征
2.2.2用样本的数字特征估计总体的数字特征 (两课时)零号作业一、众数、中位数、平均数1、众数:(1)定义:一组数据中出现次数最多的数称为这组数据的众数.(2)特征:一组数据中的众数可能不止一个,也可能没有,反映了该组数据的集中趋势 [破疑点] 众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使其无法客观地反映总体特征.(3)在直方图中为最高矩形下端中点的横坐标 2、中位数:(1)定义:一组数据按从小到大的顺序排成一列,处于中间位置的数称为这组数据的中位数. (2)特征:一组数据中的中位数是唯一的,反映了该组数据的集中趋势.在频率分布直方图中,中位数左边和右边的直方图的面积相等.[破疑点] 中位数不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点.(3) 直方图面积平分线与横轴交点的横坐标.左右两边面积各占一半3、平均数:(1)定义:一组数据的和与这组数据的个数的商.数据x 1,x 2,…,x n 的平均数为xn=x 1+x 2+…+x nn(2)特征:平均数对数据有“取齐”的作用,代表该组数据的平均水平.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中极端值的影响较大,使平均数在估计总体时可靠性降低.(3) 直方图中每个小矩形的面积与小矩形底边中点的横坐标的乘积之和. 二、标准差、方差1、标准差(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s 表示,通常用以下公式来计算s =1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]可以用计算器或计算机计算标准差.(2)特征:标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较_ 小.2.方差(1)定义:标准差的平方,即s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2](2)特征:与标准差的作用相同,描述一组数据围绕平均数波动程度的大小. (3)取值范围:[0,+∞)3、数据组x 1,x 2,…,x n 的平均数为x ,方差为s 2,标准差为s ,则数据组ax 1+b ,ax 2+b ,…,ax n +b (a ,b 为常数)的平均数为a x +b ,方差为a 2s 2,标准差为4、规律总结(1)用样本的数字特征估计总体的数字特征,是指用样本的众数、中位数、平均数和标准差等统计数据,估计总体相应的统计数据. 样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息. 平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度.用样本的数字特征估计总体的数字特征,是指用样本的众数、中位数、平均数和标准差等统计数据,估计总体相应的统计数据(2)平均数对数据有“取齐”的作用,代表一组数据的平均水平.标准差描述一组数据围绕平均数波动的幅度.在实际应用中,我们常综合样本的多个统计数据,对总体进行估计,为解决问题作出决策.(3)标准差越大离散程度越大,数据较分散;标准差越小离散程度越小,数据较集中在平均数周围.列出一组样本数据的频率分布表步骤说明:1、对同一个总体,可以抽取不同的样本,相应的平均数与标准差都会发生改变.如果样本的代表性差,则对总体所作的估计就会产生偏差;如果样本没有代表性,则对总体作出错误估计的可能性就非常大,由此可见抽样方法的重要性.2.在抽样过程中,抽取的样本是具有随机性的,如从一个包含6个个体的总体中抽取一个容量为3的样本就有20中可能抽样,因此样本的数字特征也有随机性.用样本的数字特征估计总体的数字特征,是一种统计思想,没有惟一答案.3.在实际应用中,调查统计是一个探究性学习过程,需要做一系列工作,我们可以把学到的知识应用到自主研究性课题中去.一号作业11、众数(1)定义:一组数据中出现次数______的数称为这组数据的众数.(2)特征:一组数据中的众数可能______一个,也可能没有,反映了该组数据的____________.在直方图中为最高矩形下端中点的____________最多不止集中趋势横坐标2.中位数(1)定义:一组数据按从小到大的顺序排成一列,处于______位置的数称为这组数据的中位数.(2)特征:一组数据中的中位数是______的,反映了该组数据的______________.在频率分布直方图中,中位数左边和右边的直方图的面积______..中间唯一集中趋势相等3.平均数(1)定义:一组数据的和与这组数据的个数的商.数据x1,x2,…,x n的平均数为x n=_________________.(2)特征:平均数对数据有“取齐”的作用,代表该组数据的_____________.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的______,但平均数受数据中_________的影响较大,使平均数在估计总体时可靠性降低.直方图中每个小矩形的面积与小矩形底边中点的横坐标的. ______x1+x2+…+x nn平均水平信息极端值乘积之和4.标准差(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s表示,通常用以下公式来计算s=__________________________.可以用计算器或计算机计算标准差.(2)特征:标准差描述一组数据围绕______波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较______;标准差较小,数据的离散程度较______.1n[(x1-x)2+(x2-x)2+…+(x n-x)2]平均数大小5.方差(1)定义:标准差的平方,即s2=________________________________________.(2)特征:与____________的作用相同,描述一组数据围绕平均数波动程度的大小.(3)取值范围:___________.1n[(x1-x)2+(x2-x)2+…+(x n-x)2] 标准差[0,+∞)数据组x1,x2,…,x n的平均数为x,方差为s2,标准差为s,则数据组ax1+b,ax2+b,…,ax n+b(a,b为常数)的平均数为a x+b,方差为a2s2,标准差为as.典例讲解中位数、众数、平均数的应用例1据报道,某公司的33名职工的月工资(以元为单位)如下:(1)求该公司的职工月工资的平均数、中位数、众数;(2)假设副董事长的工资从5 000元提升到20 000元,董事长的工资从5 500元提升到30 000元,那么新的平均数、中位数、众数又是什么?(精确到1元)(3)你认为哪个统计量更能反映这个公司职工的工资水平?结合此问题谈一谈你的看法.[解析](1)平均数是x=1 500+4 000+3 500+2 000×2+1 500+1 000×5+500×3+0×2033≈1 500+591=2 091(元).中位数是1 500元,众数是1 500元.(2)平均数是x′=1 500+28 500+18 500+2 000×2+1 500+1 000×5+500×3+0×2033≈1 500+1 788=3 288(元).中位数是1 500元,众数是1 500元.(3)在这个问题中,中位数或众数均能反映该公司职工的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数偏差较大,所以平均数不能反映这个公司职工的工资水平.练习1:某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):甲群13,13,14,15,15,15,15,16,17,17;乙群54,3,4,4,5,5,6,6,6,57.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好反映乙群市民的年龄特征?[答案](1)甲群市民年龄的平均数为13+13+14+15+15+15+15+16+17+1710=15(岁),中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.(2)乙群市民年龄的平均数为54+3+4+4+5+5+6+6+6+5710=15(岁),中位数为5岁,众数为6岁.由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.例2:(1)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差(2)某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.①求这次测试数学成绩的众数.②求这次测试数学成绩的中位数.③求这次测试数学成绩的平均分.[解析](1)x甲=15(4+5+6+7+8)=6,x乙=15(5×3+6+9)=6,甲的中位数是6,乙的中位数是5.甲的成绩的方差为15(22×2+12×2)=2,乙的成绩的方差为15(12×3+32×1)=2.4.甲的极差是4,乙的极差是4.所以A,B,D错误,C正确.(2)①由图知众数为70+802=75.②由图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x-70),所以x≈73.3.③由图知这次数学成绩的平均分为:40+502×0.005×10+50+602×0.015×10+60+702×0.02×10+70+802×0.03×10+80+902×0.025×10+90+1002×0.005×10=72.[答案](1)C (2)见解析练习1:参加市数学调研抽测的某校高三学生成绩分布的茎叶图1和频率分布直方图2均受到不同程度的破坏,但可见部分信息如下,据此解答如下问题:求参加数学抽测的人数n,抽测成绩的中位数及分数分布在[80,90),[90,100]内的人数.[答案]分数在[50,60)内的频率为2,由频率分布直方图可以看出,分数在[90,100]内的同样有2人.由2n=10×0.008,得n=25.由茎叶图可知抽测成绩的中位数为73.∴分数在[80,90)之间的人数为25-(2+7+10+2)=4.参加数学竞赛人数n=25,中位数为73,分数在[80,90),[90,100]内的人数分一号作业21.对于数据3,3,2,3,6,3,10,3,6,3,2.①这组数据的众数是3;②这组数据的众数与中位数的数值都不相等;③这组数据的中位数与平均数的数值相等;④这组数据的平均数与众数的值相等.其中正确的结论的个数() A.1B.2 C.3 D.42、为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如下图所示,假设得分值的中位数为m e,众数为m O,平均值为x,则()A.m e=m O=x B.m e=m O<x C.m e<m O<x D.m O<m e<x3、某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45)岁之间,根据调查结果得出司机的年龄情况残缺的频率分布直方图如图所示,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是() A.31,6岁B.32.6岁C.33.6岁D.36.6岁4、阶段考试以后,班长算出了全班40个人数学成绩的平均分为M,如果把M当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均分为N,那么M N为________.1、A 2 D 3、C 4、 15、为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4服用B药的20位患者日平均增加的睡眠时间:3.2 1.7 1.90.80.9 2.4 1.2 2.6 1.3 1.4 1.60.5 1.80.6 2.1 1.1 2.5 1.2 2.70.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据绘制茎叶图,从茎叶图看,哪种药的疗效更好?[解析](1)设A药观测数据的平均数为x,B药观测数据的平均数为y.由观测结果可得x=120×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,y=120×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得x>y,因此可看出A药的疗效更好.(2)由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A药疗效的试验结果有710的叶集中在茎2,3上,而B药疗效的试验结果有710的叶集中在茎0,1上,由此可看出A药的疗效更好.标准差、方差的应用例3、从甲、乙两种玉米的苗中各抽10株,分别测它们的株高如下:(单位:cm)甲:25414037221419392142乙:27164427441640401640问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?[解析]看哪种玉米的苗长得高,只要比较甲、乙两种玉米的苗的均高即可;要比较哪种玉米的苗长得齐,只要看两种玉米的苗高的方差即可,因为方差是体现一组数据波动大小的特征数.(1)x甲=110(25+41+40+37+22+14+19+39+21+42)=110×300=30(cm),x乙=110(27+16+44+27+44+16+40+40+16+40)=110×310=31(cm).所以x甲<x乙.(2)s2甲=110[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=110(25+121+100+49+64+256+121+81+81+144)=110×1042=104.2(cm2),s2乙=110[(2×272+3×162+3×402+2×442)-10×312]=110×1288=128.8(cm2).所以s2甲<s2乙.[答案](1)乙种玉米的苗长得高,(2)甲种玉米的苗长得齐.练习1:甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表:s1,s2,s3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有() A.s3>s1>s2B.s2>s1>s3C.s1>s2>s3D.s2>s3>s1[答案] B练习2:一次数学知识竞赛中,两组学生成绩如下表:已经算得两个组的平均分都是80分,请根据你所学过的统计知识,进一步判断这两个组这次竞赛中成绩谁优谁次,并说明理由.[答案](1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较看,甲组成绩好些.(2)s2甲=12+5+10+13+14+6×[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=150×(2×900+5×400+10×100+13×0+14×100+6×400)=172.s2乙=150×(4×900+4×400+16×100+2×0+12×100+12×400)=256.因为s2甲<s2乙,所以甲组成绩较乙组成绩稳定.(3)甲、乙两组成绩的中位数、平均数都是80分,其中甲组成绩在80分以上(含80分)的有33人,乙组成绩在80分以上(含80分)的有26人,从这一角度看,甲组成绩总体较好.(4)从成绩统计表看,甲组成绩大于或等于90分的人数为20人,乙组成绩大于或等于90分的人数为24人,所以乙组成绩在高分阶段的人数多,同时,乙组得满分的比甲组得满分的多6人,从这一角度看,乙组成绩较好.一号作业31. 若样本数据x 1,x 2,……,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )A .8B .15C .16D .322.为了稳定市场,确保农民增收,某农产品7个月份的每月市场收购价格与其前三个月的市场收购价格有关,并使其与前三个月的市场收购价格之差的平方和最小,下表列出的是该产品今年前6个月的市场收购价格:则前7A.757 B.767 C .11D.7873. 某班级有50名学生,其中有30名男生和20名女生.随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是( )A .这种抽样方法是一种分层抽样B .这种抽样方法是一种系统抽样C .这五名男生成绩的方差大于这五名女生成绩的方差D .该班男生成绩的平均数小于该班女生成绩的平均数4.由正整数组成的一组数据x 1,x 2,x 3,x 4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)1、C2、B3、C4、1,1,3,3。
(完整版)用样本的数字特征估计总体的数字特征(教案)
2。
2。
2 用样本的数字特征估计总体的数字特征一、教学目标1.能从样本数据中提取基本的数字特征,并做出合理的解释. 2.会求样本的众数、中位数、平均数.3.能从频率分布直方图中,求得众数、中位数、平均数. 二、教学重难点重点:根据实际问题,对样本数据提取基本的数字特征并做出合理解释,估计总体的基本数字特征;体会样本数字特征具有随机性.难点:在频率分布直方图中分析众数、中位数、平均数. 三、众数、中位数、平均数的概念 1。
众数的概念一组数据中重复出现次数_____的数叫做这组数的众数 2。
中位数的定义把一组数据按大小顺序排列,把处于_____位置的那个数称为这组数据的中位数; 当数据个数为奇数时,中位数是按大小顺序排列的____的那个数;当数据个数为偶数时,中位数是按大小顺序排列的最中间两个数的_________。
3.平均数的概念 如果有n 个数12,,,n x x x ,那么这n 个数的算术平均数就是这组数平均数,即例1:在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下: 甲运动员:7,8,6,8,6,5,8,10,7,4 乙运动员:9,5,7,8,7,6,8,6,7,7观察上述样本数据,分别求这些运动员成绩的众数,中位数与平均数? 甲运动员命中环数:众数: 中位数:平均数:786865810746.910x +++++++++==乙运动员命中环数:众数: 中位数:平均数:9578768677710x +++++++++==例2、在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:分别求这些运动员成绩的众数,中位数与平均数 。
众数(最多的): ;中位数(最中间的): 平均数 :四、众数、中位数、平均数与频率分布直方图的关系 思考1:如何从频率分布直方图中估计出众数的值?例3:在上一节调查的100位居民的月均用水量的问题中,这些样本数据的频率分布直方图如下所示:观察图形,估计出众数的思考2:如何从频率分布直方图中估计出中位数的值?在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数反映到频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值. 所以,中位数在频率分布直方图中,就是使其左右小矩形面积和相等 思考3:如何从频率分布直方图中估计出平均数的值?例4:射击选手甲10次的射击情况,求其命中环数的平数2.54.5所以,平均数为:456272831010x ++⨯+⨯+⨯+=1122314567810101010101010=⨯+⨯+⨯+⨯+⨯+⨯即:平均数等于每个命中环数乘以该数的频率之和例5:100位居民月均用水量的频率分布表,求其平均数的估计值0.250.040.750.08 1.250.15 1.750.22 2.250.252.750.14 3.250.06 3.750.04 4.250.022.02x=⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=所以,平均数的估计值=小矩形底边中点的横坐标乘以对应频率之和 思考4:怎么在样本的频率分布直方图中估计出平均数的值?平均数的估计值=每个小矩形的面积乘以小矩形底边中点的横坐标之和 五、反思与感悟 :众数:最高矩形端点的横坐标;中位数:直方图面积平分线与横轴交点的横坐标;平均数:每个小矩形的面积与小矩形底边中点的横坐标的乘积之和。
必修三2.2.用样本估计总体(教案)
2.2 用样本估计总体教案 A第1课时教学内容§2.2.1 用样本的频率分布估计总体分布教学目标一、知识及技能1. 通过实例体会分布的意义和作用.2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.二、过程及方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识及现实世界的联系.教学重点、难点重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.难点:能通过样本的频率分布估计总体的分布.教学设想一、创设情境在NBA的2004赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布.二、探究新知探究1:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,第 1 页为我们提供解释数据的新方式.下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚的看到整个样本数据的频率分布情况.(一)频率分布的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:1.计算一组数据中最大值及最小值的差,即求极差;2.决定组距及组数;3.将数据分组;4.列频率分布表;5.画频率分布直方图.以教材P65制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图.(让学生自己动手作图)频率分布直方图的特征:1.从频率分布直方图可以清楚的看出数据分布的总体趋势.2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.探究2:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同.不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象?(把学生分成两大组进行,分别作出两种组距的图,然后组织同学们对所作图的不同看法进行交流……)接下来请同学们思考下面这个问题:思考:如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图2.2-1,(见教材P67)你能对制定月用水量标准提出建议吗?(让学生仔细观察表和图)(二)频率分布折线图、总体密度曲线1.频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2.总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.思考:1.对于任何一个总体,它的密度曲线是不是一定存在?为什么?2.对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么?实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确.(三)茎叶图1.茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把第 3 页这样的图叫做茎叶图.(见教材P70例子)2.茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录及表示.(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.三、例题精析例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm ):(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:(2)其频率分布直方图如下:(3)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm 的人数占总人数的19%.cm )例2 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高及频数成正比,各组频数之和等于样本容量,频率之和等于1.解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小, 因此第二小组的频率为:40.0824171593=+++++, 又因为频率=.第二小组频数样本容量所以,12150.0.08===第二小组频数样本容量第二小组频率 (2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.四、课堂小结1. 总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.2. 总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.五、评价设计1.P81习题2.2 A组1、2.第2课时教学内容§2.2.2 用样本的数字特征估计总体的数字特征教学目标一、知识及技能1. 正确理解样本数据标准差的意义和作用,学会计算数据的标准差.2. 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.3. 会用样本的基本数字特征估计总体的基本数字特征.4. 形成对数据处理过程进行初步评价的意识.二、过程及方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辩证地理解数学知识及现实世界的联系.教学重点、难点教学重点:用样本平均数和标准差估计总体的平均数及标准差.教学难点:能应用相关知识解决简单的实际问题.教学设想一、创设情境在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究——用样本的数字特征估计总体的数字特征(板出课题).二、探究新知(一)众数、中位数、平均数探究(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论)初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供第 5 页关于样本数据的特征信息.例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t (最高的矩形的中点)(图见教材第72页)它告诉我们,该市的月均用水量为2. 25t 的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.提问:请大家翻回到教材第66页看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.由此可以估计出中位数的值为2.02.(图略见教材73页图2.2-6)思考:2.02这个中位数的估计值,及样本的中位数值2.0不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)图2.2-6显示,大部分居民的月均用水量在中部(2.02t 左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)(二)标准差、方差1.标准差平均数为我们提供了样本数据的重要信息,可是,有时平均数也会使我们作出对总体的片面判断.某地区的统计显示,该地区的中学生的平均身高为176cm ,给我们的印象是该地区的中学生生长发育好,身高较高.但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态.例如,在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?如果你是教练,选哪位选手去参加正式比赛? 我们知道,77x x ==乙甲,.两个人射击的平均成绩是一样的.那么,是否两个人就没有水平差距呢?(观察P74图2.2-7)直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据.考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s 表示.样本数据1,2,,n x x x 的标准差的算法:第 7 页(1) 算出样本数据的平均数x .(2) 算出每个样本数据及样本数据平均数的差:(1,2,)i x x i n -= (3) 算出(2)中(1,2,)i x x i n -=的平方.(4) 算出(3)中n 个平方数的平均数,即为样本方差.(5) 算出(4)中平均数的算术平方根,即为样本标准差.其计算公式为:显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小.提问:标准差的取值范围是什么?标准差为0的样本数据有什么特点?从标准差的定义和计算公式都可以得出:s ≥0.当0s =时,意味着所有的样本数据都等于样本平均数.2.方差从数学的角度考虑,人们有时用标准差的平方2s (即方差)来代替标准差,作为测量样本数据分散程度的工具:在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差.三、例题精析例1 画出下列四组样本数据的直方图,说明他们的异同点.(1)5,5,5,5,5,5,5,5,5(2)4,4,4,5,5,5,6,6,6(3)3,3,4,4,5,6,6,7,7(4)2,2,2,2,5,8,8,8,8分析:先画出数据的直方图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差.解:(图见教材P76)四组数据的平均数都是5.0,标准差分别为:0.00,0.82,1.49,2.83.他们有相同的平均数,但他们有不同的标准差,说明数据的分散程度是不一样的.例2 甲乙两人同时生产内径为25.40mm 的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm ):甲 25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.3825.42 25.39 25.43 25.39 25.40 25.44 25.40 25.4225.45 25.35 25.41 25.39乙 25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.3625.34 25.49 25.33 25.43 25.43 25.32 25.47 25.3125.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?分析:比较两个人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数及标准差的大小即可,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本数据的平均数、标准差,以此作为两个总体之间的差异的估计值.解:四、课堂小结1. 用样本的数字特征估计总体的数字特征分两类:(1)用样本平均数估计总体平均数.(2)用样本标准差估计总体标准差.样本容量越大,估计就越精确.2. 平均数对数据有“取齐”的作用,代表一组数据的平均水平.3. 标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度.五、评价设计P81 习题 2.2 A组 3、4.教案 B第1课时教学内容§2.2.1 用样本的频率分布估计总体分布教学目标一、知识及技能1.通过实例体会分布的意义和作用.2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.二、过程及方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识及现实世界的联系.教学重点、难点教学重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.教学难点:能通过样本的频率分布估计总体的分布.教学设想一、创设情境,导入新课我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,为我们提供解释数据的新方式.下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚的看到整个样本数据的频率分布情况.二、新课探知(一)频率分布的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:1. 计算一组数据中最大值及最小值的差,即求极差;2. 决定组距及组数;第 9 页cm ) 3. 将数据分组;4. 列频率分布表;5. 画频率分布直方图.以教材P65制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图.(让学生自己动手作图)例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm ):(1)列出样本频率分布表;(2)一画出频率分布直方图;(3)估计身高小于134C m的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:(2)其频率分布直方图:(3134cm 的男孩出现的,所以我们估计身高小 (1趋势. (2把数据抹掉了.曲线 1.频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2.总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.(见教材P69)(三)茎叶图1.茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.(见教材P70例子)2.茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录及表示.(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.例2某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.用茎叶图表示,你能通过该图说明哪个运动员的发挥更稳定吗?解:“茎”指的是中间的一列数,表示得分的十位数;“叶”指的是从茎的旁边生长出来的数,分别表示两人得分的个位数.画这组数据的茎叶图的步骤如下第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;第二步,茎是中间的一列数,按从小到大的顺序排列;第三步,将各个数据的叶按大小次序写在茎右(左)侧.甲乙8 04 6 3 1 2 53 6 8 2 5 43 8 9 3 1 6 1 6 7 94 4 91 5 0从图中可以看出,乙运动员的得分基本上是对称的,页的分布是“单峰”的,有的叶集中在茎2,3,4上,中位数为36;甲运动员的得分除一个特殊得分(51分)外,也大致对称,叶的分布也是“单峰”的,有的叶主要集中在茎1,2,3上,中位数是26.由此可以看出,乙运动员的成绩更好. 另外i,从叶在茎上的分布情况看,乙运动员的得分更集中于峰值附近,这说明乙运动员的发挥更稳定.练习:在NBA的2010赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33学生画出茎叶图(略)三、巩固练习为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(见下页图示),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.第 11 页(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高及频数成正比,各组频数之和等于样本容量,频率之和等于1.解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:40.08 24171593=+++++,又因为频率=第二小组频数样本容量,所以,121500.08===第二小组频数样本容量第二小组频率.(2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.四、小结1. 总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.2. 总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.五、布置作业P71练习1、2、3.第2课时教学内容§2.2.2 用样本的数字特征估计总体的数字特征教学目标一、知识及技能1. 正确理解样本数据标准差的意义和作用,学会计算数据的标准差.2. 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.3. 会用样本的基本数字特征估计总体的基本数字特征.4. 形成对数据处理过程进行初步评价的意识.二、过程及方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辩证地理解数学知识及现实世界的联系.教学重点、难点教学重点:用样本平均数和标准差估计总体的平均数及标准差.教学难点:能应用相关知识解决简单的实际问题.教学设想一、创设情境导入新课在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究——用样本的数字特征估计总体的数字特征.二、新课探究(一)众数、中位数、平均数初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息.例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t(最高的矩形的中点)(图略见教材第72页)它告诉我们,该市的月均用水量为2. 25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.提问:请大家翻回到教材第66页看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,第 13 页。
高中数学必修3《用样本的数字特征估计总体的数字特征(二)》导学案
数学(高二上)导学案必修三第二章第二节课题:用样本估计总体二、合作探究归纳展示任务1 标准差问题平均数向我们提供了样本数据的重要信息,但是平均数有时也会使我们作出对总体的片面判断,因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽视的.因此,只有平均数还难以概括样本数据的实际状态.如:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲:7879549107 4乙:9578768677如果你是教练,你应当如何对这次射击作出评价?思考1甲、乙两人本次射击的平均成绩分别为多少环?答经计算得:x甲=110(7+8+7+9+5+4+9+10+7+4)=7,同理可得x乙=7.思考2观察下图中两人成绩的频率分布条形图,你能说明其水平差异在哪里吗?答直观上看,还是有差异的.如:甲成绩比较分散,乙成绩相对集中.思考3对于甲乙的射击成绩除了画出频率分布条形图比较外,还有没有其它方法来说明两组数据的分散程度?答还经常用甲乙的极差与平均数一起比较说明数据的分散程度.甲的环数极差=10-4=6,乙的环数极差=9-5=4.它们在一定程度上表明了样本数据的分散程度,与平均数一起,可以给我们许多关于样本数据的信息.显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.思考4 如何用数字去刻画这种分散程度呢?答 考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s 表示 . 思考5 所谓“平均距离”,其含义如何理解?答 假设样本数据是x 1,x 2,…,x n ,x 表示这组数据的平均数.x i 到x 的距离是|x i -x |(i =1,2,…,n ).于是,样本数据是x 1,x 2,…,x n 到x 的“平均距离”是S =|x 1-x |+|x 2-x |+…+|x n -x |n .由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差: s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 思考6 标准差的取值范围如何?若s =0表示怎样的意义?答 从标准差的定义可以看出,标准差s ≥0,当s =0时,意味着所有的样本数据等于样本平均数. 任务2 方差思考1 方差的概念是怎样定义的?答 人们有时用标准差的平方s 2—方差来代替标准差,作为测量样本数据分散程度的工具,方差:s 2=1n ·[(x 1-x )2+(x 2-x )2+…+(x n -x )2].思考2 对于一个容量为2的样本:x 1,x 2(x 1<x 2),它们的平均数和标准差如果分别用x 和a 表示,那么x 和a 分别等于什么? 答 x =12(x 1+x 2),a =12(x 2-x 1).思考3 在数轴上,x 和a 有什么几何意义?由此说明标准差的大小对数据的离散程度有何影响?答 x 和a 的几何意义如下图所示.说明了标准差越大离散程度越大,数据较分散;标准差越小离散程度越小,数据较集中在平均数周围.思考4 现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?答 通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.例1求出问题中的甲乙两运动员射击成绩的标准差,并说明他们的成绩谁比较稳定?解x甲=110(7+8+7+9+5+4+9+10+7+4)=7,同理可得x乙=7.根据标准差的公式,s甲=110[(7-7)2+(8-7)2+…+(4-7)2]=2;同理可得s乙≈1.095.所以s甲>s乙.因此说明甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.跟踪训练1如图所示是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.答案 6.8任务3标准差及方差的应用例2画出下列四组样本数据的条形图,说明它们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8.解四组样本数据的条形图如下:四组数据的平均数都是5.0,标准差分别是:0.00,0.82,1.49,2.83.它们有相同的平均数,但它们有不同的标准差,说明数据的分散程度是不一样的.跟踪训练2从甲、乙两种玉米中各抽10株,分别测得它们的株高如下:甲:25、41、40、37、22、14、19、39、21、42;乙:27、16、44、27、44、16、40、40、16、40;(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?解(1)x甲=110(25+41+40+37+22+14+19+39+21+42)=30,x乙=110(27+16+44+27+44+16+40+40+16+40)=31,x甲<x乙.即乙种玉米的苗长得高.(2)由方差公式得:s2甲=110[(25-30)2+(41-30)2+…+(42-30)2]=104.2,同理s2乙=128.8,∴s2甲<s2乙.即甲种玉米的苗长得齐.答乙种玉米苗长得高,甲种玉米苗长得齐.例3甲、乙两人同时生产内径为25.40 mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm):甲25.4625.3225.4525.3925.3625.3425.4225.4525.3825.4225.3925.4325.3925.4025.44的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.3.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性.用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案.四、作业布置 1、基础知识:1.下列说法正确的是( )A .在两组数据中,平均值较大的一组方差较大B .平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小C .方差的求法是求出各个数据与平均值的差的平方后再求和D .在记录两个人射击环数的两组数据中,方差大的表示射击水平高 答案 B2.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为( )A.1169B.367C .36D.677答案 B3.已知一组数据x 1,x 2,x 3,x 4,x 5的平均数是x =2,方差是13,那么另一组数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数和方差分别为( )A .2,13B .2,1C .4,13D .4,3答案 D4.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4.则:(1)平均命中环数为________; (2)命中环数的标准差为________.。
用样本的数字特征估计总体的数字特征说课稿 教案 教学设计
本章节是学生在初中学过的简单的统计知识一个深化。学生通过本章的学习应体会统计思维与确定性思维的差异。在本章中学生应通过实习作业较为系统地经历数据收集与处理的全过程。学生在了解统计问题时,应该包括两个方面的信息,即问题所涉及的总体和变量,处理统计问题时,学生对于随机性的理解是困难的,为此在教学过程中要通过日常生活中大量的实例以助理解。
解:(图略,可查阅课本P68)
四组数据的平均数都是5.0,标准差分别为:0.00,0.82,1.49,2.83。
他们有相同的平均数,但他们有不同的标准差,说明数据的分散程度是不一样的。
〖例2〗ቤተ መጻሕፍቲ ባይዱ(见课本P69)
分析: 比较两个人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本数据的平均数、标准差,以此作为两个总体之间的差异的估计值。
考试说明:1.理解样本数据标准差的意义和作用,会计算数据标准差及方差。2.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释。3.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想。4.会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题。
〖例1〗:画出下列四组样本数据的直方图,说明他们的异同点。
(1)5,5,5,5,5,5,5,5,5
(2)4,4,4,5,5,5,6,6,6
(3)3,3,4,4,5,6,6,7,7
(4)2,2,2,2,5,8,8,8,8
分析:先画出数据的直方图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差。
用样本的数字特征估计总体的数字特征
用样本的数字特征估计总体的数字特征在统计学中,我们经常需要对总体的数字特征进行估计。
由于总体往往很大或者难以获得全部数据,我们通常只能通过抽样得到部分数据。
这时,我们可以利用样本的数字特征来估计总体的数字特征,从而对总体进行推断。
本文将介绍用样本的数字特征估计总体的数字特征的方法和相关概念。
一、样本与总体的概念在统计学中,总体是指研究对象的全部个体或观察值的集合。
总体通常是我们想要了解的全部群体,比如全国人口总数、某一批产品的质量总体等。
样本是从总体中选取的、具有代表性的一部分个体或观察值的集合。
样本的选择要求有代表性,即能够反映总体的一般情况。
在实际应用中,由于种种原因往往难以获得全部总体数据,因此我们通常只能依靠样本数据来进行统计推断。
二、样本的数字特征样本的数字特征是用来表示样本数据的数字指标,通常包括中心位置的指标(均值、中位数)、离散程度的指标(标准差、方差)和形状的指标(偏度、峰度)等。
这些数字特征可以帮助我们了解样本数据的集中趋势、变异程度和分布形状,从而为估计总体的数字特征提供依据。
1. 中心位置的指标中心位置的指标用来表示样本数据的集中趋势,反映了样本数据的平均水平。
常用的中心位置指标包括均值和中位数。
均值是样本数据的平均值,可用于表示样本数据的平均水平。
中位数是将样本数据按照大小顺序排列后位于中间位置的数值,能较好地反映样本数据的中心位置。
2. 离散程度的指标离散程度的指标用来表示样本数据的分散程度,反映了样本数据的离散程度。
常用的离散程度指标包括标准差和方差。
标准差是样本数据偏离均值的平均距离的平方根,是对样本数据的分散程度的度量。
方差是标准差的平方,是样本数据离均值的平均偏差的度量。
3. 形状的指标1. 点估计点估计是利用样本的数字特征估计总体的数字特征的一种方法。
点估计通常是利用样本的数字特征来估计总体的数字特征的一个数值。
比较常用的点估计方法包括样本均值估计总体均值、样本标准差估计总体标准差等。
用样本数字特征估计总体数字特征3
知识探究
x甲 7, x乙 7
在一次射击选拔赛中,甲、乙两 名运动员各射击10次,每次命中的环数 如下: 甲:7 8 7 9 5 4 9 10 7 4 乙:9 5 7 8 7 6 8 6 7 7 甲、乙两人本次射击的平均成绩分 别为多少环?哪一个运动员成绩比较稳 定?
x甲 7,
x乙 7
知识探究
甲、乙两人射击的平均成绩相等,画出两人 成绩的频率分布条形图如下:
频率 0.4 0.3 0.2 0.1 O
(甲)
0.4 0.3 0.2 0.1 O
频率
(乙)
环数
4 5 6 7 8 9 10
4 5 6 7 8 9 10 环数
甲的成绩比较分散,极差较大,乙的 成绩相对集中,比较稳定.
谁的稳定性好用什么数来衡量? 甲成绩与平均成绩的偏差的和: (7-7)+(8-7)+(7-7)+(9-7)+(5-7)+(4-7)+(97)+(10-7)+(7-7)+(4-7)=0 乙成绩与平均成绩的偏差的和: (9-7)+(5-7)+(7-7)+(8-7)+(7-7)+(6-7)+(87)+(6-7)+(7-7)+(7-7)=0
1.0 0.8 0.6 0.4 0.2
s = 1.49
s = 2.83
O
1 2 3 4 5 6 7 8
(3)
O
1 2 3 4 5 6 7 8
(4)
例2 甲、乙两人同时生产内径为25.40mm的一种
零件,为了对两人的生产质量进行评比,从他们 生产的零件中各随机抽取20件,量得其内径尺寸 如下(单位:mm):
高中数学人教A版必修三习题第二章-用样本的数字特征估计总体的数字特征含答案
;x =
5
乙
5
=30,
2.所以-x 甲<-x 乙,s 甲>s 乙.
答案:B 二、填空题 6.甲、乙两位同学某学科连续五次的考试成绩用茎叶图表示如图所示,则平均分数较 高的是________,成绩较为稳定的是________.
解析:-x
甲=70,-x 乙
=68,s甲2
=1 5
×(22+12+12+22)=2,s乙2
11
= =6. 11
答案:A
2.甲、乙两同学在高考前各做了 5 次立定跳远测试,测得甲的成绩如下(单位:米):
2.20, 2.30, 2.30, 2.40, 2.30, 若 甲 、 乙 两 人 的 平 均 成 绩 相 同 , 乙 的 成 绩 的 方 差 是
0.005,那么甲、乙两人成绩较稳定的是________. 解析:求得甲的平均成绩为 2.30米,甲的成绩的方差是 0.004.由已知得甲、乙平均成
而 2(k1-3),2(k2-3),…,2(k6-3)的平均数为 2(k -3),则所求方差为
16[4(k1--k )2+4(k2--k )2+…+4(k6-
- k )2]=4×3=12.
答案:12
8.若有一个企业,70%的员工年收入 1 万元,25%的员工年收入 3 万元,5%的员工年收
入 11万元,则该企业员工的年收入的平均数是________万元,中位数是________万元,众
乙品种的样本平均数也为 10,样本方差为
[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2)+(9.8-10)2]÷5=0.24.
因为 0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.
估计总体的数字特征
(4)极差:一组数据的最大值与______ 最小值 之差叫极差
... (5)一般的,设一组样本数据为 x 1、x 2、、x,其 n
平均数为
x=
s =
2
x1 + x2 + ... + xn ___________________ n
方差为
( x1 - x ) + ( x2 - x ) + ...... + ( xn - x ) _______________________ n
用样本的数字特征估计 总体的数字特征(1)
教材:普通高中人教B版必修3
利津县第二中学 魏 静
2013-7-21
学习目标:
1、理解样本数据方差、标准差的意义,会 计算样本的平均数、方差和标准差。 2、认识统计的作用,体会用样本估计总体 的思想和逻辑推理的数学方法
重点与难点:
重点:通过实例理解样本方差、标准差的意 义,计算样本的方差和标准差 难点:对样本标准差意义的理解。
1、已知某样本的方差是4,则这个样本的标准差是 (A A、2 B、4 C、8 D、16 )
2、一组数据1,-1,0,-1,1,则这组数据的平均数和方差 分别是 ( A ) A、0,0.8 B、0.8,0.64 C、1,1 D、0.8,0.89
3、下列命题正确的个数有几个(B) (1)甲乙两个班期末考试数学平均成绩相同,这 表明这两个班数学学习情况一样 (2)在两组数据中,平均值较大的一组方差较大 (3)平均数反应数据的集中趋势,方差则反映数 据离平均值的波动大小 (4)方差的求法是求出各个数据与平均值的差的 平方后再求和 (5)方差的平方根叫标准差 (6)样本平均数与总体平均数相等 A 0 B1 C 2 D 3
必修三2-2-2用样本的数字特征估计总体的数字特征
课前探究学习
课堂讲练互动
活页规范训练
规律方法 1.中位数的求法 (1)当数据个数为奇数时,中位数是按从小到大顺序排列 的中间那个数. (2)当数据个数为偶数时,中位数为排列的最中间的两个 数的平均数. 2.深刻理解和把握平均数、中位数、众数在反映样本数 据上的特点,并结合实际情况,灵活应用.
课前探究学习
课堂讲练互动
活页规范训练
自学导引
众数、中位数、平均数的概念 1. 次数 最多的数称为这组数据的 (1)众数:一组数据中出现_____ 众数.一组数据中的众数可能不止一个,也可能没有.众 集中趋势 .在频率分布直方图中, 数反映了该组数据的_________ 中点 就是数据的众数. 最高矩形的_____ (2)中位数:一组数据按从小到大的顺序排成一列,处于 _____ 中间 位置的数称为这组数据的中位数(或两个数据的平均 数).一组数据中的中位数是唯一的,反映了该组数据的 集中趋势.在频率分布直方图中,中位数左边和右边的直 方图的面积_____ 相等 .
课前探究学习 课堂讲练互动 活页规范训练
1 解 (1) 利 用 平 均 数 计 算 公 式 得 x = (82×27 + 48 80×21)≈81.13(分). (2)∵男同学的中位数是75, ∴至少有14人得分不超过75分.
又∵女同学的中位数是80, ∴至少有11人得分不超过80分. ∴全班至少有25人得分低于80分(含80分). (3)男同学的平均分与中位数的差别较大,说明男同学中 两极分化现象严重,得分高的和低的相差较大.
课前探究学习
课堂讲练互动
活页规范训练
(4)数据的离散程度可以通过极差、方差或标准差来描 述.极差反映了一组数据变化的最大幅度,它对一组数据 中的极端值非常敏感,方差则反映了一组数据围绕平均数 波动的大小.为了得到以样本数据的单位表示的波动幅 度,通常用标准差——样本方差的算术平方根来描述. (5)标准差的大小不会越过极差. (6)方差、标准差、极差的取值范围:[0,+∞).当标准 差、方差为0时,样本各数据全相等,表明数据没有波动 幅度,数据没有离散性. (7)因为方差与原始数据的单位不同,且平方后可能夸大 了偏差的程度,所以虽然方差和标准差在刻画样本数据的 分散程度上是一样的,但在解决实际问题时,一般采用标 准差.
用样本的数字特征
称s2为这个样本的方差,
练习:若甲、乙两队比赛情况如下,下列说法哪些 说法是不正确的:
平均失球数 甲 1. 5 平均失球个数的标准差 1. 1
乙
2. 1
0. 4
1、平均来说,甲的技术比乙的技术好; 2、乙比甲技术更稳定; 3、甲队有时表现差,有时表现好; 4、乙队很少不失球。
全对
样本方差(样本标准差)是衡量一个样本 波动大小的量,样本方差(样本标准差) 越大,样本数据的波动就越大。
在一组数据中
1 平均数: 如果n个数x1,x2,x3……xn,那么 x ( x1 x2 x3 xn ) n 叫做这n个数的平均数
3、在一次中学生田径运动会上,参加男子跳高的17名运 动员的成绩如下表所示:
成绩(米)
人数
1.50 1.60
2 3
1.65
2
1.70
3
1.75
4
1.80
1
1.85
1
1.90
1
分别求这些运动员成绩的众数,中位数与平均数 。 解:在17个数据中,1.75出现了4次,出现的次数最多, 即这组数据的众数是1.75. 上面表里的17个数据可看成是按从小到大的顺序排列 的,其中第9个数据1.70是最中间的一个数据,即这组数 据的中位数是1.70; 这组数据的平均数是 1 x (1.50 2 1.60 3 ... 1.90 1) 1.69 米 17 答:17名运动员成绩的众数、中位数、平均数依次是 1.75(米)、1.70(米)、1.69(米)。
用样本的数字特征 估计总体的数字特征
一:频率分布直方图
频在率分布直方图中, 所有小矩形面积之和为1
在一组数据中
高中数学必修三《众数、中位数、平均数》优秀教学设计
§2.2.2 用样本的数字特征估计总体的数字特征第一课时众数、中位数、平均数学情分析本节课是选自人教A版《普通高中课程标准实验教科书数学3 》第二章第二节《用样本的数字特征估计总体的数字特征》的第一课时——众数、中位数和平均数。
在初中学生已经学过样本众数、样本中位数和平均数等数字特征,它们可以作为总体相应特征的估计。
既然频率分布可以作为总体分布的估计,因此总体的各种数字特征也可以利用频率分布来估计,这为我们提供了估计总体分布数字特征的新思路。
基于此种想法,教科书结合实例介绍了利用频率分布直方图估计总体众数、总体中位数和和总体平均数的方法。
而对于众数、中位数和平均数的概念,重点放在比较它们的特点,以及它们的适用场合上。
使学生能够发现,在日常生活中某些人通过混用这些(描述平均位置的)统计术语进行误导。
另一方面,教科书通过思考栏目让学生注意到,直接通过样本计算所得到的中位数与通过频率直方图估计得到的中位数不同。
在得到这个结论后,教师可以举一反三,使学生思考对于众数和平均数,是否也有类似的结论。
进一步,可以解释对总体众数、总体中位数和总体平均数的两种不同估计方法的特点。
在知道样本数据的具体数值时,通常通过样本计算中位数、平均值和众数,并用它们估计总体的中位数、均值和众数。
但有时我们得到的数据是整理过的数据,比如在媒体中见到的频数表或频率表,用教科书中的方法也可以得到总体的中位数、均值和众数的估计。
三维目标1.知识与技能:⑴能利用频率分布直方图估计总体的众数、中位数、平均数;⑵能用样本的众数、中位数、平均数估计总体的众数、中位数、平均数。
2.过程与方法:⑴结合实际,能对问题做出合理判断,制定解决问题的有效方法;⑵初步体会、领悟“用数据说话”的统计思想方法;⑶通过对有关数据的搜集、整理、分析、判断,培养学生“实事求是”的科学态度和严谨的工作作风。
3.情感态度与价值观:⑴在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法;⑵会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系.重点难点教学重点:根据实际问题对样本数据中提取基本的数据特征并做出合理解释,估计总体的基本数字特征;体会样本数字特征具有随机性.教学难点:用样本平均数估计总体的平均数;能应用相关知识解决简单的实际问题.教学方法启发引导法和多媒体辅助教学法课时安排1课时教学过程一、复习回顾由上节课对100户居民月均用水量的样本数据分析,我们知道了如何画频率分布直方图,请同学们一起回忆一下上节课的内容并填空。
黑龙江省齐齐哈尔市第八中学高中数学必修三领学案用样本的数字特征估计总体的数字特征
25.46254225.4525.3825.42
25.3925.4325.3925.4025.44
25.4025.4225.3525.4125.39
乙
25.4025.4325.4425.4825.48
25.4725.4925.4925.3625.34
品种
第1年
第2年
第3年
第4年
第5年
甲
9.8
9.9
10.1
10
10.2
乙
9.4
10.3
10.8
9.7
9.8
1.数据1,2,3,3,4的众数是()
A.1B.2C.3D.4
2.若一组数据为2,2,3,4,4,5,5,6,7,8.则中位数为()
A.4B.5C.4.5D.5.5
3.下列说法错误的是()
A.在统计里,把所需考察对象的全体叫做总体
题目
用样本的数字特征估计总体的数字特征
第课时
学习
目标
1.会求样本的众数、中位数、平均数;
2.能从频率分布直方图中,估算众数、中位数、平均数;
3.能用样本数字特征估计总体的数字特征,作出合理解释和决策.
4.理解样本数据方差、标准差的意义,会计算方差、标准差;
5.会用样本的基本数字特征(平均数、标准差)估计总体的基本数字特征;
试计算甲、乙两组数据的方差和标准差.
〖合作探究与典例解析〗
〖概括小结〗
〖课堂检测〗
求出探究点四课堂检测中的甲、乙两运动员射击成绩的标准差,结合其条形图体会标准差的大小与数据离散程度的关系.
【探究点六】
例3甲、乙两人同时生产内径为25.40 mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm):
用样本的数字特征估计总体的数字特征
用样本的数字特征估计总体的数字特征【知识点的知识】1.样本的数字特征:众数、中位数、平均数众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛.(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数;(2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数;(3)平均数:一组数据的算术平均数,即.2、三种数字特征的优缺点::(1)样本众数通常用来表示分类变量的中心值,比较容易计算,但是它只能表示样本数据中的很少一部分信息.(2)中位数不受少数几个极端值的影响,容易计算,它仅利用了数据排在中间的数据的信息.(3)样本平均数与每个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数,众数都不具有的性质,也正因为这个原因,与众数,中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.(4)如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.(5)使用者根据自己的利益去选择使用中位数或平均数来描述数据的中心,从而产生一些误导作用.3、如何从频率分布直方图中估计众数、中位数、平均数?利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.4、样本平均数、标准差对总体平均数、标准差的估计现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道(或不可求)的.如何求得总体的平均数与标准差呢?通常的做法是用样本的平均数与标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.如要考查一批灯泡的质量,我们可从中随机抽取一部分作为样本,要分析一批钢筋的强度,可以随机抽取一定数目的钢筋作为样本,只要样本的代表性强就可以用来对总体作出客观的判断.但需要注意的是,同一个总体,抽取的样本可以是不同的.如一个总体包含6个个体,现在要从中抽取3个作为样本,所有可能的样本会有20种不同的结果,若总体与样本容量较大,可能性就更多,而只要其中的个体是不完全相同的,这些相应的样本频率分布与平均数、标准差都会有差异.这就会影响到我们对总体情况的估计.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
思考2:在频率分布直方图中,每个小矩 形的面积表示什么?中位数左右两侧的 直方图的面积应有什么关系?
思考3:在城市居民月均用水量样本数据的频 率分布直方图中,从左至右各个小矩形的面 积分别是0.04,0.08,0.15,0.22,0.25, 0.14,0.06,0.04,0.02.由此估计总体的中 位数是什么?
频率 组距 0.5 0.4 0.3 0.2 0.1 O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
0.5-0.04-0.08-0.15-0.22=0.01, 0.5×0.1÷0.25=0.02,中位数是2.02.
思考4:平均数是频率分布直方图的“重心”,
在城市居民月均用水量样本数据的频率分布
那么标准差的取值范围是什么?标准差为 0的样本数据有何特点?
s≥0,标准差为0的样本数据都相等.
思考5:对于一个容量为2的样本:x1,
ห้องสมุดไป่ตู้
x2(x1<x2),则
x = x1 + x2 , s = x2 - x1
2
2
在数轴上,这两个统计数据有什么几何意义? 由此说明标准差的大小对数据的离散程度有 何影响?
知识探究(一):众数、中位数和平均数
思考1:在初中我们学过众数、中位数和 平均数的概念,这些数据都是反映样本 信息的数字特征,对一组样本数据如何 求众数、中位数和平均数?
频率 组距 0.5 0.4 0.3 0.2 0.1
取最高矩形下端 中点的横坐标 2.25作为众数.
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
频率分布直方图损失了一些样本数据,得 到的是一个估计值,且所得估值与数据分组 有关.
注:在只有样本频率分布直方图的情况下,我 们可以按上述方法估计众数、中位数和平均 数,并由此估计总体特征.
知识探究(二):标准差
样本的众数、中位数和平均数常用来表示样本 数据的“中心值”,其中众数和中位数容易计算, 不受少数几个极端值的影响,但只能表达样本数 据中的少量信息. 平均数代表了数据更多的信息, 但受样本中每个数据的影响,越极端的数据对平 均数的影响也越大.当样本数据质量比较差时,使 用众数、中位数或平均数描述数据的中心位置, 可能与实际情况产生较大的误差,难以反映样本 数据的实际状况,因此,我们需要一个统计数字 刻画样本数据的离散程度.
2.2 用样本估计总体
2.2.2用样本的数字特征估计总体的 数字特征
第一课时
问题提出
1.对一个未知总体,我们常用样本的频率分 布估计总体的分布,其中表示样本数据的频 率分布的基本方法有哪些?
2.美国NBA在2006——2007年度赛季中,甲、 乙两名篮球运动员在随机抽取的12场比赛中 的得分情况如下: 甲运动员得分:12,15,20,25,31,31,
频率
0.4 0.3 0.2 0.1
(甲)
O 4 5 6 7 8 9 10 环数
频率 (乙)
0.4 0.3 0.2 0.1
O 4 5 6 7 8 9 10 环数
甲的成绩比较分散,极差较大,乙的 成绩相对集中,比较稳定.
思考3:对于样本数据x1,x2,…,xn, 设想通过各数据到其平均数的平均距离 来反映样本数据的分散程度,那么这个 平均距离如何计算?
直方图中,各个小矩形的重心在哪里?从直
方图估计总体在各组数据内的平均数分别为
多少?
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
0.25,0.75,1.25,1.75,2.25,
2.75,3.25,3.75,4.25.
思考5:根据统计学中数学期望原理,将频率 分布直方图中每个小矩形的面积与小矩形底 边中点的横坐标之积相加,就是样本数据的 估值平均数. 由此估计总体的平均数是什么?
0.25×0.04+0.75×0.08+1.25×0.15+1.75 ×0.22+2.25×0.25+2.75×0.14+3.25× 0.06+3.75×0.04+4.25×0.02=2.02(t).
平均数是2.02.
平均数与中位数相等,是必然还是巧合?
思考6:从居民月均用水量样本数据可知,该 样本的众数是2.3,中位数是2.0,平均数是 1.973,这与我们从样本频率分布直方图得出 的结论有偏差,你能解释一下原因吗?
标准差越大离散程度越大,数据较分散; 标准差越小离散程度越小,数据较集中 在平均数周围.
知识迁移 计算甲、乙两名运动员的射击成绩的
标准差,比较其射击水平的稳定性. 甲:7 8 7 9 5 4 9 10 7 4 乙:9 5 7 8 7 6 8 6 7 7
s甲=2,s乙=1.095.
小结作业
1.用样本的数字特征估计总体的数字特征, 是指用样本的众数、中位数、平均数和标准 差等统计数据,估计总体相应的统计数据.
36,36,37,39,44,49. 乙运动员得分:8,13,14,16,23,26,
28,38,39,51,31,29.
甲运动员得分:12,15,20,25,31,31, 36,36,37,39,44,49.
乙运动员得分:8,13,14,16,23,26, 28,38,39,51,31,29.
如果要求我们根据上面的数据,估 计、比较甲,乙两名运动员哪一位发挥 得比较稳定,就得有相应的数据作为比 较依据,即通过样本数据对总体的数字 特征进行研究,用样本的数字特征估计 总体的数字特征.
| x1 - x | + | x2 - x | + L + | xn - x | n
思考4:反映样本数据的分散程度的大小,最 常用的统计量是标准差,一般用s表示.假设 样本数据x1,x2,…,xn的平均数为,则标准 差的计算公式是:
s = (x1 - x)2 + (x2 - x)2 + L + (xn - x)2 n
2.平均数对数据有“取齐”的作用,代表一 组数据的平均水平.标准差描述一组数据围绕 平均数波动的幅度.在实际应用中,我们常综 合样本的多个统计数据,对总体进行估计, 为解决问题作出决策.
作业:P79练习:1,2,3.
x甲思7, 考x乙 7 1:在一次射击选拔赛中,甲、乙 两名运动员各射击10次,每次命中的环 数如下: 甲:7 8 7 9 5 4 9 10 7 4 乙:9 5 7 8 7 6 8 6 7 7 x甲7, x乙 甲7 、乙两人本次射击的平均成绩分 别为多少环?
x甲 7, x乙 7
思考2:甲、乙两人射击的平均成绩相等,观 察两人成绩的频率分布条形图,你能说明其 水平差异在那里吗?