2.2.2 用样本的数字特征估计总体的数字特征(2)

合集下载

课件4:2.2.2 用样本的数字特征估计总体的数字特征

课件4:2.2.2 用样本的数字特征估计总体的数字特征

利用频率分布直方图求数字特征 (1)众数是最高的矩形的底边的中点. (2)中位数左右两侧直方图的面积相等. (3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐 标. (4)利用直方图求众数、中位数、平均数均为近似值,往往与实 际数据得出的不一致.但它们能粗略估计其众数、中位数和平 均数.
2.(1)(2016·福建检测)为了普及环保知识,增强环 保意识,某大学随机抽取 30 名学生参加环保知识测试,得分(十 分制)如图所示,假设得分值的中位数为 me,众数为 m0,平均 值为-x ,则( D )
2.标准差与方差 (1)标准差:标准差是样本数据到平均数的一种平均距离,一般 用 s 表示,计算时通常用公式
s=__________________________________________ 显然,标准差越大,数据的离散程度越大;标准差越小,数据 的离散程度越小. (2)方差:标准差 s 的平方 s2,即 s2= _n1_[_(x_1_-__-_x_)_2+__…__+__(_x_n_-__-x__)2_]_____叫做这组数据的方差,同标准 差一样,方差也是用来测量样本数据的分散程度的特征数.
3.平均数受样本中的每一个数据的影响,“越离群”的数据, 对平均数的影响也越大.与众数和中位数相比,平均数代表了 数据更多的信息.当样本数据质量比较差时,使用平均数描述 数据的中心位置可能与实际情况产生较大的误差.可以利用计 算机模拟样本,向学生展示错误数据对样本平均数的影响程 度.在体育、文艺等各种比赛的评分中,使用的是平均数.计 分过程中采用“去掉一个最高分,去掉一个最低分”的方法, 就是为了防止个别裁判的人为因素而给出过高或过低的分数对 选手的得分造成较大的影响,从而降低误差,尽量保证公平性.
合计

2.2.2 用样本的数字特征估计总体的数字特征(二) 标准差

2.2.2  用样本的数字特征估计总体的数字特征(二)  标准差

2.2.2 用样本的数字特征估计总体的数字特征(二) 标准差 ●学习目标1、能从样本数据中求出标准差,并做出合理解释;2、进一步体会用样本估计总体的思想,会用样本的标准差估计总体的特征;3、注意对样本标准差的随机性的体会,并能够正确利用标准差解决一些简单的实际问题. ●学习重点从样本数据中求出标准差并做出合理解释;样本估计总体的思想. ●学习难点体会统计的作用和样本标准差的随机性,并利用标准差解决一些简单的实际问题. ●学习过程 一.温故知新1、众数、中位数和平均数都是描述一组数据_________的量.2、两名射击运动员在一次射击测试中各射靶10次,每次命中的环数如下: 甲:7 8 7 9 5 4 9 10 7 4 乙:9 5 7 8 7 6 8 6 7 7 分别求出这两名运动员射击成绩的众数、中位数和平均数,对这次射击情况应如何评价?二.走进课堂1、极差:反映一组数据的变化的___________,它对一组数中的______非常敏感,由此可以得到一种“______________,______________”的统计策略.2、标准差:考察样本数据的______________最常用的统计量,是样本数据到_______的一种____________,一般用s 表示.(1)标准差的表达式:______________________s =;变形得:s = (2)标准差的大小,受样本中每个数据的影响,如果数据间变异大,则标准差也大,反之则小.因此,标准差越大,数据的离散程度_____,标准差越小,数据的离散程度_____; (3)标准差的取值范围是:______s ∈;(4)标准差常被理解为稳定性,标准差的单位与原数值的单位相同. 如何对上面甲、乙两名射击运动员做出评价?3、方差:即标准差的平方2s .(1)方差的表达式:2________________________________s =;(2)方差也是反映数据离散程度的特征数字,它的单位是原数值的单位的平方. 【夯实基础】(1)甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场进球数为3.2,全年比赛进球个数的标准差为3;乙队平均每场进球数为1.8,全年比赛进球个数的标准差为0.3,下列说法正确的有( )①甲队的技术比乙队好; ②乙队发挥比甲队稳定 ③乙队几乎每场都进球; ④甲队的表现时好时坏A.1个 B.2个 C.3个 D.4个 (2)某班有50名学生,某次数学考试的成绩经计算得到的平均分数是70分,标准差是s ,后来发现记录有误,某甲得70分却记为40分,某乙50分误记为80分,更正后重新计算得标准差为1s ,则s 与1s 之间的大小关系是( )A.s =1s B.s <1s C.s >1s D.不能确定 (3)已知一个样本为:x ,1,y ,5,其中x ,y 是方程组222,10x y x y +=⎧⎨+=⎩的解,则这个样本的标准差是( )A.2 C.5(4)一组数据的方差是2s ,将这组数据中的每一个数都乘以2,得到一组新数据,其方差是( ) A.212s B.22s C.24s D.2s(5)一组数据中的每一个数都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是( )A.81.2,4.4 B.78.8,4.4 C.81.2,84.4 D.78.8,75.6 (6)五个数1,2,3,4,a 的平均数是3,,则a =____,这五个数的标准差是_____.(7)若1a ,2a ,…,20a ,这20个数据的平均数为x ,方差为0.20,则数据1a ,2a ,…,20a ,x 这21个数据的方差约为__________(保留2位有效 ).4、典例精析【例1】从一批棉花中抽取9根棉花的纤维,长度如下:(单位:mm ) 82,202,352,321,25,293,86,206,115. 求样本的平均数、样本的方差和样本的标准差.【例2】现有A 、B 两个班级,每个班级有45名学生参加一次测验,每名参加者可获得0,1B 班的测试结果如右图:(1)你认为哪个班级的成绩比较稳定?(2)若两班共有60人及格,则参加者最少获得 多少分才可能及格?5、课堂小结:(1)众数、中位数和平均数都是描述一组数据集中趋势的特征数;标准差、方差都是用来描述一组数据波动情况的特征数,标准差更具无偏性.(2)当两个样本的平均数相等或相差无几时,就要用标准差来反映样本数据的离散程度. 作业:。

2.2.2用样本的数字特征估计总体的数字特征

2.2.2用样本的数字特征估计总体的数字特征

举例 1. 甲在一次射击比赛中的得分如下: ( 单 位:环).7,8,6,8,6,5,9,10,7,5,则他命中的平均 数是_____. 7.1 2. 某次数学试卷得分抽样中得到:90分 的有3个人,80分的有10人,70分的有5人,60 77分 分的有2人,则这次抽样的平均分为______.
思考
2.2.2用样本的数字特征 估计总体的数字特征
创设意境
在一次射击比赛中,甲、乙两名运动员各射击
10次,命中环数如下﹕ 甲运动员﹕7,8,6,8,6,5,8,10,7,4; 乙运动员﹕9,5,7,8,7,6,8,6,7,7. 观察上述样本数据,你能判断哪个运动员发挥
的更稳定些吗?为了从整体上更好地把握总体的规
如何从频率分布直方图中估计中位数?
练习
应该采用平均数来表示每一个国家项目的平 均金额,因为它能反映所有项目的信息.但平均数 会受到极端数据2200万元的影响,所以大多数项 目投资金额都和平均数相差比较大.
标准差
有两位射击运动员在一次射击测试中各射 靶十次,每次命中的环数如下:
如果你是教练,你应当如何对这次射击情况作出 评价?如果这是一次选拔性考核,你应当如何作出选 择?
律,我们要通过样本的数据对总体的数字特征进行 研究——用样本的数字特征估计总体的数字特征.
1. 众数
在一组数据中,出现次数最多
的数据叫做这一组数据的众数. 2. 中位数 将一组数据按大小依次排列,把 处在最中间位置的一个数据(或两个数据的 平均数)叫做这组数据的中位数. 3. 平均数 (1) x = (x1+x2+……+xn) /n (2) x = x’ +a (3) x = (x1f1+x2f2+……xkfk)/n

(完整版)用样本的数字特征估计总体的数字特征

(完整版)用样本的数字特征估计总体的数字特征

2.2.2用样本的数字特征估计总体的数字特征 (两课时)零号作业一、众数、中位数、平均数1、众数:(1)定义:一组数据中出现次数最多的数称为这组数据的众数.(2)特征:一组数据中的众数可能不止一个,也可能没有,反映了该组数据的集中趋势 [破疑点] 众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使其无法客观地反映总体特征.(3)在直方图中为最高矩形下端中点的横坐标 2、中位数:(1)定义:一组数据按从小到大的顺序排成一列,处于中间位置的数称为这组数据的中位数. (2)特征:一组数据中的中位数是唯一的,反映了该组数据的集中趋势.在频率分布直方图中,中位数左边和右边的直方图的面积相等.[破疑点] 中位数不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点.(3) 直方图面积平分线与横轴交点的横坐标.左右两边面积各占一半3、平均数:(1)定义:一组数据的和与这组数据的个数的商.数据x 1,x 2,…,x n 的平均数为xn=x 1+x 2+…+x nn(2)特征:平均数对数据有“取齐”的作用,代表该组数据的平均水平.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中极端值的影响较大,使平均数在估计总体时可靠性降低.(3) 直方图中每个小矩形的面积与小矩形底边中点的横坐标的乘积之和. 二、标准差、方差1、标准差(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s 表示,通常用以下公式来计算s =1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]可以用计算器或计算机计算标准差.(2)特征:标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较_ 小.2.方差(1)定义:标准差的平方,即s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2](2)特征:与标准差的作用相同,描述一组数据围绕平均数波动程度的大小. (3)取值范围:[0,+∞)3、数据组x 1,x 2,…,x n 的平均数为x ,方差为s 2,标准差为s ,则数据组ax 1+b ,ax 2+b ,…,ax n +b (a ,b 为常数)的平均数为a x +b ,方差为a 2s 2,标准差为4、规律总结(1)用样本的数字特征估计总体的数字特征,是指用样本的众数、中位数、平均数和标准差等统计数据,估计总体相应的统计数据. 样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息. 平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度.用样本的数字特征估计总体的数字特征,是指用样本的众数、中位数、平均数和标准差等统计数据,估计总体相应的统计数据(2)平均数对数据有“取齐”的作用,代表一组数据的平均水平.标准差描述一组数据围绕平均数波动的幅度.在实际应用中,我们常综合样本的多个统计数据,对总体进行估计,为解决问题作出决策.(3)标准差越大离散程度越大,数据较分散;标准差越小离散程度越小,数据较集中在平均数周围.列出一组样本数据的频率分布表步骤说明:1、对同一个总体,可以抽取不同的样本,相应的平均数与标准差都会发生改变.如果样本的代表性差,则对总体所作的估计就会产生偏差;如果样本没有代表性,则对总体作出错误估计的可能性就非常大,由此可见抽样方法的重要性.2.在抽样过程中,抽取的样本是具有随机性的,如从一个包含6个个体的总体中抽取一个容量为3的样本就有20中可能抽样,因此样本的数字特征也有随机性.用样本的数字特征估计总体的数字特征,是一种统计思想,没有惟一答案.3.在实际应用中,调查统计是一个探究性学习过程,需要做一系列工作,我们可以把学到的知识应用到自主研究性课题中去.一号作业11、众数(1)定义:一组数据中出现次数______的数称为这组数据的众数.(2)特征:一组数据中的众数可能______一个,也可能没有,反映了该组数据的____________.在直方图中为最高矩形下端中点的____________最多不止集中趋势横坐标2.中位数(1)定义:一组数据按从小到大的顺序排成一列,处于______位置的数称为这组数据的中位数.(2)特征:一组数据中的中位数是______的,反映了该组数据的______________.在频率分布直方图中,中位数左边和右边的直方图的面积______..中间唯一集中趋势相等3.平均数(1)定义:一组数据的和与这组数据的个数的商.数据x1,x2,…,x n的平均数为x n=_________________.(2)特征:平均数对数据有“取齐”的作用,代表该组数据的_____________.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的______,但平均数受数据中_________的影响较大,使平均数在估计总体时可靠性降低.直方图中每个小矩形的面积与小矩形底边中点的横坐标的. ______x1+x2+…+x nn平均水平信息极端值乘积之和4.标准差(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s表示,通常用以下公式来计算s=__________________________.可以用计算器或计算机计算标准差.(2)特征:标准差描述一组数据围绕______波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较______;标准差较小,数据的离散程度较______.1n[(x1-x)2+(x2-x)2+…+(x n-x)2]平均数大小5.方差(1)定义:标准差的平方,即s2=________________________________________.(2)特征:与____________的作用相同,描述一组数据围绕平均数波动程度的大小.(3)取值范围:___________.1n[(x1-x)2+(x2-x)2+…+(x n-x)2] 标准差[0,+∞)数据组x1,x2,…,x n的平均数为x,方差为s2,标准差为s,则数据组ax1+b,ax2+b,…,ax n+b(a,b为常数)的平均数为a x+b,方差为a2s2,标准差为as.典例讲解中位数、众数、平均数的应用例1据报道,某公司的33名职工的月工资(以元为单位)如下:(1)求该公司的职工月工资的平均数、中位数、众数;(2)假设副董事长的工资从5 000元提升到20 000元,董事长的工资从5 500元提升到30 000元,那么新的平均数、中位数、众数又是什么?(精确到1元)(3)你认为哪个统计量更能反映这个公司职工的工资水平?结合此问题谈一谈你的看法.[解析](1)平均数是x=1 500+4 000+3 500+2 000×2+1 500+1 000×5+500×3+0×2033≈1 500+591=2 091(元).中位数是1 500元,众数是1 500元.(2)平均数是x′=1 500+28 500+18 500+2 000×2+1 500+1 000×5+500×3+0×2033≈1 500+1 788=3 288(元).中位数是1 500元,众数是1 500元.(3)在这个问题中,中位数或众数均能反映该公司职工的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数偏差较大,所以平均数不能反映这个公司职工的工资水平.练习1:某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):甲群13,13,14,15,15,15,15,16,17,17;乙群54,3,4,4,5,5,6,6,6,57.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好反映乙群市民的年龄特征?[答案](1)甲群市民年龄的平均数为13+13+14+15+15+15+15+16+17+1710=15(岁),中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.(2)乙群市民年龄的平均数为54+3+4+4+5+5+6+6+6+5710=15(岁),中位数为5岁,众数为6岁.由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.例2:(1)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差(2)某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.①求这次测试数学成绩的众数.②求这次测试数学成绩的中位数.③求这次测试数学成绩的平均分.[解析](1)x甲=15(4+5+6+7+8)=6,x乙=15(5×3+6+9)=6,甲的中位数是6,乙的中位数是5.甲的成绩的方差为15(22×2+12×2)=2,乙的成绩的方差为15(12×3+32×1)=2.4.甲的极差是4,乙的极差是4.所以A,B,D错误,C正确.(2)①由图知众数为70+802=75.②由图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x-70),所以x≈73.3.③由图知这次数学成绩的平均分为:40+502×0.005×10+50+602×0.015×10+60+702×0.02×10+70+802×0.03×10+80+902×0.025×10+90+1002×0.005×10=72.[答案](1)C (2)见解析练习1:参加市数学调研抽测的某校高三学生成绩分布的茎叶图1和频率分布直方图2均受到不同程度的破坏,但可见部分信息如下,据此解答如下问题:求参加数学抽测的人数n,抽测成绩的中位数及分数分布在[80,90),[90,100]内的人数.[答案]分数在[50,60)内的频率为2,由频率分布直方图可以看出,分数在[90,100]内的同样有2人.由2n=10×0.008,得n=25.由茎叶图可知抽测成绩的中位数为73.∴分数在[80,90)之间的人数为25-(2+7+10+2)=4.参加数学竞赛人数n=25,中位数为73,分数在[80,90),[90,100]内的人数分一号作业21.对于数据3,3,2,3,6,3,10,3,6,3,2.①这组数据的众数是3;②这组数据的众数与中位数的数值都不相等;③这组数据的中位数与平均数的数值相等;④这组数据的平均数与众数的值相等.其中正确的结论的个数() A.1B.2 C.3 D.42、为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如下图所示,假设得分值的中位数为m e,众数为m O,平均值为x,则()A.m e=m O=x B.m e=m O<x C.m e<m O<x D.m O<m e<x3、某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45)岁之间,根据调查结果得出司机的年龄情况残缺的频率分布直方图如图所示,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是() A.31,6岁B.32.6岁C.33.6岁D.36.6岁4、阶段考试以后,班长算出了全班40个人数学成绩的平均分为M,如果把M当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均分为N,那么M N为________.1、A 2 D 3、C 4、 15、为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4服用B药的20位患者日平均增加的睡眠时间:3.2 1.7 1.90.80.9 2.4 1.2 2.6 1.3 1.4 1.60.5 1.80.6 2.1 1.1 2.5 1.2 2.70.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据绘制茎叶图,从茎叶图看,哪种药的疗效更好?[解析](1)设A药观测数据的平均数为x,B药观测数据的平均数为y.由观测结果可得x=120×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,y=120×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得x>y,因此可看出A药的疗效更好.(2)由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A药疗效的试验结果有710的叶集中在茎2,3上,而B药疗效的试验结果有710的叶集中在茎0,1上,由此可看出A药的疗效更好.标准差、方差的应用例3、从甲、乙两种玉米的苗中各抽10株,分别测它们的株高如下:(单位:cm)甲:25414037221419392142乙:27164427441640401640问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?[解析]看哪种玉米的苗长得高,只要比较甲、乙两种玉米的苗的均高即可;要比较哪种玉米的苗长得齐,只要看两种玉米的苗高的方差即可,因为方差是体现一组数据波动大小的特征数.(1)x甲=110(25+41+40+37+22+14+19+39+21+42)=110×300=30(cm),x乙=110(27+16+44+27+44+16+40+40+16+40)=110×310=31(cm).所以x甲<x乙.(2)s2甲=110[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=110(25+121+100+49+64+256+121+81+81+144)=110×1042=104.2(cm2),s2乙=110[(2×272+3×162+3×402+2×442)-10×312]=110×1288=128.8(cm2).所以s2甲<s2乙.[答案](1)乙种玉米的苗长得高,(2)甲种玉米的苗长得齐.练习1:甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表:s1,s2,s3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有() A.s3>s1>s2B.s2>s1>s3C.s1>s2>s3D.s2>s3>s1[答案] B练习2:一次数学知识竞赛中,两组学生成绩如下表:已经算得两个组的平均分都是80分,请根据你所学过的统计知识,进一步判断这两个组这次竞赛中成绩谁优谁次,并说明理由.[答案](1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较看,甲组成绩好些.(2)s2甲=12+5+10+13+14+6×[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=150×(2×900+5×400+10×100+13×0+14×100+6×400)=172.s2乙=150×(4×900+4×400+16×100+2×0+12×100+12×400)=256.因为s2甲<s2乙,所以甲组成绩较乙组成绩稳定.(3)甲、乙两组成绩的中位数、平均数都是80分,其中甲组成绩在80分以上(含80分)的有33人,乙组成绩在80分以上(含80分)的有26人,从这一角度看,甲组成绩总体较好.(4)从成绩统计表看,甲组成绩大于或等于90分的人数为20人,乙组成绩大于或等于90分的人数为24人,所以乙组成绩在高分阶段的人数多,同时,乙组得满分的比甲组得满分的多6人,从这一角度看,乙组成绩较好.一号作业31. 若样本数据x 1,x 2,……,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )A .8B .15C .16D .322.为了稳定市场,确保农民增收,某农产品7个月份的每月市场收购价格与其前三个月的市场收购价格有关,并使其与前三个月的市场收购价格之差的平方和最小,下表列出的是该产品今年前6个月的市场收购价格:则前7A.757 B.767 C .11D.7873. 某班级有50名学生,其中有30名男生和20名女生.随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是( )A .这种抽样方法是一种分层抽样B .这种抽样方法是一种系统抽样C .这五名男生成绩的方差大于这五名女生成绩的方差D .该班男生成绩的平均数小于该班女生成绩的平均数4.由正整数组成的一组数据x 1,x 2,x 3,x 4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)1、C2、B3、C4、1,1,3,3。

2.2.2用样本数字特征估计总体数字特征

2.2.2用样本数字特征估计总体数字特征

(C)中位数
(D)标准差
样本的众数、中位数和平均数常用来表 示样本数据的“中心值”,其中众数和中位 数容易计算,但只能表达样本数据中的少量 信息. 平均数代表了数据更多的信息,但受 样本中每个数据的影响,越极端的数据对平 均数的影响也越大.
因此,我们需要一个统计数字刻画样本 数据的离散程度(波动程度).
方差:
S 2 (x1 x)2 (x2 x)2 ...... (xn x)2
则7个剩余分数的方差为?
(A) 116
9
(B) 36
7
(C) 36
(D) 6 7
7
【201山东文】某次测量中得到的A样本数
据如下:82,84,84,86,86,86,
88,88,88,88. 若B样本数据恰好是A
样本数据都加 2后所得数据,则A,B两
样本的下列数字特 征对应相同的是?
(A)众数
(B)平均数
(3)若k1,k2,…, k8的方差为3,则2(k1-3),
2(k2-3), …, 2(k8-3)的方差为____1_2___
【2013山东文】将某选手的9个得分 去掉1个最高分,去掉1个最低分, 7个剩余分数的平均分为91,现场做 的9个分数的茎叶图后来有一个数据 模糊,无法辨认,在图中以x表示。
乙:9 5 7 8 7 6 8 6 7 7
因为s甲=2,s乙=1.095. 所以乙的成绩更稳定
练习:
(1)若x1, x2 , , xn的方差为4,那么
x1 3, x2 3, , xn 3的方差为_4___
(2)若x1, x2 , , xn的方差为2,那么 这组数据均乘以4后的方差为 __3_2_
ห้องสมุดไป่ตู้
标准差:

2.2.2用样本的数字特征估计总体的数字特征(2)

2.2.2用样本的数字特征估计总体的数字特征(2)

| x1 x |
| x2 x | n
| xn
x|
含有绝对值,运算不方便
思考4:反映样本数据的分散程度的大小,最常用的统计 量是标准差,一般用s表示.假设样本数据x1,x2,…,xn 的平均数为 x ,则标准差的计算公式是:
s
(x 1 x )
2
(x 2 x ) n
2
(x n x )
2
那么标准差的取值范围是什么?标准差为0的样本数据有 何特点? s≥0,标准差为0的样本数据都相等.
(甲)
频率
(乙)
0.4 0.3 0.2 0.1 4 5 6 7 8 9 10 环数 O
4 5 6 7 8 9 10 环数
甲的成绩比较分散,极差较大,
乙的成绩相对集中,比较稳定.
思考3:对于样本数据x1,x2,…,xn,设想通过各数据到 其平均数的平均距离来反映样本数据的分散程度,那么这 个平均距离如何计算?
2.2.2
用样本的数字特征估计
总体的数字特征(2)
1.理解样本数据方差、标准差的意义,会计算方差、
标准差;
2.会用样本的基本数字特征(平均数、标准差)估计
总体的基本数字特征;
3.体会用样本估计总体的思想.
复习回顾
知识点一 众数
新知探究 点点落实
定义 在一组数据中,出现次数最多的数据叫做这组数据的众数. 特点 (1)众数是这组数据中出现次数最多的数; (2)众数可以有一个或多 个;(3) 众数大致的值就是样本数据的频率分布直方图中最高矩形的中点 的横坐标. (4) 用众数代表一组数据,可靠性较差,不过,众数不受极端数 据的影响,并且求法简便 .在一组数据中,如果个别数据有很大的变动, 而某一数据出现次数又较多时,选择众数表示这组数据的“集中趋势”就 比较适合.

2.2.2用样本的数字特征估计总体的数字特征

2.2.2用样本的数字特征估计总体的数字特征
的标准差。(标准差结果精确到0.2 3) 90 8
.
所以这组数据的标准差为2.3 .
4、在数据统计中,能反映一组数据变化 范围大小的指标是 A.极差 B.方差 C.标准差 (A ) D.以上都不对
5.已知一个样本1, 3, 2, 5,x,若它的平均 数是3,则这个样本的标准差是 ______ . 2 6.若样本x1 , x 2 ,,x n的方差为0,则表示 ( A.x 0
这表明乙的成绩比甲的成绩稳定。
总结:
标准差S越大,样本数据的离散程度越大,波动越 大,越不稳定
方差:
标准差的平方
1 2 2 2 s [( x1 x ) ( x2 x ) ( xn x ) ] n
2
总结:
通常用样本的平均数和标准差去估计总体的 平均数与标准差
练1:”八.一”前夕,某中学举行国防知识竞赛:满分为 100分,80分以上为优秀,现将高一的两个班参赛学生的 成绩进行整理后分成五组绘制成如图所示的频率分布直 方图,已知图中从左到右的第一、第二、第三、第四、 第五小组的频率分别是0.3,0.4,0.15,0.1,0.05 求:(1)成绩的众数、 中位数; (2)平均成绩
样本数据的估计平均数就是将频率分布直方图中每个 小矩形的面积与小矩形底边中点的横坐标之积相加. 由此估计总体的平均数就是
0.5 0.4 0.3 0.2 0.1 O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 频率 组距
月均用水量/t
0.25, 0.75, 1.25,1.75,2.25,2.75,3.25, 3.75, 4.25.
0.04 0.03
(1)65,65 (2)67
0.015 0.010 0.005

高中数学必修3《用样本的数字特征估计总体的数字特征(二)》导学案

高中数学必修3《用样本的数字特征估计总体的数字特征(二)》导学案

数学(高二上)导学案必修三第二章第二节课题:用样本估计总体二、合作探究归纳展示任务1 标准差问题平均数向我们提供了样本数据的重要信息,但是平均数有时也会使我们作出对总体的片面判断,因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽视的.因此,只有平均数还难以概括样本数据的实际状态.如:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲:7879549107 4乙:9578768677如果你是教练,你应当如何对这次射击作出评价?思考1甲、乙两人本次射击的平均成绩分别为多少环?答经计算得:x甲=110(7+8+7+9+5+4+9+10+7+4)=7,同理可得x乙=7.思考2观察下图中两人成绩的频率分布条形图,你能说明其水平差异在哪里吗?答直观上看,还是有差异的.如:甲成绩比较分散,乙成绩相对集中.思考3对于甲乙的射击成绩除了画出频率分布条形图比较外,还有没有其它方法来说明两组数据的分散程度?答还经常用甲乙的极差与平均数一起比较说明数据的分散程度.甲的环数极差=10-4=6,乙的环数极差=9-5=4.它们在一定程度上表明了样本数据的分散程度,与平均数一起,可以给我们许多关于样本数据的信息.显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.思考4 如何用数字去刻画这种分散程度呢?答 考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s 表示 . 思考5 所谓“平均距离”,其含义如何理解?答 假设样本数据是x 1,x 2,…,x n ,x 表示这组数据的平均数.x i 到x 的距离是|x i -x |(i =1,2,…,n ).于是,样本数据是x 1,x 2,…,x n 到x 的“平均距离”是S =|x 1-x |+|x 2-x |+…+|x n -x |n .由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差: s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 思考6 标准差的取值范围如何?若s =0表示怎样的意义?答 从标准差的定义可以看出,标准差s ≥0,当s =0时,意味着所有的样本数据等于样本平均数. 任务2 方差思考1 方差的概念是怎样定义的?答 人们有时用标准差的平方s 2—方差来代替标准差,作为测量样本数据分散程度的工具,方差:s 2=1n ·[(x 1-x )2+(x 2-x )2+…+(x n -x )2].思考2 对于一个容量为2的样本:x 1,x 2(x 1<x 2),它们的平均数和标准差如果分别用x 和a 表示,那么x 和a 分别等于什么? 答 x =12(x 1+x 2),a =12(x 2-x 1).思考3 在数轴上,x 和a 有什么几何意义?由此说明标准差的大小对数据的离散程度有何影响?答 x 和a 的几何意义如下图所示.说明了标准差越大离散程度越大,数据较分散;标准差越小离散程度越小,数据较集中在平均数周围.思考4 现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?答 通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.例1求出问题中的甲乙两运动员射击成绩的标准差,并说明他们的成绩谁比较稳定?解x甲=110(7+8+7+9+5+4+9+10+7+4)=7,同理可得x乙=7.根据标准差的公式,s甲=110[(7-7)2+(8-7)2+…+(4-7)2]=2;同理可得s乙≈1.095.所以s甲>s乙.因此说明甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.跟踪训练1如图所示是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.答案 6.8任务3标准差及方差的应用例2画出下列四组样本数据的条形图,说明它们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8.解四组样本数据的条形图如下:四组数据的平均数都是5.0,标准差分别是:0.00,0.82,1.49,2.83.它们有相同的平均数,但它们有不同的标准差,说明数据的分散程度是不一样的.跟踪训练2从甲、乙两种玉米中各抽10株,分别测得它们的株高如下:甲:25、41、40、37、22、14、19、39、21、42;乙:27、16、44、27、44、16、40、40、16、40;(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?解(1)x甲=110(25+41+40+37+22+14+19+39+21+42)=30,x乙=110(27+16+44+27+44+16+40+40+16+40)=31,x甲<x乙.即乙种玉米的苗长得高.(2)由方差公式得:s2甲=110[(25-30)2+(41-30)2+…+(42-30)2]=104.2,同理s2乙=128.8,∴s2甲<s2乙.即甲种玉米的苗长得齐.答乙种玉米苗长得高,甲种玉米苗长得齐.例3甲、乙两人同时生产内径为25.40 mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm):甲25.4625.3225.4525.3925.3625.3425.4225.4525.3825.4225.3925.4325.3925.4025.44的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.3.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性.用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案.四、作业布置 1、基础知识:1.下列说法正确的是( )A .在两组数据中,平均值较大的一组方差较大B .平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小C .方差的求法是求出各个数据与平均值的差的平方后再求和D .在记录两个人射击环数的两组数据中,方差大的表示射击水平高 答案 B2.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为( )A.1169B.367C .36D.677答案 B3.已知一组数据x 1,x 2,x 3,x 4,x 5的平均数是x =2,方差是13,那么另一组数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数和方差分别为( )A .2,13B .2,1C .4,13D .4,3答案 D4.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4.则:(1)平均命中环数为________; (2)命中环数的标准差为________.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

x甲 x乙
∴乙种玉米的苗长得高.
(2)由方差公式得:
1 s甲= [(25-30)2+(41-30)2+…+(42-30)2]=104.2, 10
2
2 同:乙种玉米苗长得高,甲种玉米苗长得齐.
2
2
课后作业
1.甲、乙两种水稻试验品种连续 5 年的平均单位面积产量如 下(单位:t/hm2),试根据这组数据估计哪一种水稻品种的产 量比较稳定.
课堂练习
1.如图是某校举行的元旦诗歌朗诵比赛中, 七位评委为某位选手打出分数的茎叶统计图 ,
去掉一个最高分和一个最低分,所剩数据
的平均数和方差分别为( (A)84,4.84 (B)84,1.6 )
(C)85,1.6
(D)85,0.4
【解析】选C.得分是79,84,84,86,84,87,93,最高分是93,最低分 是79,则去掉一个最高分和一个最低分后该选手得分是84,84, 86,84,87,计算得平均数是85,方差是1.6.
(2)因平均数为300,由表格中所列出的数据可见,只有经理 在平均数以上,其余的人都在平均数以下,故用平均数不能 客观真实地反映该工厂的工资水平.
因此,在例子中的解答过程可表述为: 解:由数据可得:
1 1 7 x甲 (7 8 7 4) 7, x乙 (9 5 7 7) 10 10
x甲 x乙
∴从平均成绩看甲、乙二人的成绩无明显差异。
1 7 72 8 72 4 72 2 s甲 10
|x1- x |+|x2- x |+„+|xn- x | S= .由于上式含有绝对值, n
运算不太方便,因此,通常改用如下公式来计算标准差:
s= 1 2 2 2 [ x - x + x - x +„+ x - x ]. 2 n n 1
在统计中,我们通常用标准差来考察样本数 据的离散程度,标准差是样本数据到平均数的 一种平均距离。 (二)标准差、方差:
新课引入
样本的众数、中位数和平均数常用来表示样本 数据的“中心值”,其中众数和中位数容易计算, 不受少数几个极端值的影响,但只能表达样本数据 中的少量信息. 平均数代表了数据更多的信息,但 受样本中每个数据的影响,越极端的数据对平均数 的影响也越大.当样本数据质量比较差时,使用众 数、中位数或平均数描述数据的中心位置,可能与 实际情况产生较大的误差,难以反映样本数据的实 际状况。因此,我们需要一个统计数字刻画样本数 据的离散程度,这就是我们本节课要学习的——标 准差、方差.
品种 甲 乙 第 1年 9.8 9.4 第 2年 9.9 10.3 第 3年 10.1 10.8 第 4年 10 9.7 第 5年 10.2 9.8
解:甲品种的样本平均数为10,样本方差为
[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷ 5 =0.02.
1.标准差:s 1 [( x x )2 ( x x )2 ( x x )2 ] 1 2 n
n
2.方差:
1 s [( x1 x ) 2 ( x2 x )2 ( xn x )2 ] n
2
注:在刻画样本数据分散程度上,方差s2与标准差 s是一样的。但是在解决实际问题时,一般多采用 标准差s 。
108 500 = ≈3 288(元). 33
中位数是1 500元,众数是1 500元.
职业
人数 工资
董事长
1 5 500
副董事长
1 5 000
董事
2 3 500
总经理
1 3 000
经理
5 2 500
管理员
3 2 000
职员
20 1 500
(3)你认为哪个统计量更能反映这个公司员工的工资水平? 解:(3)在这个问题中,中位数和众数都能反映出这个公司员 工的工资水平,因为公司少数人的工资额与大多数人的工资 额差别较大,这样导致平均数与中位数偏差较大,所以平均 数不能反映这个公司员工的工资水平.
诱思探究1
在一次射击选拔赛中,甲、乙两名运动员各射 击10次,每次命中的环数如下: 甲:7 8 7 9 5 4 9 10 7 4 乙:9 5 7 8 7 6 8 6 7 7 如果你是教练员,如何对这二人的成绩作出评 价? 如果从比较两组数据的集中趋势,我们可以 从众数、中位数、平均数,但较多选择平均数。
诱思探究4
1.如何用数字去刻画这种分散程度呢? 答:考察样本数据的分散程度的大小,最常用的统计量 是标准差.标准差是样本数据到平均数的一种平均距离, 2.所谓“平均距离”,其含义如何理解?
答 假设样本数据是 x1,x2,„,xn, x 表示这组数据的平 均数.xi 到 x 的距离是|xi- x |(i=1,2,„,n).于是,样本数 据是 x1,x2,„,xn 到 x 的“平均距离”是
巩固练习
某公司的33名职工的月工资(单位:元)如下表:
职业 人数 工资 董事长 1 5 500 副董事长 1 5 000 董事 2 3 500 总经理 1 3 000 经理 5 2 500 管理员 3 2 000 职员 20 1 500
(1)求该公司职工月工资的平均数、中位数、众数. (2)若董事长、副董事长的工资分别从5 500元、5 000元提 升到30 000元、20 000元,那么公司职工新的平均数、中位 数和众数又是什么? (3)你认为哪个统计量更能反映这个公司员工的工资水平?
1 9 72 5 72 7 72 1.098 s乙 10




s甲 s乙
∴乙比甲的射击成绩稳定
∴如果我是教练员,我认为乙的成绩更好,应派乙参加比赛。
小结:
1.对同一个总体,可以抽取不同的样本,相应的平 均数与标准差都会发生改变.如果样本的代表性差, 则对总体所作的估计就会产生偏差;如果样本没有 代表性,则对总体作出错误估计的可能性就非常大, 由此可见抽样方法的重要性. 2.在抽样过程中,抽取的样本是具有随机性的,如 从一个包含6个个体的总体中抽取一个容量为3的样 本就有20中可能抽样,因此样本的数字特征也有随 机性.用样本的数字特征估计总体的数字特征,是 一种统计思想,没有惟一答案.
对标准差的理解: (1)标准差是用来描述样本数据的离散程度的,它 反映了各个样本数据聚集于样本平均数周围的程度。 标准差越小,表明各个样本数据在样本平均数的周 围越集中;反之,标准差越大,表明各个样本数据 在样本平均数的两边越分散。 (2)在实际应用中,标准差常被理解为稳定性。 (3) 标准差是非负的。标准差为0意味着所有的 样本数据都相等的特性,且与样本平均数也相等。
职业
人数 工资
董事长
1 5 500
副董事长
1 5 000
董事
2 3 500
总经理
1 3 000
经理
5 2 500
管理员
3 2 000
职员
20 1 500
(1)求该公司职工月工资的平均数、中位数、众数. 解 :(1)公司职工月工资的平均数为
x=
5 500+5 000+3 500×2+3 000+2 500×5+2 000×3+1 500×20 33
温故知新
(一) 众数、中位数、平均数 1. 众数、中位数、平均数的概念 2.求众数、中位数、平均数的方法: (1)用样本数据计算; (2)用频率分布直方图估算。 ①众数:最高矩形下端中点的横坐标 ②中位数:直方图面积平分线与横轴交点的横坐标. ③平均数:每个小矩形的面积与小矩形底边中点的横坐标 的乘积之和.
乙品种的样本平均数也为10,样本方差为
[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷ 5=0.244.
∵0.244>0.02 ∴由这组数据可以认为甲种水稻的产量 比较稳定.
2.某工厂人员及工资构成如下:
人员
周工 资 人数 合计
经理
2 200 1 2 200
环数
由条形图可知:甲的成绩比较分散,乙的成绩相 对集中,比较稳定.
诱思探究3
对于甲乙的射击成绩除了画出频率分布条形图 比较外,还有没有其它方法来说明两组数据的分散 程度? 答:还经常用甲乙的极差与平均数一起比较说明 数据的分散程度.甲的环数极差=10-4=6,乙的环 数极差=9-5=4.它们在一定程度上表明了样本数 据的分散程度,与平均数一起,可以给我们许多 关于样本数据的信息.显然,极差对极端值非常 敏感,注意到这一点,我们可以得到一种“去掉 一个最高分,去掉一个最低分”的统计策略.
管理人员 高级技工
250 6 1 500 220 5 1 100
工人
200 10 2 000
学徒
100 1 100
合计
23 6 900
(1)指出这个问题中周工资的平均数. (2)这个问题中,工资的平均数能客观地反映该厂的 工资水平吗?为什么?
解 1 (1) x = (2 200+6×250+5×220+10×200+100)=300. 23
经理
5 2 500
管理员
3 2 000
职员
20 1 500
(2)若董事长、副董事长的工资分别从5 500元、5 000元提升到 30 000元、20 000元,那么公司职工新的平均数、中位数和众 数又是什么?
解:(2)若董事长、副董事长的工资提升后,职工月工资的平 均数为
30 000+20 000+3 500×2+3 000+2 500×5+2 000×3+1 500×20 x= 33
69 000 = ≈2 091(元). 33
把表格中的数据看作从大到小的顺序排列,最中间的数为 1500,所以中位数是1 500元; 在表格数据中1500出现20次,出现次数最多,所以众数是 1 500元.
相关文档
最新文档