222用样本的数字特征估计总体的数字特征2
2.2.2用样本的数据特征估计总体的数字特征
x i − x ( i = 1, 2 , · · · , n)
S3算出 中 x i − x ( i = 1, 2 , · · · , n) 的平方; 算出S2中 的平方; 算出 S4算出 中n个平方数的平均数,即为样本方差; 算出S3中 个平方数的平均数 即为样本方差; 个平方数的平均数, 算出 S5算出 中平均数的算术平方根,即为样本标准差 算出S4中平均数的算术平方根 即为样本标准差. 算出 中平均数的算术平方根,
2
样本标准差
( x1 − x ) 2 + ( x 2 − x ) 2 + … + ( x n − x ) 2 s= n
计算样本数据x 计算样本数据 1,x2,···,xn的标准差的算法
S1算出样本数据的平均数 算出样本数据的平均数
x ;
S2算出每个样本数据与平均数的差: 算出每个样本数据与平均数的差: 算出每个样本数据与平均数的差
S5
s =
4 = 2
8 8 8 8 8 8
-3 -1 -1 0 2 3
9 1 1 0 4 9
所以这组数据的标准差为2 所以这组数据的标准差为
从甲、 例 从甲、乙两名学生中选拔一人参加射击比 对他们的射击水平进行了测试, 赛,对他们的射击水平进行了测试,两人在 相同条件下个射击10次 命中的环数如下: 相同条件下个射击 次,命中的环数如下: 甲 7 8 6 8 6 5 9 10 7 4 乙 95787686 77
计算数据5,7,7,8,10,11的标准差 的标准差. 例2计算数据 计算数据 的标准差
5 + 7 + 7 + 8 + 10 + 11 S1 x = =8 6 9 + 1+ 1+ 0 + 4 + 9 =4 S4 s = 6
2.2.2用样本的数字特征估计总体的数字特征(2)
| x1 x |
| x2 x | n
| xn
x|
含有绝对值,运算不方便
思考4:反映样本数据的分散程度的大小,最常用的统计 量是标准差,一般用s表示.假设样本数据x1,x2,…,xn 的平均数为 x ,则标准差的计算公式是:
s
(x 1 x )
2
(x 2 x ) n
2
(x n x )
2
那么标准差的取值范围是什么?标准差为0的样本数据有 何特点? s≥0,标准差为0的样本数据都相等.
(甲)
频率
(乙)
0.4 0.3 0.2 0.1 4 5 6 7 8 9 10 环数 O
4 5 6 7 8 9 10 环数
甲的成绩比较分散,极差较大,
乙的成绩相对集中,比较稳定.
思考3:对于样本数据x1,x2,…,xn,设想通过各数据到 其平均数的平均距离来反映样本数据的分散程度,那么这 个平均距离如何计算?
2.2.2
用样本的数字特征估计
总体的数字特征(2)
1.理解样本数据方差、标准差的意义,会计算方差、
标准差;
2.会用样本的基本数字特征(平均数、标准差)估计
总体的基本数字特征;
3.体会用样本估计总体的思想.
复习回顾
知识点一 众数
新知探究 点点落实
定义 在一组数据中,出现次数最多的数据叫做这组数据的众数. 特点 (1)众数是这组数据中出现次数最多的数; (2)众数可以有一个或多 个;(3) 众数大致的值就是样本数据的频率分布直方图中最高矩形的中点 的横坐标. (4) 用众数代表一组数据,可靠性较差,不过,众数不受极端数 据的影响,并且求法简便 .在一组数据中,如果个别数据有很大的变动, 而某一数据出现次数又较多时,选择众数表示这组数据的“集中趋势”就 比较适合.
2.2.2用样本的数字特征估计总体的数字特征
.
所以这组数据的标准差为2.3 .
4、在数据统计中,能反映一组数据变化 范围大小的指标是 A.极差 B.方差 C.标准差 (A ) D.以上都不对
5.已知一个样本1, 3, 2, 5,x,若它的平均 数是3,则这个样本的标准差是 ______ . 2 6.若样本x1 , x 2 ,,x n的方差为0,则表示 ( A.x 0
这表明乙的成绩比甲的成绩稳定。
总结:
标准差S越大,样本数据的离散程度越大,波动越 大,越不稳定
方差:
标准差的平方
1 2 2 2 s [( x1 x ) ( x2 x ) ( xn x ) ] n
2
总结:
通常用样本的平均数和标准差去估计总体的 平均数与标准差
练1:”八.一”前夕,某中学举行国防知识竞赛:满分为 100分,80分以上为优秀,现将高一的两个班参赛学生的 成绩进行整理后分成五组绘制成如图所示的频率分布直 方图,已知图中从左到右的第一、第二、第三、第四、 第五小组的频率分别是0.3,0.4,0.15,0.1,0.05 求:(1)成绩的众数、 中位数; (2)平均成绩
样本数据的估计平均数就是将频率分布直方图中每个 小矩形的面积与小矩形底边中点的横坐标之积相加. 由此估计总体的平均数就是
0.5 0.4 0.3 0.2 0.1 O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 频率 组距
月均用水量/t
0.25, 0.75, 1.25,1.75,2.25,2.75,3.25, 3.75, 4.25.
0.04 0.03
(1)65,65 (2)67
0.015 0.010 0.005
2.2.2用样本的数字特征估计总体的数字特征(二)
乙的环数极差=9-5=4.
环数
三、标准差
是,样本数据x1, x2, xn到x的“平均距离”是
S x1 x x2 x xn x . n
由于上式含有绝对值,运算不太方便,因此, 通常改用如下公式来计算标准差.
1.方差计算公式
s2
1 n
( x1
x)2
( x2
x)2
( xn
x)2
.
2.标准差计算公式
频率
1.0
x5
0.8
0.6
s0
0.4
0.2
O 12345678
频率 (1)
频率 x
1.0
0.8 0.6
s
0.4
0.2
5 0.82
O 12345678
频率 (2)
1.0
x5
0.8
0.6
s 1.49
0.4
0.2
O 12345678
1.0
x5
0.8
0.6
s 2.83
0.4
0.2
O 12345678
(4)
25.33, 25.43, 25.43, 25.32, 25.47
25.31, 25.32, 25.32, 25.32, 25.48 从生产的零件内径的尺寸看,谁生产的质量较高?
例2 甲乙两人同时生产内径为25.40mm的一种零件.为了 对两人的生产质量进行评比,从他们生产的零件中各抽出 20件,量得其内径尺寸如下(单位:mm) 从生产的零件内径的尺寸看,谁生产的质量较高? 解:用计算器计算可得:
一些.
练习
1.数据5,7,7,8,10,11的标准差是( C ) A.8 B.4 C.2 D.1
222用样本的数字特征估计总体的数字特征2_图文
2.2.2 用样 本的 数字 特征 估计 总体 的数 字特 征
课前自主学案
课堂互动讲练
知能优化训练
学习目标 1. 通过随机抽样,掌握并会用样本的平均数及 标准差估计总体的平均数及标准差. 2 .通过用样本的数字特征估计总体的数字特 征,感知总体的差异. 3.通过数字反映样本数据某个方面的特征, 进而估计总体情况,体会这种统计思想,并培 养认识问题、分析问题、解决问题的能力,同 时也提高估算能力.
2.用样本标准差估计总体标准差 (1)标准差 考察样本数据的分散程度的大小,最常用的 统计量是标准差.标准差是样本数据到平均 数的一种平均距离,一般用s表示.
1 2 2 2 s= [ x - x + x - x +…+ x - x ]. 1 2 n n 标准差的平方 s2 叫做方差, 1 2 2 2 2 s =n[(x1- x ) +(x2- x ) +…+(xn- x ) ].
241~ 270 20 361~ 390 2
(1)试估计这种日光灯的平均使用寿命;
(2)若定期更换,可选择多长时间统一更换合适?
(2)将各组中的值对于此平均数求方差. 1 ×[1×(165 - 268)2 + 11×(195 - 268)2 + 18×(225 - 268)2 + 100 20×(255 - 268)2 + 25×(285 - 268)2 + 16×(315 - 268)2 + 7×(345-268)2+2×(375-268)2]=2128.60. 故标准差为 2128.60≈46(天). ∴标准差约为 46, 故可在 222 天到 314 天左右统一更换较合适.
样本方差、标准差的计算
例2
为了保护学生的视力,教室内的日光
222用样本的数字特征估计总体的数字特征(2)方差标准差讲解
性质归纳:kan b的平均数和方差:
已知a1,a2,,an的平均数是3,方差是2. 则a1 b,a2 b,,an b的平均数是3 b, 方差是2. ka1,ka2,,kan的平均数是3k,方差是2k 2.
标准差是样本平均数的一种平均距离,一般用s表示.
所谓“平均距离”,其含义可作如下理解:
假设样本数据是x1,x2,...xn ,x 表示这组数据的平均数,xi到 x
的距离是
-
xi - x (i = 1,2,… ,n).
, :
-
于是
样本数据x1,
x2,
x
到
n
x
的“平均距离”是
x1 x x2 x xn x
2.2.2用样本的数字特征估计总体 的数字特征(2) 方差、标准差
学习目标 1.明确标准差、方差等数字特征的意义,深刻 体会它们所反映的样本特征。 2.会用样本的数字特征估计总体的的数字特征, 初步体会样本的数字特征的随机性
复习回顾
一.什么是一组数据的众数、中位数及平均数?
众数:一组数据中出现次数最多的数据。
[解析] (1)甲组成绩的众数为 90 分,乙组成绩的众数为
70 分,从成绩的众数比较看,甲组成绩好些.
(2)s
2
甲
=
1 2+5+10+13+14+6
×[2×(50
-
80)2
+
5×(60
- 80)2 + 10×(70 - 80)2 + 13×(80 - 80)2 + 14×(90 - 80)2 +
A.众数 B.平均数
2.2.2用样本的数字特征估计总体的数字特征
件中各抽出20件, 量得其内径尺寸如下 (单位: mm):
甲 分25析.46: 评25定.3两2 人2所5.4生5产2零5.件39的质25量.36高低, 主要是看
是否符25合.34规定25尺.4寸2 . 2与5.规45定尺25寸.38偏离25很.42小, 则质量高;
与规定2255尺..3490寸的2255偏..44离32 大22,55..33则95 质22量55..低4401.
1.0
0.9
0.8 0.7
x5
①求平均数. 平均数相同.
(2) 4, 4, 4, 5, 5, 5, 6, 6, 6;
0.6 s0.00
0.5
②求标准差
(3) 3, 3, 4由, 4标, 5准, 6差, 6看, 出7, (71;)组均匀00程..34 度最好, (4)组最差.
(4) 2, 2, 2, 2, 5, 8, 8, 8, 8.
25.44 25.39
乙 检25测.40偏离25程.4度3 的2大5.4小4, 2就5.要48计算25其.48标准差.
25.47 25.49 25.49 25.36 25.34
25.33 25.43 25.43 25.32 25.47
25.31 25.32 25.32 25.32 25.48
从生产的零件内径尺寸看, 谁生产的质量较高?
上例中两运动员射击成绩的条形图如图:
频率
频率
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
4 5 6 7 8 9 10 环数
(甲)
4 5 6 7 8 9 10 环数
(乙)
频率
例1. 画出下列四组样本数据 的条形图, 说明它们的异同点. (1) 5, 5, 5, 5, 5, 5, 5, 5, 5;
222用样本的数字特征估计总体的数字特征
标准差
标准差是样本数据到平均数的一种平均距 离.它用来描述样本数据的离散程度.在实际应 用中本数据到平均数的一种平均距离.它 用来描述样本数据的离散程度.在实际应用中,标准 差常被理解为稳定性.
规律:标准差越大,
则a越大,数据的 离散程度越大;反
问题4
根据下列四组样本数据的条形图,说明他们的异同点,并指出标准 差的统计意义
(1)
(2)
(3)
(4)
小结
1.用样本的数字特征估计总体的数字特征分两类: a.用样本平均数估计总体平均数。 b.用样本标准差估计总体标准差。样本容量越大, 估计就越精确。
2.平均数对数据有“取齐”的作用,代表一组数据 的平均水平。 3.标准差描述一组数据围绕平均数波动的大小,反 映了一组数据变化的幅度。
数学与生活
• 那些令人忧伤的平均数
平均数
与每一个数据有关,更 受少数极端值的影
能反映全体的信息.
响较大,使其在估
计总体时的可靠性
降低.
问题2
在一次射击比赛中,甲、乙两名运动员各射击10 次,命中环数如下﹕
甲运动员﹕7,8,6,8,6,5,8,10,7,4; 乙运动员﹕9,5,7,8,7,6,8,6,7,7.
如果你是教练,你应当对这次射击情况作出评价? 如果这是一次选拔考核,你应当如何作出选择?
之,数据的离散程
度越小.
问题3
众数:最高矩形的中点 2.25
频率
中位数:左右两边直方
组距
图的面积相等.
2.02
0.5
平均数:频率分布直方
0.44
图中每个小矩形的面
0.3 0.28 0.16
积乘以小矩形底边中
点的横坐标之和. 2.02
山东省高中数学《2.2.2 用样本的数字特征估计总体的数字特征》教案2 新人教A版必修3
第2课时标准差导入新课思路1平均数为我们提供了样本数据的重要信息,但是,有时平均数也会使我们作出对总体的片面判断.某地区的统计显示,该地区的中学生的平均身高为176 cm,给我们的印象是该地区的中学生生长发育好,身高较高.但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态.所以我们学习从另外的角度来考察样本数据的统计量——标准差.(教师板书课题)思路2在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员:7,8,7,9,5,4,9,10,7,4;乙运动员:9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?我们知道,x甲=7,x乙=7.两个人射击的平均成绩是一样的.那么,是否两个人就没有水平差距呢?从上图直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据——标准差.推进新课新知探究提出问题(1)如何通过频率分布直方图估计数字特征(中位数、众数、平均数)?(2)有甲、乙两种钢筋,现从中各抽取一个标本(如下表)检查它们的抗拉强度(单位:kg/mm2),通过计算发现,两个样本的平均数均为125.甲110 121312512125135125135125乙115 112513115125125145125145哪种钢筋的质量较好?(3)某种子公司为了在当地推行两种新水稻品种,对甲、乙两种水稻进行了连续7年的种植对比实验,年亩产量分别如下:(千克)甲:600, 880, 880, 620, 960, 570, 900(平均773)乙:800, 860, 850, 750, 750, 800, 700(平均787)请你用所学统计学的知识,说明选择哪种品种推广更好?(4)全面建设小康社会是我们党和政府的工作重心,某市按当地物价水平计算,人均年收入达到1.5万元的家庭即达到小康生活水平.民政局对该市100户家庭进行调查统计,它们的人均收入达到了1.6万元,民政局即宣布该市民生活水平已达到小康水平,你认为这样的结论是否符合实际?(5)如何考查样本数据的分散程度的大小呢?把数据在坐标系中刻画出来,是否能直观地判断数据的离散程度?讨论结果:(1)利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点) 估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. (2)由上图可以看出,乙样本的最小值100低于甲样本的最小值110,乙样本的最大值145高于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定.我们把一组数据的最大值与最小值的差称为极差(range ).由上图可以看出,乙的极差较大,数据点较分散;甲的极差小,数据点较集中,这说明甲比乙稳定.运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论. (3)选择的依据应该是,产量高且稳产的品种,所以选择乙更为合理.(4)不符合实际.样本太小,没有代表性.若样本里有个别高收入者与多数低收入者差别太大.在统计学里,对统计数据的分析,需要结合实际,侧重于考察总体的相关数据特征.比如,市民平均收入问题,都是考察数据的分散程度.(5)把问题(3)中的数据在坐标系中刻画出来.我们可以很直观地知道,乙组数据比甲组数据更集中在平均数的附近,即乙的分散程度小, 如何用数字去刻画这种分散程度呢? 考察样本数据的分散程度的大小,最常用的统计量是方差和标准差.标准差:考察样本数据的分散程度的大小,最常用的统计量是标准差(standard deviation).标准差是样本数据到平均数的一种平均距离,一般用s 表示. 所谓“平均距离”,其含义可作如下理解:假设样本数据是x 1,x 2,…,x n ,x 表示这组数据的平均数.x i 到x 的距离是|x i -x |(i=1,2,…,n).于是,样本数据x 1,x 2,…,x n 到x 的“平均距离”是S=nx x x x x x n ||||||21-++-+- .由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差: s=])()()[(122221x x x x x x nn -++-+- .意义:标准差用来表示稳定性,标准差越大,数据的离散程度就越大,也就越不稳定.标准差越小,数据的离散程度就越小,也就越稳定.从标准差的定义可以看出,标准差s≥0,当s=0时,意味着所有的样本数据都等于样本平均数.标准差还可以用于对样本数据的另外一种解释.例如,在关于居民月均用水量的例子中,平均数x =1.973,标准差s=0.868,所以x +s=2.841,x +2s=3.709; x -s=1.105,x -2s=0.237.这100个数据中,在区间[x -2s,x +2s ]=[0.237,3.709]外的只有4个,也就是说,[x -2s, x +2s ]几乎包含了所有样本数据.从数学的角度考虑,人们有时用标准差的平方s 2——方差来代替标准差,作为测量样本数据分散程度的工具: s 2=n1[(x 1-x )2+(x 2-x )2+…+(x n -x )2].显然,在刻画样本数据的离散程度上,方差与标准差是一样的.但在解决实际问题时,一般多采用标准差.需要指出的是,现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.两者都是描述一组数据围绕平均数波动的大小,实际应用中比较广泛的是标准差.如导入中的运动员成绩的标准差的计算器计算.用计算器计算运动员甲的成绩的标准差的过程如下:即s 甲=2.用类似的方法,可得s 乙≈1.095.由s 甲>s 乙可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定. 应用示例思路1例1 画出下列四组样本数据的条形图,说明它们的异同点. (1)5,5,5,5,5,5,5,5,5; (2)4,4,4,5,5,5,6,6,6; (3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8. 分析:先画出数据的条形图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差.解:四组样本数据的条形图如下:四组数据的平均数都是5.0,标准差分别是:0.00,0.82,1.49,2.83. 它们有相同的平均数,但它们有不同的标准差,说明数据的分散程度是不一样的.例2 甲、乙两人同时生产内径为25.40 mm 的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm): 甲25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.39 乙25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 25.36 25.3425.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?分析:每一个工人生产的所有零件的内径尺寸组成一个总体.由于零件的生产标准已经给出(内径25.40 mm),生产质量可以从总体的平均数与标准差两个角度来衡量.总体的平均数与内径标准尺寸25.40 mm 的差异大时质量低,差异小时质量高;当总体的平均数与标准尺寸很接近时,总体的标准差小的时候质量高,标准差大的时候质量低.这样,比较两人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可.但是,这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本的平均数、标准差,以此作为两个总体之间差异的估计值. 解:用计算器计算可得甲x ≈25.401,乙x ≈25.406;s 甲≈0.037,s 乙≈0.068.从样本平均数看,甲生产的零件内径比乙的更接近内径标准(25.40 mm),但是差异很小;从样本标准差看,由于s 甲<s 乙,因此甲生产的零件内径比乙的稳定程度高得多.于是,可以作出判断,甲生产的零件的质量比乙的高一些.点评:从上述例子我们可以看到,对一名工人生产的零件内径(总体)的质量判断,与所抽取的零件内径(样本数据)直接相关.显然,我们可以从这名工人生产的零件中获取许多样本.这样,尽管总体是同一个,但由于样本不同,相应的样本频率分布与平均数、标准差等都会发生改变,这就会影响到我们对总体情况的估计.如果样本的代表性差,那么对总体所作出的估计就会产生偏差;样本没有代表性时,对总体作出错误估计的可能性就非常大.这也正是我们在前面讲随机抽样时反复强调样本代表性的理由.在实际操作中,为了减少错误的发生,条件许可时,通常采取适当增加样本容量的方法.当然,关键还是要改进抽样方法,提高样本的代表性. 变式训练某地区全体九年级的3 000名学生参加了一次科学测试,为了估计学生的成绩,从不同学校的不同程度的学生中抽取了100名学生的成绩如下:100分12人,90分30人,80分18人,70分24人,60分12人,50分4人.请根据以上数据估计该地区3 000名学生的平均分、合格率(60或60分以上均属合格). 解:运用计算器计算得:100450126024701880309012100⨯+⨯+⨯+⨯+⨯+⨯=79.40,(12+30+18+24+12)÷100=96%,所以样本的平均分是79.40分,合格率是96%,由此来估计总体3 000名学生的平均分是79.40分,合格率是96%.思路2例1 甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm 2),试根据这组数据估计哪一种水稻品种的产量比较稳定.品种 第1年 第2年 第3年 第4年 第5年 甲 9.8 9.9 10.1 10 10.2 乙9.410.310.89.79.8解:甲品种的样本平均数为10,样本方差为 [(9.8-10)2 +(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02. 乙品种的样本平均数也为10,样本方差为 [(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.24. 因为0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.例2 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差.天数151—180 181—210 211—240 241—270 271—300 301—330 331—360 361—390灯泡数1111820251672分析:用每一区间内的组中值作为相应日光灯的使用寿命,再求平均寿命. 解:各组中值分别为165,195,225,255,285,315,345,375,由此算得平均数约为165×1%+195 ×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天). 这些组中值的方差为1001×[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+25×(285-268)2+16×(315-268)2+7×(345-268)2+2×(375-268)2]=2 128.60(天2). 故所求的标准差约6.2128≈46(天).答:估计这种日光灯的平均使用寿命约为268天,标准差约为46天. 知能训练 (1)在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为____________.(2)若给定一组数据x 1,x 2,…,x n ,方差为s 2,则ax 1,ax 2,…,ax n 的方差是____________. (3)在相同条件下对自行车运动员甲、乙两人进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:甲 27 38 30 37 35 31 乙 33 29 38 34 28 36试判断选谁参加某项重大比赛更合适? 答案:(1)9.5,0.016 (2)a 2s 2(3)甲x =33,乙x =33,33734722=>=乙甲s s ,乙的成绩比甲稳定,应选乙参加比赛更合适. 拓展提升某养鱼专业户在一个养鱼池放入一批鱼苗,一年以后准备出售,为了在出售以前估计卖掉鱼后有多少收入,这个专业户已经了解到市场的销售价是每千克15元,请问,这个专业户还应该了解什么?怎样去了解?请你为他设计一个方案.解:这个专业户应了解鱼的总重量,可以先捕出一些鱼(设有x 条),作上标记后放回鱼塘,过一段时间再捕出一些鱼(设有a 条),观察其中带有标记的鱼的条数,作为一个样本来估计总体,则鱼塘中鱼的总条数鱼的条数鱼塘中所有带有标记的条鱼中带有标记的条数)(x aa =这样就可以求得总条数,同时把第二次捕出的鱼的平均重量求出来,就可以估计鱼塘中的平均重量,进而估计全部鱼的重量,最后估计出收入. 课堂小结1.用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数,平均数对数据有“取齐”的作用,代表一组数据的平均水平.用样本标准差估计总体标准差.样本容量越大,估计就越精确,标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度. 2.用样本估计总体的两个手段(用样本的频率分布估计总体的分布;用样本的数字特征估计总体的数字特征),需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本容量越大,估计的结果也就越精确. 作业习题2.2A 组4、5、6、7,B 组1、2.设计感想统计学科,最大的特点就是与现实生活的密切联系,也是新教材的亮点.仅仅想借助“死记硬背一些概念及公式,简单模仿课本例题”来学习,是绝对不行的.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差,其原因在于样本的随机性.这种偏差是不可避免的.虽然我们从样本数据得到的分布、均值和标准差并不是总体的真正分布、均值和标准差,而只是总体的一个估计,但这种估计是合理的,特别是当样本的容量很大时,它们确实反映了总体的信息.教师建议:亲身经历“提出问题,收集数据,分析数据,并作出合理决策”过程,在此过程中不仅可以加深对概念等知识的深刻理解,更重要的是发展了思维,培养了分析及解决问题能力,同时在情感、意志等领域也得到了协调发展,这才是学校学习的科学而全面的目标,习题设置有层次,尽量源于教材,又高于教材,这也是高考命题原则.。
2.2.2用样本的数字特征估计总体的数字特征 (2)
0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)
可将众数看作直方图中面积最大长方形的“中心”
频率 组距
如何在频率分布直方图中估计中位数
0.6
前四个小矩形的 面积和=0.49
s2
1 n [(x1
x )2
( x2
x )2
(xn x )2 ]
称s2为这个样本的方差,它的算术平方根
s
1 n
[( x1
x
)2
(
x2
x
)2
(xn x )2 ]
称为这个样本的标准差,分别称为样本方差、样本标准差
样本中各数据与样本平均数的差的平方 和的平均数叫做样本方差;样本方差的 算术平方根叫做样本标准差。样本方差 和样本标准差都是衡量一个样本波动大 小的量,样本方差或样本标准差越大,
试问二人谁发挥的水平较稳定?
分析:甲的平均成绩是9环.乙的平均成绩也是9环.
情境二:
某农场种植了甲、乙两种玉米苗,从中各抽取
了10株,分别测得它们的株高如下:(单位cm)
甲: 31 32 35 37 33 30 32 31 30 29
乙: 53 16 54 13 66 16 13 11 16 62
问题1:众数、中位数、平均数这三个数 一般都会来自于同一个总体或样本,它们 能表明总体或样本的什么性质?
众数:反映的往往是局部较集中的数据信息 中位数:是位置型数,反映处于中间部位的
数据信息
平均数:反映所有数据的平均水平
2.2.2 用样本的数字特征估计总体的数字特征(2)
测量样本数据分散程度的工具 :
− − − 1 2 2 s = ( x1 − x) + ( x2 − x) + ⋯ + ( xn − x) 2 . n 2
甲乙两人同时生产内径为25.40mm的一种零件 的一种零件. 例2 甲乙两人同时生产内径为 的一种零件 为了对两人的生产质量进行评比,从他们生产的零件 为了对两人的生产质量进行评比 从他们生产的零件 中各抽出20件 量得其内径尺寸如下 单位:mm) 量得其内径尺寸如下(单位 中各抽出 件,量得其内径尺寸如下 单位 甲 25.46, 25.32, 25.45, 25.39, 25.36 25.34, 25.42, 25.45, 25.38, 25.42 25.39, 25.43, 25.39, 25.40, 25.44 25.40, 25.42, 25.35, 25.41, 25.39 乙 25.40, 25.43, 25.44, 25.48, 25.48 25.47, 25.49, 25.49, 25.36, 25.34 25.33, 25.43, 25.43, 25.32, 25.47 25.31, 25.32, 25.32, 25.32, 25.48
x甲 = 25.4005, x乙 = 25,4008; s甲 = 0.038, s乙 = 0.074
−
−
从样本平均数看,甲生产的零件内径比乙生产的更接 从样本平均数看 甲生产的零件内径比乙生产的更接 近内径标准(25.40mm),但是差异很小 从样本标准差看 但是差异很小;从样本标准差看 近内径标准 但是差异很小 从样本标准差看, 由于
−
−
x =5
S=0.82
−
x=5
S=1.49
1 2 3 45 (2)
2.2.2用样本的数字特征估计总体的数字特征2
a_x___b_,标准差为a_s_ ,方差为_a_2_s_2.
湖南省长沙市一中卫星远程学校
课堂小结
1. 用样本的众数、中位数、平均数和标准差等 统计数据,估计总体相应的统计数据.
课堂小结 1. 用样本的众数、中位数、平均数和标准差等
湖南省长沙市一中卫星远程学校
二、讲授新课
例:有两位运动员在一次射击测试中各射靶 10 次,每
次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
如果你是教练,你应当如何对这次射击情况作出评
价?如果这是一次选拔性考核,你应当如何作出选择?
x甲=x乙 7
s甲2 s乙2,所以乙比甲的射击成绩稳定。
湖南省长沙市一中卫星远程学校
二、讲授新课
平均数、标准差和方差的运算性质:
如果数据 x1, x2 , x3 xn 的平均数为 x , 标准差为 s,方差为s,2 则 (1)新数据 x1 b, x2 b,xn b 的平均数为_x___b_. 标准差为_s_,方差为_s_2. (2)新数据 ax1, ax2,axn 的平均数为_a_x___. 标准差为_a_s ,方差为_a_2_s_2.
统计数据,估计总体相应的统计数据.
2. 平均数对数据有“取齐”的作用,代表一 组数据的平均水平.
课堂小结
1. 用样本的众数、中位数、平均数和标准差等 统计数据,估计总体相应的统计数据.
2. 平均数对数据有“取齐”的作用,代表一 组数据的平均水平.
3. 标准差描述一组数据围绕平均数波动的幅 度.在实际应用中,我们常综合样本的多个 统计数据,对总体进行估计,为解决问题 作出决策.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课堂练习
1.如图是某校举行的元旦诗歌朗诵比赛中,
七位评委为某位选手打出分数的茎叶统计图,
去掉一个最高分和一个最低分,所剩数据
的平均数和方差分别为( )
(A)84,4.84 (B)84,1.6
(C)85,1.6
(D)85,0.4
【解析】选C.得分是79,84,84,86,84,87,93,最高分是93,最低分 是79,则去掉一个最高分和一个最低分后该选手得分是84,84, 86,84,87,计算得平均数是85,方差是1.6.
诱探究4
1.如何用数字去刻画这种分散程度呢?
答:考察样本数据的分散程度的大小,最常用的统计量 是标准差.标准差是样本数据到平均数的一种平均距离,
2.所谓“平均距离”,其含义如何理解?
答 假设样本数据是 x1,x2,…,xn, x 表示这组数据的平 均数.xi 到 x 的距离是|xi- x |(i=1,2,…,n).于是,样本数 据是 x1,x2,…,xn 到 x 的“平均距离”是
222用样本的数字特征估计总体的数字特征2
温故知新
(一) 众数、中位数、平均数 1. 众数、中位数、平均数的概念 2.求众数、中位数、平均数的方法: (1)用样本数据计算; (2)用频率分布直方图估算。 ①众数:最高矩形下端中点的横坐标
②中位数:直方图面积平分线与横轴交点的横坐标.
③平均数:每个小矩形的面积与小矩形底边中点的横坐标 的乘积之和.
巩固练习
某公司的33名职工的月工资(单位:元)如下表:
职业 人数 工资
董事长 1
5 500
副董事长 1
5 000
董事 2
3 500
总经理 1
3 000
经理 5
2 500
管理员 3
2 000
职员 20
1 500
(1)求该公司职工月工资的平均数、中位数、众数. (2)若董事长、副董事长的工资分别从5 500元、5 000元提 升到30 000元、20 000元,那么公司职工新的平均数、中位 数和众数又是什么?
3.一组数据中,每一个数都减去80,得到一组新数据,若求得新数据
的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别为( )
(A)81.2,4.4 (B)78.8,4.4 (C)81.2,84.4 (D)78.8,75.6
4.从甲、乙两种玉米中各抽10株,分别测得它们的株高如下: 甲:25、41、40、37、22、14、19、39、21、42; 乙:27、16、44、27、44、16、40、40、16、40; (1)哪种玉米的苗长得高? (2)哪种玉米的苗长得齐? 解 (1) x 甲=110(25+41+40+37+22+14+19+39+21+42)=30,
1.标准差:s1 n[(x 1x)2 (x2x)2 (xnx)2]
2.方差: s 2 1 n [(x 1 x )2 (x 2 x )2 (x n x )2 ]
注:在刻画样本数据分散程度上,方差s2与标准差 s是一样的。但是在解决实际问题时,一般多采用 标准差s 。
对标准差的理解:
(1)标准差是用来描述样本数据的离散程度的,它 反映了各个样本数据聚集于样本平均数周围的程度。 标准差越小,表明各个样本数据在样本平均数的周 围越集中;反之,标准差越大,表明各个样本数据 在样本平均数的两边越分散。
(2)在实际应用中,标准差常被理解为稳定性。
(3) 标准差是非负的。标准差为0意味着所有的 样本数据都相等的特性,且与样本平均数也相等。
因此,在例子中的解答过程可表述为: 解:由数据可得:
x甲 11( 0 787 4) 7, x乙 1 1 ( 0 957 7) 7
x甲 x乙
∴从平均成绩看甲、乙二人的成绩无明显差异。
x 乙=110(27+16+44+27+44+16+40+40+16+40)=31,
x甲 x乙 ∴乙种玉米的苗长得高.
(2)由方差公式得:
s2甲=110[(25-30)2+(41-30)2+…+(42-30)2]=104.2,
同理s乙2 =128.8,
∴s2甲<s乙2 .
∴甲种玉米的苗长得齐. 答:乙种玉米苗长得高,甲种玉米苗长得齐.
2.某工厂人员及工资构成如下:
人员 经理 管理人员 高级技工 工人 学徒 合计
周工 资
2 200
250
220
200 100
人数 1 合计 2 200
6 1 500
5
10
1
23
1 100 2 000 100 6 900
(1)指出这个问题中周工资的平均数. (2)这个问题中,工资的平均数能客观地反映该厂的 工资水平吗?为什么?
课后作业
1.甲、乙两种水稻试验品种连续 5 年的平均单位面积产量如 下(单位:t/hm2),试根据这组数据估计哪一种水稻品种的产 量比较稳定.
品种 甲 乙
第1年 9.8 9.4
第2年 9.9 10.3
第3年 10.1 10.8
第4年 10 9.7
第5年 10.2 9.8
解:甲品种的样本平均数为10,样本方差为
人数 工资
1 5 500
1 5 000
2 3 500
1 3 000
5 2 500
3 2 000
20 1 500
(2)若董事长、副董事长的工资分别从5 500元、5 000元提升到 30 000元、20 000元,那么公司职工新的平均数、中位数和众 数又是什么?
解:(2)若董事长、副董事长的工资提升后,职工月工资的平 均数为
x
=30
000+20
000+3
500×2+3
000+2 33
500×5+2
000×3+1
500×20
=10833500≈3 288(元).
中位数是1 500元,众数是1 500元.
诱思探究3
对于甲乙的射击成绩除了画出频率分布条形图 比较外,还有没有其它方法来说明两组数据的分散 程度?
答:还经常用甲乙的极差与平均数一起比较说明 数据的分散程度.甲的环数极差=10-4=6,乙的环 数极差=9-5=4.它们在一定程度上表明了样本数 据的分散程度,与平均数一起,可以给我们许多 关于样本数据的信息.显然,极差对极端值非常 敏感,注意到这一点,我们可以得到一种“去掉 一个最高分,去掉一个最低分”的统计策略.
[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5
=0.02. 乙品种的样本平均数也为10,样本方差为
[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷
5=0.244. ∵0.244>0.02 ∴由这组数据可以认为甲种水稻的产量 比较稳定.
s 甲 1 17 0 7 2 8 7 2 4 7 2 2 s乙 1 19 0 7 2 5 7 2 7 7 2 1 .098
s甲s乙 ∴乙比甲的射击成绩稳定
∴如果我是教练员,我认为乙的成绩更好,应派乙参加比赛。
小结:
1.对同一个总体,可以抽取不同的样本,相应的平 均数与标准差都会发生改变.如果样本的代表性差, 则对总体所作的估计就会产生偏差;如果样本没有 代表性,则对总体作出错误估计的可能性就非常大, 由此可见抽样方法的重要性.
(3)你认为哪个统计量更能反映这个公司员工的工资水平?
职业 董事长 副董事长 董事 总经理 经理 管理员 职员
人数
1
1
2
1
5
3
20
工资 5 500
5 000 3 500 3 000 2 500 2 000 1 500
(1)求该公司职工月工资的平均数、中位数、众数.
解 :(1)公司职工月工资的平均数为
解
(1)
x
1 =23(2
200+6×250+5×220+10×200+100)=300.
(2)因平均数为300,由表格中所列出的数据可见,只有经理 在平均数以上,其余的人都在平均数以下,故用平均数不能 客观真实地反映该工厂的工资水平.
谢谢
x
=5
500+5
000+3
500×2+3
000+2 33
500×5+2
000×3+1
500×20
=6930300≈2 091(元).
把表格中的数据看作从大到小的顺序排列,最中间的数为
1500,所以中位数是1 500元; 在表格数据中1500出现20次,出现次数最多,所以众数是 1 500元.
职业 董事长 副董事长 董事 总经理 经理 管理员 职员
S=|x1-
x
|+|x2-
x n
|+…+|xn-
x
| .由于上式含有绝对值,
运算不太方便,因此,通常改用如下公式来计算标准差:
s= n1[x1- x 2+x2- x 2+…+xn- x 2].
在统计中,我们通常用标准差来考察样本数 据的离散程度,标准差是样本数据到平均数的 一种平均距离。 (二)标准差、方差: