江苏省宿迁中学苏教版高中数学必修三课件:2.2总体特征数的估计—方差与标准差
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总体特征数的估计(2)
复习回顾
1.算术平均数的概念
一般地,如果有n个数 x1, x2,..., xn , 那么
x
x1 x2 ... xn n
1 n
n i 1
xi叫做这n个数的
平均数,x读作“x平均”
2.平均数的计算方法 ①定义法
当所给的数据x1, x2,..., xn比较小,又比较分散时, 一般选用定义:
1
1n
x n (x1 x2 ... xn ) n i1 xi
②已知频数求平均数
在给定的一组数据中,已知数据出现的频数,或
有些数据重复出现,则选用频数平均数公式:
1
1k
x n (x1 f1 x2 f2 ... xk fk ) n i1 xi fi
(其中f1 f2 ... fk n)来计算平均数 ③已知频率求平均数
分析 用每一区间内的组中值作为相应日光灯的 使用寿命,再求平均寿命.
答:估计这种日光灯的平均使用寿命约为268天,标准 差约为46天.
拓展延伸: 已知数据x1,x2,…,xn的平均数为 x ,方差为s2.
(1)数据x1+a,x2+a,…,xn+a的平均数为___x___a,方差为__s_2__. (2)数据2x1,2x2,…,2xn的平均数为__2_x_ ,方差为__4_s_2_.
乙品种的样本平均数也为10,样本方差为 [(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2 +(9.8-10)2]÷5=0.24
因为0.24>0.02,所以,由这组数据可以认 为甲种水稻的产量比较稳定.
例2.为了保护学生的视力,教室内的日光灯在使 用一段时间后必须更换.已知某校使用的100只 日光灯在必须换掉前的使用天数如下,试估计这 种日光灯的平均使用寿命和标准差.
xn2
)
n
2
x
]
1 n
( x12
x22
...
xn2
)
2
x
1 n
n i 1
xi 2
2
x
设一组样本数据 x1, x2 , x3,...xn ,其平均数
为
x,则称
s2
1 n
n i1
( xi
2
x) 为这个样本的方差,
其算术平方根 s
s2
1 n
n i 1
( xi
2.方差与标准差
(1)方差的定义 在一组数据 x1, x2 ,..., xn中,各数据与它们平 均数 x 的差的平方和的平均数,叫做这组数 据的方差.
通常用“s2”表示方差:
s2 (x1 x)2 (x2 x)2 ... (xn x)2 n
1 n
n i 1
( xi
x'
1 n
( x1'
x2'
...
xn' )
1 n
n i 1
xi '
是新数据的平均数.
的平均值,a2是 x41, x2, , x100 的平均值,则 ( )
A : x 2a1 3a2 5
C : x a2 a1
B : x 3a1 2a2 5
D : x a2 a1 2
问题背景
有甲、乙两种钢筋,现从中各抽取一个样本检查它 们的抗拉强度(单位:kg/mm2),哪种钢筋的质量较好?
当所给数据x1, x2,..., xk出现的频率分别为 p1, p2,..., pk ,一般选用频率平均数公式:
k
x x1 p1 x2 p2 ... xk pk xi pi计算平均数 i 1
3.平均数的意义
平均数反映了一组数据的集中趋势,它是一组数 据的“重心”,是度量一组数据波动大小的基准.
7.82, 8.05, 8.03, 7.90, 7.78 乙车间的为:7.95, 8.02, 8.11, 8.03, 8.20,
7.98, 8.01, 8.02, 7.95, 7.94 (1)计算样本的平均长度; (2)哪个两个车间生产的稳定性高?
(3)若允许这种零件有0.5﹪的离差,那么两个车间产品
4
8
15
20
使用寿命 [1000,1100) [1100,1200) [1200,1300) [1300,1400) [1400,1500]
只数
24
18
7
2
1
(1)制作频率分布表; (2)绘制频率分布直方图; (3)根据样本的频率分布,估计使用寿命不低于1000h的灯
泡约有多少只. (4)根据样本的频率分布,估计使用寿命低于850h的灯泡
的合格率约为多少?
8×(1 -0.5﹪ )=7.96 , 8×(1 +0.5﹪ )=8.04
2.为了了解灯泡(10000只)的使用寿命,从中抽取100只 进行测试,其使用寿命如下表:
使用寿命 [500,600) [600,700) [700,800) [800,900) [900,1000)
只数
1
4.平均数的性质
数据x1, x2 xn的平均数为x (1)数据x1 a, x2 a xn -a的平均数为
(2)数据kx1, kx2 kxn的平均数为 kx
x a
(3)数据kx1 b, kx2 b kxn +b的平均数为 kx b
1.如果一组数 x1, , xn 的平均数为2 则另一组数
(3)数据2x1-5,2x2-5,…,2xn-5的平均数为_2_x___5,方差为_4_s__2 _.
(4)数据kx1-b,kx2-b,…,kxn-b的平均数为__k_x b__ ,方差为
__k_2s2__,标准差为_____.
应用
1.从两个车间生产的长度为8mm的零件中各抽样检查10 个零件, 甲车间的为:8.11, 8.22, 7.89, 7.98, 8.01,
运用极差对两组数据进行比较,操作简单 方便,但如果两组数据的集中程度差异不大时, 就不容易得出结论.
还可以考虑每一抗拉强度与平均抗拉强度的
离差,离差越小,稳定性就越高.结合上节有关离差 的讨论,可用各次抗拉强度与平均抗拉强度的差的 平方和表示.由于两组数据的容量可能不同,因此 应将上述平方和除以数据的个数,我们把由此所得 的值称为这组数据的方差.
x)2
(2)方差的计算
①基本公式
s2
1 n
[(
x1
x)2
(x2
x)2
...
(xn
x)2 ]
1 n
n i1
(xi
x)2
②简化计算公式:
s2
1 n
[(x12
x22...xn2)
2(x1
x2
...
xn
)x
n
2
x
]
1 n
[( x12
x22
...
通过计算发现,两个样本的平均数均为125.
将甲、乙两个样本数据分别标在数轴上,如图所示.
点线图
可以看出,乙样本的最小值100低于甲样本的最小值 110,最大值145高于甲样本的最大值135,这说明乙 种钢筋没有甲种钢筋的抗拉强度稳定.
我们把一组数据的最大值与最小值的差称为 极差. 乙的极差较大,数据点较分散;甲的极差 小,数据点较集中,这说明甲比乙稳定.
x)2
为样本的
标准差.
方差可以刻画数据的稳定程度,标准差也可 以刻画数据的稳定程度. 两者单位不同,标准差 的单位与原数据的单位相同.
例1:甲、乙两种冬水稻试验品种连续5年 的平均单位面积产量如下(单位:t/hm2),试 根据这组数据估计哪一种水稻品种的产量 比较稳定.
解: 甲品种的样本平均数为10,样本方差为 [(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2 +(10.2-10)2]÷5=0.02
约有多少只.
作业:
上本作业 P69: 3,5 课时作业 P43-44
②新数据法
当所给的一组数据都在某一个常数a的上下波
动,一般选用简化公式: x x' a ,其中常数 a
通常取接近于这组数据的平均数的较“整”的
数x1.' x1 a, x2' x2 a,..., xn' xn a
3x1 2, , 3xn 2 的平均数为?
2. 如果一组数 x1, x2 , x3, x4 , x5 的平均数为 x
则另一组数 x1, x2 1, x3 2, x4 3, x5 4
的平均数为?
3. 如果 x 是 x1, x2, , x100 的平均值,a1 是x1, x2, , x40
复习回顾
1.算术平均数的概念
一般地,如果有n个数 x1, x2,..., xn , 那么
x
x1 x2 ... xn n
1 n
n i 1
xi叫做这n个数的
平均数,x读作“x平均”
2.平均数的计算方法 ①定义法
当所给的数据x1, x2,..., xn比较小,又比较分散时, 一般选用定义:
1
1n
x n (x1 x2 ... xn ) n i1 xi
②已知频数求平均数
在给定的一组数据中,已知数据出现的频数,或
有些数据重复出现,则选用频数平均数公式:
1
1k
x n (x1 f1 x2 f2 ... xk fk ) n i1 xi fi
(其中f1 f2 ... fk n)来计算平均数 ③已知频率求平均数
分析 用每一区间内的组中值作为相应日光灯的 使用寿命,再求平均寿命.
答:估计这种日光灯的平均使用寿命约为268天,标准 差约为46天.
拓展延伸: 已知数据x1,x2,…,xn的平均数为 x ,方差为s2.
(1)数据x1+a,x2+a,…,xn+a的平均数为___x___a,方差为__s_2__. (2)数据2x1,2x2,…,2xn的平均数为__2_x_ ,方差为__4_s_2_.
乙品种的样本平均数也为10,样本方差为 [(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2 +(9.8-10)2]÷5=0.24
因为0.24>0.02,所以,由这组数据可以认 为甲种水稻的产量比较稳定.
例2.为了保护学生的视力,教室内的日光灯在使 用一段时间后必须更换.已知某校使用的100只 日光灯在必须换掉前的使用天数如下,试估计这 种日光灯的平均使用寿命和标准差.
xn2
)
n
2
x
]
1 n
( x12
x22
...
xn2
)
2
x
1 n
n i 1
xi 2
2
x
设一组样本数据 x1, x2 , x3,...xn ,其平均数
为
x,则称
s2
1 n
n i1
( xi
2
x) 为这个样本的方差,
其算术平方根 s
s2
1 n
n i 1
( xi
2.方差与标准差
(1)方差的定义 在一组数据 x1, x2 ,..., xn中,各数据与它们平 均数 x 的差的平方和的平均数,叫做这组数 据的方差.
通常用“s2”表示方差:
s2 (x1 x)2 (x2 x)2 ... (xn x)2 n
1 n
n i 1
( xi
x'
1 n
( x1'
x2'
...
xn' )
1 n
n i 1
xi '
是新数据的平均数.
的平均值,a2是 x41, x2, , x100 的平均值,则 ( )
A : x 2a1 3a2 5
C : x a2 a1
B : x 3a1 2a2 5
D : x a2 a1 2
问题背景
有甲、乙两种钢筋,现从中各抽取一个样本检查它 们的抗拉强度(单位:kg/mm2),哪种钢筋的质量较好?
当所给数据x1, x2,..., xk出现的频率分别为 p1, p2,..., pk ,一般选用频率平均数公式:
k
x x1 p1 x2 p2 ... xk pk xi pi计算平均数 i 1
3.平均数的意义
平均数反映了一组数据的集中趋势,它是一组数 据的“重心”,是度量一组数据波动大小的基准.
7.82, 8.05, 8.03, 7.90, 7.78 乙车间的为:7.95, 8.02, 8.11, 8.03, 8.20,
7.98, 8.01, 8.02, 7.95, 7.94 (1)计算样本的平均长度; (2)哪个两个车间生产的稳定性高?
(3)若允许这种零件有0.5﹪的离差,那么两个车间产品
4
8
15
20
使用寿命 [1000,1100) [1100,1200) [1200,1300) [1300,1400) [1400,1500]
只数
24
18
7
2
1
(1)制作频率分布表; (2)绘制频率分布直方图; (3)根据样本的频率分布,估计使用寿命不低于1000h的灯
泡约有多少只. (4)根据样本的频率分布,估计使用寿命低于850h的灯泡
的合格率约为多少?
8×(1 -0.5﹪ )=7.96 , 8×(1 +0.5﹪ )=8.04
2.为了了解灯泡(10000只)的使用寿命,从中抽取100只 进行测试,其使用寿命如下表:
使用寿命 [500,600) [600,700) [700,800) [800,900) [900,1000)
只数
1
4.平均数的性质
数据x1, x2 xn的平均数为x (1)数据x1 a, x2 a xn -a的平均数为
(2)数据kx1, kx2 kxn的平均数为 kx
x a
(3)数据kx1 b, kx2 b kxn +b的平均数为 kx b
1.如果一组数 x1, , xn 的平均数为2 则另一组数
(3)数据2x1-5,2x2-5,…,2xn-5的平均数为_2_x___5,方差为_4_s__2 _.
(4)数据kx1-b,kx2-b,…,kxn-b的平均数为__k_x b__ ,方差为
__k_2s2__,标准差为_____.
应用
1.从两个车间生产的长度为8mm的零件中各抽样检查10 个零件, 甲车间的为:8.11, 8.22, 7.89, 7.98, 8.01,
运用极差对两组数据进行比较,操作简单 方便,但如果两组数据的集中程度差异不大时, 就不容易得出结论.
还可以考虑每一抗拉强度与平均抗拉强度的
离差,离差越小,稳定性就越高.结合上节有关离差 的讨论,可用各次抗拉强度与平均抗拉强度的差的 平方和表示.由于两组数据的容量可能不同,因此 应将上述平方和除以数据的个数,我们把由此所得 的值称为这组数据的方差.
x)2
(2)方差的计算
①基本公式
s2
1 n
[(
x1
x)2
(x2
x)2
...
(xn
x)2 ]
1 n
n i1
(xi
x)2
②简化计算公式:
s2
1 n
[(x12
x22...xn2)
2(x1
x2
...
xn
)x
n
2
x
]
1 n
[( x12
x22
...
通过计算发现,两个样本的平均数均为125.
将甲、乙两个样本数据分别标在数轴上,如图所示.
点线图
可以看出,乙样本的最小值100低于甲样本的最小值 110,最大值145高于甲样本的最大值135,这说明乙 种钢筋没有甲种钢筋的抗拉强度稳定.
我们把一组数据的最大值与最小值的差称为 极差. 乙的极差较大,数据点较分散;甲的极差 小,数据点较集中,这说明甲比乙稳定.
x)2
为样本的
标准差.
方差可以刻画数据的稳定程度,标准差也可 以刻画数据的稳定程度. 两者单位不同,标准差 的单位与原数据的单位相同.
例1:甲、乙两种冬水稻试验品种连续5年 的平均单位面积产量如下(单位:t/hm2),试 根据这组数据估计哪一种水稻品种的产量 比较稳定.
解: 甲品种的样本平均数为10,样本方差为 [(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2 +(10.2-10)2]÷5=0.02
约有多少只.
作业:
上本作业 P69: 3,5 课时作业 P43-44
②新数据法
当所给的一组数据都在某一个常数a的上下波
动,一般选用简化公式: x x' a ,其中常数 a
通常取接近于这组数据的平均数的较“整”的
数x1.' x1 a, x2' x2 a,..., xn' xn a
3x1 2, , 3xn 2 的平均数为?
2. 如果一组数 x1, x2 , x3, x4 , x5 的平均数为 x
则另一组数 x1, x2 1, x3 2, x4 3, x5 4
的平均数为?
3. 如果 x 是 x1, x2, , x100 的平均值,a1 是x1, x2, , x40