用样本的数字特征估计总体的数字特征(上课用)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
解:③∵平均数相同,命中9环 及9环以上的次数甲比乙少, ∴乙的成绩比甲好些.
④甲成绩在平均数上下波动;而乙处于上升势头,从第四次 以后就没有比甲少的情况发生,乙较有潜力.
29
2.2.2 用样本的数字特征估计 总体的数字特征
(一)众数、中位数、平均数
1
一 众数、中位数、平均数的概念
众数:在一组数据中,出现次数最多的数据叫 做这组数据的众数. 中位数:将一组数据按大小依次排列,把处在 最中间位置的一个数据(或最中间两个数据的 平均数)叫做这组数据的中位数.
平均数x: 一1n(组x1数据x2的算 术平x均n)数,即
9
如何在频率分布直方图中估计平均数
可将平均数看作整个直方图面积的“重心”
平均数的估计值等于频率分 布直方图中每个小矩形的面 积乘以小矩形底边中点的横
坐标之和 (即频率乘以组中值的和)。
10
1.(2013年福建高考改编题)某校从高一年级学生中随 机抽取部分学生,将他们的模块测试成绩分成6组: [40,50), [50,60), [60,70), [70,80),[80,90), [90,100]加以 统计,得到如图所示的频率分布直方图。据此估计,
25
26
甲、乙两人在相同条件下各射靶10次, 每次射靶的成绩情况如图所示:
(1)请填写表:
(2)请从下列四个不同的角度对这次测试结果进行分析: ①从平均数和方差相结合看(分析谁的成绩更稳定); ②从平均数和中位数相结合看(分析谁的成绩好些); ③从平均数和命中9环及9环以上的次数相结合看(分析谁的成 绩好些); ④从折线图上两人射击命中环数的走势看(分析谁更有潜力).
0.6
前四个小矩形的 面积和=0.49
0.5
后四个小矩形的 面积和=0.26
0.4
0.25
0.3
0.22
0.01/0.25=x/0.5
0.2
0.15
0.14 所以x=0.02
0.1
0.08
0.06
0.04
0
0.5
1
1.5
2
2.5
3
0.04 0.02
3.5
4
4.5
2.02
月均用水量7 /t
如何在频率分布直方图中估计平均数
该校模块测试的平均分约为 71 。
中位数多少 70 众数是多少 65
11
(二)
12
一.实例引入
情境一;
甲.乙两名射击队员,在进行的十次射击 中成绩分别是:
甲: 10; 9; 8; 10; 8; 8; 10; 10; 9.5; 7.5
乙: 9; 9; 8,5; 9; 9; 9.5; 9.5; 8.5; 8.5; 9.5 试问二人谁发挥的水平较稳定?
频率 组距
众数在样本数据的频率分布直方图中,
就是最高矩形的中点的横坐标2.25。
0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)
可将众数看作直方图中面积最大长方形的“中心6”
频率 组距
可将如中何位在数频看率作分整布个直直方方图图中面估积计的中“位中数心”
8
.
所以这组数据的方差为5.5 .
20
练习:若甲、乙两队比赛情况如下,下列说法哪些 说法是不正确的:
平均失球数
平均失球个数的标准差
甲
1. 5
1. 1
乙
2. 1
0. 4
1、平均来说,甲的技术比乙的技术好;
2、乙比甲技术更稳定;
3、甲队有时表现差,有时表现好;
4、乙队很少不失球。
全对
21
方差的运算性质:
8
=2.02
x 1 1 ( x 1 0 x 2 0 x 1 ) 0 1 1 0 ( x 1 0 x 0 4 ) ( x 5 x 1 ) 2 ( x 9 x 9 1 ) 0
140 x1 40 180 x5 10 2 120 x9 9 1 0 00
0 .00 4 2 0 .5 0 .00 .8 5 2 1 0 .04 2 2 4 .5=2.02
x甲 =32
x乙 =32
14
甲: 31 32 35 37 33 30 32 31 30 29 乙: 53 16 54 13 66 16 13 11 16 62
甲
29 32 37
乙
11
32
66
甲
37(最大值) 29(最小值)
8极
乙
66(最大值) 11(最小值)
55 差
15
极差:一组数据的最大值与最小值的差
如果数据 x1,x2,,xn 的平均数为 x ,
方差为 s 2 ,则
(1)新数据 x1b,x2b,,xnb的平均数为
x b ,方差仍为 s 2 .
(2)新数据 ax1,ax2,,axn的平均数为a x ,
方差为 a 2 s 2 . (3)新数据 a x 1 b ,a x 2 b ,,a x n b
(2)、1 ,2,3,3,3,5,5,8,8,9,9 众数是:3
2、求下列各组数据的中位数
(1)、1 ,2,3,3,3,4,6,8,8,8,9,9 中位数是:5
(2)1 ,2,3,3,3,4,8,8,8,9,9 中位数是:4 4
二、众数、中位数、平均数与频率 分布直方图的关系
5
如何在频率分布直方图中估计众数
❖ 样本方差的算术平方根叫做样本标准差。 ❖ 样本方差和样本标准差都是衡量一个样
本波动大小的量,样本方差或样本标准 差越大,样本数据的波动就越大。
19
例1.计算数据89,93,88,91,94,90,88,87的 方差和
解:x 9 0 1 ( 1 3 2 1 4 0 2 3 ) 9 0
则求数据 2a1,2a2的,2a方3 差
24
小结
1.用样本的数字特征估计总体的数字特征分两类: a.用样本平均数、众数、中位数估计总体平均数、 众数、中位数。 b.用样本标准差、方差估计总体标准差、方差。 样本容量越大,估计就越精确。
2.平均数对数据有“取齐”的作用,代表一组数据 的平均水平。 3.标准差描述一组数据围绕平均数波动的大小,反 映了一组数据变化的幅度。
27
(2)请从下列四个不同的角度对这次测试结果进行分析: ①从平均数和方差相结合看(分析谁的成绩更稳定); ②从平均数和中位数相结合看(分析谁的成绩好些);
解:(2)①∵平均数相同,S甲2 S乙2
∴甲的成绩比乙稳定. ②∵平均数相同,甲的中位数< 乙的中位数, ∴乙的成绩比甲好些.
28
③从平均数和命中9环及9环以上的次数相结合看(分析谁的成 绩好些); ④从折线图上两人射击命中环数的走势看(分析谁更有潜力).
的平均数为 a x b,方差为a 2 s 2 .
22
例2:甲、乙两种水稻试验品种连续5年的平均单位面积产量 如下(单位:t/hm2 ),试根据这组数据估计哪一种水稻品种 的产量比较稳定.
解:x 甲 1 ( 9 .8 9 .9 1.1 0 1 0 1.2 0 ) 10
5
s 甲 2 [9 .8 ( 1 ) 2 0 ( 9 .9 1 ) 2 0 ( 1 .1 0 1 ) 2 0 ( 1 1 0 ) 2 0 ( 1 .2 0 1 ) 2 ] 0 5 0 .02
分析:甲的平均成绩是9环.乙的平均成绩也是9环13.
情境二:
某农场种植了甲、乙两种玉米苗,从中各抽取
了10株,分别测得它们的株高如下:(单位cm)
甲: 31 32 35 37 33 30 32 31 30 29 乙: 53 16 54 13 66 16 13 11 16 62
问:哪哪种种玉玉米米苗苗长长得得高齐??
极差越大,数据越分散,越不稳定
极差越小,数据越集中,越稳定
在一定程度上表明了样本数据的分散程度, 与平均数一起,可以给我们许多关于样本数据的 信息.显然,极差对极端值非常敏感,注意到这一 点,我们可以得到一种“去掉一个最高分,去掉一 个最低分”的统计策略.
16
为了对两人射击水平的稳定程度,玉米生长的 高度差异等做个合理的评价,这里我们引入了一 个新的概念,方差和标准差.
xx1f1x2f2x3f3^^^xk fk 2
问题1:众数、中位数、平均数这三个数 一般都会来自于同一个总体或样本,它们 能表明总体或样本的什么性质?
众数:反映的往往是局部较集中的数据信息
中位数:反映处于中间部位的数据信息
平均数:反映所有数据的平均水平 3
1、求下列各组数据的众数
(1)、1 ,2,3,3,3,5,5,8,8,8,9,9 众数是:3和8
17
设一组样本数据x1,x2,…,,其x平n 均数为 ,则 x s2 1 n [(x 1 x)2 (x 2 x)2 (x n x)2 ]
称s2为这个样本的方差,它的算术平方根
s1 n[(x1x)2(x2x)2 (xnx)2]
称为这个样本的标准差,分别称为样本方差、样本标准18差
❖ 样本中各数据与样本平均数的差的平方 和的平均数叫做样本方差。
x 乙 1 ( 9 .4 1.3 0 1.8 0 9 .7 9 .8 ) 10 5
s 乙 2 [9 .4 ( 1 ) 2 0 ( 1 .3 0 1 ) 2 0 ( 1 .8 0 1 ) 2 0 ( 9 .7 1 ) 2 0 ( 9 .8 1 ) 2 ] 0 5 0 .24
23
因为x甲小于x乙,所以甲水稻的产 较量 稳比 定。
三.当堂反馈
1、在一次歌手大奖赛上,七位评委为歌手打 出的分数如下:9.4,8.4,9.4,9.9,9.6, 9.4,9.7,去掉一个最高分和一个最低分后, 所剩数据的平均值和方差分别为
_________________;
9.5,0.016
2、已知数据 a1, a2 ,的a3方差为2,
④甲成绩在平均数上下波动;而乙处于上升势头,从第四次 以后就没有比甲少的情况发生,乙较有潜力.
29
2.2.2 用样本的数字特征估计 总体的数字特征
(一)众数、中位数、平均数
1
一 众数、中位数、平均数的概念
众数:在一组数据中,出现次数最多的数据叫 做这组数据的众数. 中位数:将一组数据按大小依次排列,把处在 最中间位置的一个数据(或最中间两个数据的 平均数)叫做这组数据的中位数.
平均数x: 一1n(组x1数据x2的算 术平x均n)数,即
9
如何在频率分布直方图中估计平均数
可将平均数看作整个直方图面积的“重心”
平均数的估计值等于频率分 布直方图中每个小矩形的面 积乘以小矩形底边中点的横
坐标之和 (即频率乘以组中值的和)。
10
1.(2013年福建高考改编题)某校从高一年级学生中随 机抽取部分学生,将他们的模块测试成绩分成6组: [40,50), [50,60), [60,70), [70,80),[80,90), [90,100]加以 统计,得到如图所示的频率分布直方图。据此估计,
25
26
甲、乙两人在相同条件下各射靶10次, 每次射靶的成绩情况如图所示:
(1)请填写表:
(2)请从下列四个不同的角度对这次测试结果进行分析: ①从平均数和方差相结合看(分析谁的成绩更稳定); ②从平均数和中位数相结合看(分析谁的成绩好些); ③从平均数和命中9环及9环以上的次数相结合看(分析谁的成 绩好些); ④从折线图上两人射击命中环数的走势看(分析谁更有潜力).
0.6
前四个小矩形的 面积和=0.49
0.5
后四个小矩形的 面积和=0.26
0.4
0.25
0.3
0.22
0.01/0.25=x/0.5
0.2
0.15
0.14 所以x=0.02
0.1
0.08
0.06
0.04
0
0.5
1
1.5
2
2.5
3
0.04 0.02
3.5
4
4.5
2.02
月均用水量7 /t
如何在频率分布直方图中估计平均数
该校模块测试的平均分约为 71 。
中位数多少 70 众数是多少 65
11
(二)
12
一.实例引入
情境一;
甲.乙两名射击队员,在进行的十次射击 中成绩分别是:
甲: 10; 9; 8; 10; 8; 8; 10; 10; 9.5; 7.5
乙: 9; 9; 8,5; 9; 9; 9.5; 9.5; 8.5; 8.5; 9.5 试问二人谁发挥的水平较稳定?
频率 组距
众数在样本数据的频率分布直方图中,
就是最高矩形的中点的横坐标2.25。
0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)
可将众数看作直方图中面积最大长方形的“中心6”
频率 组距
可将如中何位在数频看率作分整布个直直方方图图中面估积计的中“位中数心”
8
.
所以这组数据的方差为5.5 .
20
练习:若甲、乙两队比赛情况如下,下列说法哪些 说法是不正确的:
平均失球数
平均失球个数的标准差
甲
1. 5
1. 1
乙
2. 1
0. 4
1、平均来说,甲的技术比乙的技术好;
2、乙比甲技术更稳定;
3、甲队有时表现差,有时表现好;
4、乙队很少不失球。
全对
21
方差的运算性质:
8
=2.02
x 1 1 ( x 1 0 x 2 0 x 1 ) 0 1 1 0 ( x 1 0 x 0 4 ) ( x 5 x 1 ) 2 ( x 9 x 9 1 ) 0
140 x1 40 180 x5 10 2 120 x9 9 1 0 00
0 .00 4 2 0 .5 0 .00 .8 5 2 1 0 .04 2 2 4 .5=2.02
x甲 =32
x乙 =32
14
甲: 31 32 35 37 33 30 32 31 30 29 乙: 53 16 54 13 66 16 13 11 16 62
甲
29 32 37
乙
11
32
66
甲
37(最大值) 29(最小值)
8极
乙
66(最大值) 11(最小值)
55 差
15
极差:一组数据的最大值与最小值的差
如果数据 x1,x2,,xn 的平均数为 x ,
方差为 s 2 ,则
(1)新数据 x1b,x2b,,xnb的平均数为
x b ,方差仍为 s 2 .
(2)新数据 ax1,ax2,,axn的平均数为a x ,
方差为 a 2 s 2 . (3)新数据 a x 1 b ,a x 2 b ,,a x n b
(2)、1 ,2,3,3,3,5,5,8,8,9,9 众数是:3
2、求下列各组数据的中位数
(1)、1 ,2,3,3,3,4,6,8,8,8,9,9 中位数是:5
(2)1 ,2,3,3,3,4,8,8,8,9,9 中位数是:4 4
二、众数、中位数、平均数与频率 分布直方图的关系
5
如何在频率分布直方图中估计众数
❖ 样本方差的算术平方根叫做样本标准差。 ❖ 样本方差和样本标准差都是衡量一个样
本波动大小的量,样本方差或样本标准 差越大,样本数据的波动就越大。
19
例1.计算数据89,93,88,91,94,90,88,87的 方差和
解:x 9 0 1 ( 1 3 2 1 4 0 2 3 ) 9 0
则求数据 2a1,2a2的,2a方3 差
24
小结
1.用样本的数字特征估计总体的数字特征分两类: a.用样本平均数、众数、中位数估计总体平均数、 众数、中位数。 b.用样本标准差、方差估计总体标准差、方差。 样本容量越大,估计就越精确。
2.平均数对数据有“取齐”的作用,代表一组数据 的平均水平。 3.标准差描述一组数据围绕平均数波动的大小,反 映了一组数据变化的幅度。
27
(2)请从下列四个不同的角度对这次测试结果进行分析: ①从平均数和方差相结合看(分析谁的成绩更稳定); ②从平均数和中位数相结合看(分析谁的成绩好些);
解:(2)①∵平均数相同,S甲2 S乙2
∴甲的成绩比乙稳定. ②∵平均数相同,甲的中位数< 乙的中位数, ∴乙的成绩比甲好些.
28
③从平均数和命中9环及9环以上的次数相结合看(分析谁的成 绩好些); ④从折线图上两人射击命中环数的走势看(分析谁更有潜力).
的平均数为 a x b,方差为a 2 s 2 .
22
例2:甲、乙两种水稻试验品种连续5年的平均单位面积产量 如下(单位:t/hm2 ),试根据这组数据估计哪一种水稻品种 的产量比较稳定.
解:x 甲 1 ( 9 .8 9 .9 1.1 0 1 0 1.2 0 ) 10
5
s 甲 2 [9 .8 ( 1 ) 2 0 ( 9 .9 1 ) 2 0 ( 1 .1 0 1 ) 2 0 ( 1 1 0 ) 2 0 ( 1 .2 0 1 ) 2 ] 0 5 0 .02
分析:甲的平均成绩是9环.乙的平均成绩也是9环13.
情境二:
某农场种植了甲、乙两种玉米苗,从中各抽取
了10株,分别测得它们的株高如下:(单位cm)
甲: 31 32 35 37 33 30 32 31 30 29 乙: 53 16 54 13 66 16 13 11 16 62
问:哪哪种种玉玉米米苗苗长长得得高齐??
极差越大,数据越分散,越不稳定
极差越小,数据越集中,越稳定
在一定程度上表明了样本数据的分散程度, 与平均数一起,可以给我们许多关于样本数据的 信息.显然,极差对极端值非常敏感,注意到这一 点,我们可以得到一种“去掉一个最高分,去掉一 个最低分”的统计策略.
16
为了对两人射击水平的稳定程度,玉米生长的 高度差异等做个合理的评价,这里我们引入了一 个新的概念,方差和标准差.
xx1f1x2f2x3f3^^^xk fk 2
问题1:众数、中位数、平均数这三个数 一般都会来自于同一个总体或样本,它们 能表明总体或样本的什么性质?
众数:反映的往往是局部较集中的数据信息
中位数:反映处于中间部位的数据信息
平均数:反映所有数据的平均水平 3
1、求下列各组数据的众数
(1)、1 ,2,3,3,3,5,5,8,8,8,9,9 众数是:3和8
17
设一组样本数据x1,x2,…,,其x平n 均数为 ,则 x s2 1 n [(x 1 x)2 (x 2 x)2 (x n x)2 ]
称s2为这个样本的方差,它的算术平方根
s1 n[(x1x)2(x2x)2 (xnx)2]
称为这个样本的标准差,分别称为样本方差、样本标准18差
❖ 样本中各数据与样本平均数的差的平方 和的平均数叫做样本方差。
x 乙 1 ( 9 .4 1.3 0 1.8 0 9 .7 9 .8 ) 10 5
s 乙 2 [9 .4 ( 1 ) 2 0 ( 1 .3 0 1 ) 2 0 ( 1 .8 0 1 ) 2 0 ( 9 .7 1 ) 2 0 ( 9 .8 1 ) 2 ] 0 5 0 .24
23
因为x甲小于x乙,所以甲水稻的产 较量 稳比 定。
三.当堂反馈
1、在一次歌手大奖赛上,七位评委为歌手打 出的分数如下:9.4,8.4,9.4,9.9,9.6, 9.4,9.7,去掉一个最高分和一个最低分后, 所剩数据的平均值和方差分别为
_________________;
9.5,0.016
2、已知数据 a1, a2 ,的a3方差为2,