2.2.2用样本的数字特征估计总体的数字特征(优质课)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

提问:1、电视里评委是怎样给选手打分的? 2、为什么这么做?直接取中位数和众数的值不好么?
特征数 众数 中位数 平均数 去掉一个最高分和 去掉两个最高分 最低分后的平均分 和最低分后的平 均分
特征值
9. 3
9. 4
9.49
9.42
9.44
例2 某工厂人员及工资构成如下: 人员 周工资 人数 合计 经理 管理人员 高级技工 工人 2200 250 220 200 1 6 5 10 2200 1500 1100 学徒 合计 100 1 23 6900
x 100 )
x 5 12
0 .5 1 2
100
0 . 04
0 0 .5 2
平均数的估计值等于频率分 布直方图中每个小矩形的面 积乘以小矩形底边中点的横 坐标之和。
0 . 08
0 . 02
=2.02
可将平均数看作整个直方图面积的“重心”
思考讨论以下问题:
例1.计算数据89,93,88,91,94,90,88,87的 方差和标准差。(标准差结果精确到0.1)
解:x
90
1 8
( 1 3 2 1 4 0 2 3) 9 0
.
所以这组数据的方差为5.5,标准差为2.3 . 见课本76-77页
练习:若甲、乙两队比赛情况如下,下列说法哪些 说法是不正确的:
选择平均数更好:因为,此时的众数20万比中位数25万还小, 所以众数代表的是局部的数。中位数代表的虽然是大多数公路 投资的数额,但由于其不受极端值的影响,不能代表全体,因 而此时成了它的缺点。选择平均数较好,能比较好的代表整体 水平,但缺点是仍不能显示出具体的数字特征
(二)
一.实例引入 情境一;
问题1:众数、中位数、平均数这三个数 一般都会来自于同一个总体或样本,它们 能表明总体或样本的什么性质? 众数:反映的往往是局部较集中的数据信息
中位数:是位置型数,反映处于中间部位的 数据信息
平均数:反映所有数据的平均水平
1、求下列各组数据的众数
(1)、1 ,2,3,3,3,5,5,8,8,8,9,9 众数是:3和8 (2)、1 ,2,3,3,3,5,5,8,8,9,9 众数是:3 2、求下列各组数据的中位数
在样本中中位数的左右各有50%的样本数, 条形面积各为0.5,所以反映在直方图中位数 左右的面积相等.
0 . 04 0 . 08 0 . 15 0 . 22 0 . 49
x 0 . 02
中位数
2 0 . 02 2 . 02
可将中位数看作整个直方图面积的“中心”
思考讨论以下问题:
1、2.02这个中位数的估计值,与样本的中 位数值2.0不一样,你能解释其中原因吗? 答:2.02这个中位数的估计值,与样本的中 位数值2.0不一样,这是因为样本数据的 频率分布直方图,只是直观地表明分布的 形状,但是从直方图本身得不出原始的数 据内容,直方图已经损失一些样本信息。 所以由频率分布直方图得到的中位数估计 值往往与样本的实际中位数值不一致.
2
x乙
s乙
2
1 ( 9 . 4 10 . 3 10 . 8 9 . 7 9 . 8 ) 10 5
2 2 2 2 2
[( 9 . 4 10 ) (10 . 3 10 ) (10 . 8 10 ) ( 9 . 7 10 ) ( 9 . 8 10 ) ] 5 0 . 24
如何在频率分布直方图中估计平均数
=2.02
x

1 100
4 100
( x 1 x 2 x 100 )
x 1 4 8 100
1 100
( x 1 x 4 ) ( x 5 x 12 ) ( x 99
2 x 99 100
4 4 .5 2
2
它的算术平方根 称s2为这个样本的方差,
s
1 n
[ ( x1 x ) ( x 2 x )
2
2
( xn x ) ]
2
称为这个样本的标准差,分别称为样本方差、样本标准差
样本中各数据与样本平均数的差的平方
和的平均数叫做样本方差;样本方差的 算术平方根叫做样本标准差。样本方差 和样本标准差都是衡量一个样本波动大 小的量,样本方差或样本标准差越大, 样本数据的波动就越大。
的产量比较稳定.
品种 甲 乙 第一年 9. 8 9. 4 第二年 9. 9 10.3 第三年 10.1 10.8 第四年 10 9. 7 第五年 10.2 9. 8
解: x

2
1 ( 9 . 8 9 . 9 10 . 1 10 10 . 2 ) 10 5
2 2 2 2
s甲
[( 9 . 8 10 ) ( 9 . 9 10 ) (10 . 1 10 ) (10 10 ) (10 . 2 10 ) ] 5 0 . 02
极差体现了数据的离散程度
为了对两人射击水平的稳定程度,玉米生长的 高度差异以及钢筋质量优劣做个合理的评价,这 里我们引入了一个新的概念,方差和标准差.
设一组样本数据 x1,x2,…,xn ,其平均数为 x ,则
s
2

1 n
[( x 1 x ) ( x 2 x )
2
2
( xn x ) ]
2、样本中位数不受少数极端值的影响,这 在某些情况下是一个优点,但它对极端值 的不敏感有时也会成为缺点。你能举例说 明吗? 答:优点:对极端数据不敏感的方法能够 有效地预防错误数据的影响。
对极端值不敏感有利的例子:例如当样本数据质 量比较差,即存在一些错误数据(如数据录入错 误、测量错误等)时,用抗极端数据强的中位数 表示数据的中心值更准确。
a3 2、已知数据 a 1 , a 2 ,的方差为 2,则求数据 的方差。
2 a1 , 2 a 2 , 2 a 3
方差的运算性质: 如果数据 x1 , x2 , , xn 的平均数为 x , 2 方差为 s ,则 (1)新数据 x1 b, x2 b, , xn b 的平均数为

答:17名运动员成绩的众数、中位数、平均数依次是 1.75(米)、1.70(米)、1.69(米)。
二、众数、中位数、平均数与频率 分布直方图的关系
如何在频率分布直方图中估计众数
频率 组距
众数在样本数据的频率分布直方图中, 就是最高矩形的中点的横坐标。
0.5 0.4 0.3 0.2 0.1
O
0.5
缺点:(1)出现错误的数据也不知道; (2)对极端值不敏感有弊的例子:某人具 有初级计算机专业技术水平,想找一份收 入好的工作。这时如果采用各个公司计算 机专业技术人员收入的中位数作为选择工 作的参考指标就会冒这样的风险:
很可能所选择公司的初级计算机专业技术水平 人员的收入很低,其原因是中位数对极小的数 据不敏感。这里更好的方法是同时用平均工资
课堂练习: 1、假设你是一名交通部门的工作人员。你打算向市长报告国 家对本市26条公路项目投资的平均资金数额,其中一条新公 路的建设投资为2 200万元人民币,另外25个项目的投资在 20万与100万.中位数是25万,平均数是100万,众数是20万 元。你会选择哪一种数字特征来表示每一个项目的国家投资? 你选择这种数字特征的缺点是什么?
和中位数作为参考指标,选择平均工资较高且 中位数较大的公司就业.
三、 众数、中位数、平均数的简单应用
例1、下表是七位评委给某参赛选手的打分,总分为10分, 你认为如何计算这位选手的最后得分才较为合理?
评委 1号 打分 9.6
2号 9.3
3号 9.3
4号 9.6
5号 6号 9.9 9.3
7号 9.4
某农场种植了甲、乙两种玉米苗,从中各抽取 了10株,分别测得它们的株高如下:(单位cm)
甲: 31
乙: 53
32
16
35 37 33 30 32 31 30 29
54 13 66 16 13 11 16 62
哪种玉米苗长得高? 问: 哪种玉米苗长得齐?
x甲 =32
x乙 =32
怎 么 办 呢 ?
甲: 31 乙: 53 甲
平均失球数 甲 1. 5 平均失球个数的标准差 1. 1

2. 1
0. 4
1、平均来说,甲的技术比乙的技术好; 2、乙比甲技术更稳定; 3、甲队有时表现差,有时表现好; 4、乙队很少不失球。
全对
例2:甲、乙两种水稻试验品种连续5年的平均单位面积产量 如下(单位:t/hm2 ),试根据这组数据估计哪一种水稻品种
1
1.90
1
分别求这些运动员成绩的众数,中位数与平均数 。 解:在17个数据中,1.75出现了4次,出现的次数最多, 即这组数据的众数是1.75. 上面表里的17个数据可看成是按从小到大的顺序排 列的,其中第9个数据1.70是最中间的一个数据,即这组 数据的中位数是1.70; 这组数据的平均数是
x 1 17 (1 .5 0 2 1 .6 0 3 ... 1 .9 0 1) 1 .6 9 米
甲.乙两名射击队员,在进行的十次射击中成绩分别是: 甲: 10; 9; 8; 10; 8; 8; 10; 10; 9.5; 7.5
乙: 9; 9; 8,5; 9; 9; 9.5; 9.5; 8.5; 8.5; 9.5
试问二人谁发挥的水平较稳定?
分析:甲的平均成绩是9环.乙的平均成绩也是9环.
情境二:
0.14 0.06 0.04 3 3.5 4 0.02
4.5
2.02
月均用水量/t
分组 [0, 0.5) [0.5, 1) [1, 1.5) [1.5, 2) [2, 2.5) [2.5, 3) [3,, 3.5) [3.5, 4) [4,) 4.5]
合计
频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 1
(一)众数、中位数、平均数
一 众数、中位数、平均数的概念
众数:在一组数据中,出现次数最多的数据叫 做这组数据的众数.
中位数:将一组数据按大小依次排列,把处在 最中间位置的一个数据(或最中间两个数据的 平均数)叫做这组数据的中位数.
平均数: 一组数据的算术平均数,即
X 1 n ( x1 x 2 x n )
2000 100
(1)指出这个问题中周工资的众数、中位数、平均数 (2)这个问题中,工资的平均数能客观地反映该厂的工资水 平吗?为什么?
分析:众数为200,中位数为220,平均数为300。
因平均数为300,由表格中所列出的数据可见,只有 经理在平均数以上,其余的人都在平均数以下,故用平 均数不能客观真实地反映该工厂的工资水平。
32 16
35 54
37 13
33 66
30 16
32 13
31 11
30 16
29 62
29 32
37

11 32 66
甲 乙
37(最大值) 66(最大值)
29(最小值) 11(最小值)
8 55
极 差
极差: 一组数据的最大值与最小值的差
极差越大,数据越分散,越不稳定 极差越小,数据越集中,越稳定
ቤተ መጻሕፍቲ ባይዱ
因为 x 甲 小于 x 乙 ,所以甲水稻的产量比
较稳定。
三.当堂反馈
1、在一次歌手大奖赛上,七位评委为歌手打出的分 数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去 掉一个最高分和一个最低分后,所剩数据的平均值和 方差分别为_________________;
9.5,0.016
思考一下:
(1)、1 ,2,3,3,3,4,6,8,8,8,9,9 中位数是:5 (2)1 ,2,3,3,3,4,8,8,8,9,9 中位数是:4
3、在一次中学生田径运动会上,参加男子跳高的17名 运动员的成绩如下表所示:
成绩(米)
人数
1.50 1.60
2 3
1.65
2
1.70
3
1.75
4
1.80
1
1.85
x b,方差仍为
s
2

(2)新数据 ax1 , ax2 , , axn的平均数为 a x , 方差为 a 2 s 2 . (3)新数据 ax1 b, ax2 b, , axn b 的平均数为 ax b,方差为a 2 s 2 .
1
1.5
2
2.5
3
3.5
4
4.5
月平均用水量(t)
可将众数看作直方图中面积最大长方形的“中心”
频率 组距
如何在频率分布直方图中估计中位数
0.6 0.5 0.4 0.3 0.2 0.1 0
前四个小矩形的 面积和=0.49
后四个小矩形的 面积和=0.26
0.25
0.22
0.15 0.08 0.04 0.5 1 1.5 2 2.5
相关文档
最新文档