1、样本数字特征
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6 6 A. B. 5 C. 2 D. 2 5 3.对一组数据 x1 , x 2 , ... x n,如果将他们改变为 x1 + a, x2 + a,...xn + a 对一组数据 中,则下面结论中正确的是 ( B )
A. 平均数与方差均不变 C. 平均数不变,而方差变了 平均数不变, B. 平均数变了,而方差保持不变 平均数变了, C. 平均数与方差均发生了变化
由 0.5 − 0.3 ×10 ≈ 6.7. 0.3
70 + 6.7 = 76.7
思考:阅读课本73页的思考 页的思考, 思考:阅读课本 页的思考,举例分析对极
端值不敏感的利与弊。 端值不敏感的利与弊。
练习: 练习:
应该采用平均数来表示每一个国家项目的平均金额, 应该采用平均数来表示每一个国家项目的平均金额, 因为它能反映所有项目的信息。 因为它能反映所有项目的信息。但平均数会受到极端数 万元的影响, 据2200万元的影响,所以大多数项目投资金额都和平均 万元的影响 数相差比较大。 数相差比较大。
0.5 0.4 0.3 0.2 0.1 O 0.5 1 1.5 2 2.5 3
3.5
4
4.5
月平均用水量(t)
小结2: 在频率分布直方图中,中位数两边的频率相等, 小结 : 在频率分布直方图中,中位数两边的频率相等,
即两边的小矩形面积相等. 即两边的小矩形面积相等
频率 组距 思考3:如下图所示, 思考 :如下图所示,居民 用水量的平均数的估计值 是多少? 2.02 t
,其
例3
甲乙两人同时生产内径为25.40mm的一种零件.为 了对两人的生产质量进行评比,从他们生产的零件中各抽 出20件,量得其内径尺寸如下(单位:mm):
甲 25.46, 25.32, 25.45, 25.39, 25.36 25.34, 25.42, 25.45, 25.38, 25.42 25.39, 25.43, 25.39, 25.40, 25.44 25.40, 25.42, 25.35, 25.41, 25.39 乙 25.40, 25.43, 25.44, 25.48, 25.48 25.47, 25.49, 25.49, 25.36, 25.34 25.33, 25.43, 25.43, 25.32, 25.47 25.31, 25.32, 25.32, 25.32, 25.48 从生产的零件内径的尺寸看,谁生产的质量较高? 从生产的零件内径的尺寸看,谁生产的质量较高?
(1) 5, 5, 5, 5, 5, 5, 5, 5, 5; (2) 4, 4, 4, 5 , 5, 5, 6, 6, 6; (3) 3 , 3 , 4 , 4 , 5, 6 , 6, 7 , 7; (4) 2 , 2 , 2 , 2, 5 , 8 , 8 , 8 , 8 ;
频率 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 o
如:有两位射击运动员在一次射击测试中各射靶10次,每 有两位射击运动员在一次射击测试中各射靶 次 次命中的环数如下: 次命中的环数如下:
甲:7 8 乙:9 5 7 9 5 7 8 7 4 6 9 10 7 8 6 7 7 4
如果你是教练,你应当如何对这次射击作出评价 如果你是教练 你应当如何对这次射击作出评价? 你应当如何对这次射击作出评价
标准差、 二 、 标准差、方差
假 样 数 是 1, x2,...xn, x表 这 数 的 均 。x i到x的 离 : 设 本 据 x 示 组 据 平 数 距 是
x
i
−
−
−
x ( i = 1 ,2 ,…
−
−
, n ).
于是, 样本数据x1 , x2 , ⋯ xn到 x 的“平均距离” 是:
S = x1 − x + x 2 − x + ⋯ x n − x n .
解:用计算器计算可得: 用计算器计算可得:
x甲 = 25.401, x乙 = 25.406; s甲 = 0.037, s乙 = 0.068.
从样本平均数看, 从样本平均数看,甲生产的零件内径比乙的更接近内径标
甲 准,但差异很小;从样本标准看,由于 s < s乙 ,因此甲生 但差异很小;从样本标准看,
− − −
标准差: 标准差:
1 [(x − x)2 + (x − x)2 +⋯+ (x − x)2 ] s= 2 n n 1 方差: 方差: 2 1 [(x − x)2 + ( x − x)2 +⋯+ (x − x)2 ] s = 1 2 n n
画出下列四组样本数据的条形图,说明 例2 画出下列四组样本数据的条形图 说明 它们的异同点. 它们的异同点
4 5 6 7 8 9 10 环数
4 5 6 7 8 9 10 环数
由上图可知甲的成绩比较分散,极差较大为6 由上图可知甲的成绩比较分散,极差较大为6; 乙的成绩相对集中,极差为4. 4.极差在一定程度 乙的成绩相对集中,极差为4.极差在一定程度 上表明了样本数据的分散程度. 上表明了样本数据的分散程度.
小结: 小结:
(1)众数、中位数及平均数都是描述一组数据集中趋势的量. (1)众数、中位数及平均数都是描述一组数据集中趋势的量. 众数 (2)众数考查各数据出现的频率 众数考查各数据出现的频率, (2)众数考查各数据出现的频率,大小只与这组数据中的部 分数据有关,当一组数据中有不少数据多次重复出现时, 分数据有关,当一组数据中有不少数据多次重复出现时, 其众数往往更能反映问题. 其众数往往更能反映问题. (3)中位数仅与数据的排列位置有关 中位数仅与数据的排列位置有关, (3)中位数仅与数据的排列位置有关,某些数据的变动对中 位数没有影响.中位数可能出现在所给数据中, 位数没有影响.中位数可能出现在所给数据中,也可能不 在所给数据中.当一组数据中的个别数据变动较大时,可 在所给数据中.当一组数据中的个别数据变动较大时, 用中位数描述其集中趋势. 用中位数描述其集中趋势. (4)由于平均数与每一个样本数据有关 所以, 由于平均数与每一个样本数据有关, (4)由于平均数与每一个样本数据有关,所以,任何一个样 本数据的改变都会引起平均数的改变,这是中位数、 本数据的改变都会引起平均数的改变,这是中位数、众数 都不具有的性质. 都不具有的性质. (5)如果样本平均数大于样本中位数,说明数据中存在许多 (5)如果样本平均数大于样本中位数, 如果样本平均数大于样本中位数 较大的极端值;反之,说明数据中存在许多较小的极端值。 较大的极端值;反之,说明数据中存在许多较小的极端值。 在实际应用中,若同时知道样本中位数和样本平均数, 在实际应用中,若同时知道样本中位数和样本平均数,可 以使我们了解样本信息,帮助我们作出决策。 以使我们了解样本信息,帮助我们作出决策。
x =5
S=2.83
−
1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 o
x=5
S=1.49
−
1 2 3 45
6 7 8
度是不一样的.
1 2 3 4 5 6 7 8
当堂检测:
1. 在某项体育比赛中一位同学被评委所打出的分数如下:90 ,89 ,90, 在某项体育比赛中一位同学被评委所打出的分数如下: , 95,93,94,93。去掉一个最高分和最低分后,所剩数据的平均分值和 , , , 。去掉一个最高分和最低分后, 方差分别为: 方差分别为:( B ) A. 92, 2 B. 92, 2.8 C . 93, 2 D. 93, 2.8 2. 样本中共有 个个体,其值分别为a,0,1,2,3,若样本的平均值为 , 样本中共有5个个体,其值分别为 , , , ,若样本的平均值为1, 个个体 则样本方差为 ( D )
分析:两人射击的平均成绩如何? 分析:两人射击的平均成绩如何?是否两个人的水
平就没有什么差异呢? 平就没有什么差异呢?
下图为两人成绩的频率分布条形图: 下图为两人成绩的频率分布条形图: 两人成绩的频率分布条形图
频率 0.4 0.3 0.2 0.1 O
(甲)
0.4 0.3 0.2 0.1 O
Baidu Nhomakorabea
频率
(乙)
−
练习: 练习: 在一次中学生田径运动会上,参加男
子跳高的17名运动员的成绩如下表所示:
成绩 (单位 米) 单位:米 单位
1.50 1.60 1.65 . . . 2 3 2
1.70 . 3
1.75 . 4
1.80 . 1
1.85 . 1
1.90 . 1
人数
求:这些运动员成绩的众数,中位数与平均数 . 1.69米 ) (1.75米 、 1.70米、
−
−
产的零件内径比乙的稳定程度高得多. 产的零件内径比乙的稳定程度高得多.所以甲生产的零件质 量比乙好一些. 量比乙好一些.
小结: 小结:
1.众数、中位数、平均数的概念. 1.众数、中位数、平均数的概念. 众数 2.众数、中位数、 2.众数、中位数、平均数与频率分布直 众数 方图的关系. 方图的关系. 标准差的概念. 3. 标准差的概念. 4.如何利用标准差刻画数据的离散程度? 4.如何利用标准差刻画数据的离散程度? 如何利用标准差刻画数据的离散程度
频率/组距 频率 组距
0.03
0.024 0.02 0.016
0.006 0.004
40
50
60
70
80
90
100
成绩
解:(1)众数为 70 + 80 = 75; 2
= 76.2.
(3)
(2) 平均数 = 0. × 45 + 0.06 × 55 + 0.2 × 65 04 + 0.3 × 75 + 0.24 × 85 + 0.16 × 95
0.5 0.4 0.3 0.2 0.1 O 0.5 1 1.5 2 2.5 3
3.5
4
4.5
月平均用水量(t)
小结3 小结3: 平均数是频率分布直方图中每个小矩形的面积乘 以小矩形的底边中点的横坐标之和. 以小矩形的底边中点的横坐标之和
根据所给的频率分布直方图 所给的频率分布直方图,估计该班同学数学 例1 根据所给的频率分布直方图 估计该班同学数学 成绩的众数,平均数 中位数 成绩的众数 平均数,中位数 平均数 中位数.
左边三个小矩形面积之和为: . 左边三个小矩形面积之和为: 004+0.06+0.2=0.3<0.5,
而左边四个小矩形面积之和为: 004+0.06+0.2+0.3=0.6>0.5, 而左边四个小矩形面积之和为: . 故中位数必然在[70,80]内, 故中位数必然在[70,80]内 [70,80] 故中位数约为
222一画频率分布直方图的步骤2中位数将一组数据按大小依次排列把处在最中间位置的一个数据或两个数据的平均数叫做这组数据的中位数
2.2.2用样本的数字特征估计总 用样本的数字特征估计总 体的数字特征
复习回顾
一、画频率分布直方图的步骤 二、初中学过哪些刻画数据的数字特征
在一组数据中, 1、众数 在一组数据中,出现次数最多的数据叫做 这一组数据的众数. 这一组数据的众数. 将一组数据按大小依次排列, 2、中位数 将一组数据按大小依次排列,把处在最 中间位置的一个数据(或两个数据的平均数) 中间位置的一个数据(或两个数据的平均数)叫做这组数 据的中位数. 据的中位数. 3、平均数 +x x = (x1+x2+……+xn) /n.
众数、中位数、 一、众数、中位数、平均数与频率分布直方图的关系
频率 组距 思考1 思考 :在城市居民月均 用水量样本数据的频率 分布直方图中, 分布直方图中,你认为 众数应在哪个小矩形内? 众数应在哪个小矩形内? 由此居民月均用水量的 众数的估计值是多少? 众数的估计值是多少? 2.25t
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)
0.5 0.4 0.3 0.2 0.1
小结1 众数在样本数据的频率分布直方图中, 小结1:众数在样本数据的频率分布直方图中,就是最高 矩形的中点的横坐标. 矩形的中点的横坐标.
频率 组距 思考2: 思考 :(1) 如何用频率分布 直方图估计中位数呢? 直方图估计中位数呢? (2)下图中从左至右小 长方形的面积是多少? 长方形的面积是多少?由此 居民月均用水量的中位数的 估计值是多少? 估计值是多少? 2.02 t
−
四组样本数据的条形图是: 解:四组样本数据的条形图是 四组样本数据的条形图是
x=5
S=0.00
1 2 3 45 (1)
6 7 8
频率 频率 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 o
−
x =5
S=0.82
频率 1 2 3 45 6 7 8 (2) 1.0 0.9 0.8 四组数据的平均数均为5, 0.7 0.6 标准差分别为0.00,0.82,0.5 0.4 1.49,2.83.虽然平均数 0.3 0.2 相同,但有不同的标准 0.1 差,说明数据的分散程 o