2.2.2用样本的数字特征估计总体的数字特征(优质课)
高中数学2.2.2 用样本的数字特征估计总体的数字特征1
2.(1)由平均数公式得 x=
(182×27+80×21)≈81.13(分).
48
(2)因为男生的中位数是75分,所以至少有14人得分不超过75
分.
又因为女生的中位数是80分,所以至少有11人得分不超过80分.
所以全班至少有25人得分不超过80分.
(3)男生的平均分与中位数的差别较大,说明男生中两极分化现
2.2.2 用样本的数字特征估计总体的数字特征
1.正确理解样本数据标准差的意义和作用,学会计算数据的标 准差. 2.能根据实际问题的需要合理地选取样本,从样本数据中提取 基本的数字特征(如平均数、标准差),并作出合理的解释. 3.会用样本的基本数字特征估计总体的基本数字特征,形成对 数据处理过程进行初步评价的意识.
x1 x2 xn
则 x =_______n_______.
2.方差、标准差 假设样本数据是x1,x2,x3,…,xn, x 是平均数,则 (1)方差是
s2=__n1[___x1___x_2____x_2 __x__2 ______x_n__x__2_].
(2)标准差为
s=__n1_[__x_1__x__2___x_2___x_2____ __x_n___x__2 ]_.
【解题指南】1.由平均数和方差的定义直接求解.
2.先画出茎叶图,再利用平均数和方差结合的形式分析稳定性.
【自主解答】1.
s2
1 [ 21
a1
x
2
a2 x
2
a20 x
2
xx
2
]
1 20 0.20 4 0.19.
21
21
答案:0.19
2.(1)作出茎叶图如下:
(2)派甲参赛比较合适.理由如下:
《2.2.2 用样本的数字特征估计总体的数字特征》PPT课件(山西省市级优课)
1.5
2
2.5
3
3.5
率 组距
0.6
频率分布直方图 提示:中位数左边的 数据个数与右边的数 据个数是相等的。
0.5
0.4
0.25
0.3 0.22
0.2 0.15
0.1
0.08
0.04
0
0.5
1
1.5
2
0.14
0.06 0.04 0.02
2.5
3
3.5
4
4.5
月均用水量/t
0.2
0.14
0.15
0.1
0.08
0.06
. . . . . . . . . 0.04
0
0.5
1
1.5
2
2.5
3
0.04 0.02
3.5
4
4.5
0.25 0.75 1.25 1.75 2.25 2.75 3.25 3.75 4.25
2.02
月均用水量/t
合作互助2: 探究三种数字特征的优缺点
通过抽样调查获得100位居民的月平均用 水量(单位:t) ,如下表:
【我的学习目标】
1.会根据频率分布直方图求众数、中位数、平均数 2.会应用这些数字特征合理有效地评估简单的实际问题 3.再次体会用样本估计总体的统计思想。
【重点】
1.从频率分布直方图中提取众数、中位数、平均数 2.明确三种数字特征的优缺点,可以合理利用其对简单
的实际问题进行评估
【难点】
应用数字特征合理评估简单的实际问题
直方图中,各个组的 平均数如何找?
0.5
0.4
0.25
0.3
0.22
0.2
0.15
用样本的数字特征估计总体的数字特征
三
三种数字特征的优缺点
1、众数体现了样本数据的最大集中 点,但它对其它数据信息的忽视使得无 法客观地反映总体特征.如上例中众数是 2.25t,它告诉我们,月均用水量为2.25t的 居民数比月均用水量为其它数值的居民 数多,但它并没有告诉我们多多少.
2、中位数是样本数据所占频率 的等分线,它不受少数几个极端值的 影响,这在某些情况下是优点,但它 对极端值的不敏感有时也会成为缺点。 如上例中假设有某一用户月均用水量 为10t,那么它所占频率为0.01,几乎 不影响中位数,但显然这一极端值是不 能忽视的。
故平均睡眠时间约为7.39 h .
解法 2 求组中值与对应频率之积的和 6.25 0.05 6.75 0.17 7.25 0.33 7.75 0.37 8.25 0.06 8.75 0.02 7.39 h .
答 估计该校学生的日平均睡眠时间约为7.39 h .
合 计
分析 要确这100 名学生的平均睡 眠 时间, 就 必须 计算其总睡眠时间.由于每组中的个体睡眠时间只 是一个范围, 可以用各组区间的组中值近似地表示 .
解法1 总睡眠时间约为 6.25 5 6.75 17 7.25 33 7.75 37 8.25 6 8.75 2 739 h .
频率 组距
0.5 0.4 0.3 0.2 0.1 O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)
2.02这个中位数的估计值,与样本的中 位数值2.0不一样,你能解释其中的原因吗? 2.02这个中位数的估计值,与样本 的中位数值2.0不一样,这是因为样本数 据的频率分布直方图,只是直观地表明 分布的形状,但是从直方图本身得不出 原始的数据内容,所以由频率分布直方 图得到的中位数估计值往往与样本的 实际中位数值不一致.
2.2.2 用样本的数字特征估计总体的数字特征(第一课时)
普通高中数学必修3(A版)学案2.2. 用样本估计总体之答禄夫天创作2.2.2用样本的数字特征估计总体的数字特征(第一课时)执笔:闫福保赵文生授课时间:年月日【学习目标】1.通过实例理解样本数据标准差的意义和作用, 学会计算数据标准差.2.进一步体会用样本估计总体的思想, 会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性.【重点难点】通过实例理解样本数据标准差的意义和作用, 学会计算数据标准差【学习过程】在初中, 总体平均数(又称为总体期望值)描述了一个总体的平均水平.对很多总体来说, 它的平均数不容易求得, 经常使用容易, 而且经常使用两个样本平均数的年夜小去近似地比力相应的两个总体的平均数的年夜小.一、合作交流①.平均数最能代表一个样本数据的集中趋势, 也就是说它与样本数据的离差最小;,则其平均数为④.在一组数据中, 平均数、众数、中位数能够反映该组数据的集中趋势和平均水平, 但有时需要去失落极端值(极年夜值或极小值), 再去计算平均数则更能反映平均水平.二、随堂练习例1:一个水库养了某种鱼10万条, 从中捕捞了20条, 称得它们的质量如下:(单元:KG)1.15 1.04 1.11 1.07 1.10 1.32 1.25 1.19 1.15 1.21 1.18 1.14 1.09 1.25 1.21 1.29 1.16 1.24 1.12 1.16计算样本平均数, 并根据计算结果估计水库里所有这种鱼的总质量约是几多?解:样本平均数为 1.1715,根据样本平均数估计水库里所有这种鱼的总质量约是例2:在丈量某物理量的过程中, 因仪器和观察的误差, 使得, 我们规定所丈量的物理各数据差的平方和最小, 依此规定,量的取值.点评:样本平均数与样本数据的离差最小.三、能力提升1. 某校高二年级进行一次数学测试, 抽取40人, 算出其平均成果为80分, 为准确起见, 后来又抽取50人, 算出其平均成果为83分, 通过两次抽样的结果, 估计这次数学测试的平均成果.数的界说.解:样本平均数估计总体平均数即这次数学测试的平均成绩为 81.7分.点评:两次样本和的平均数未必即是两次样本平均数的和或两次样本平均数的平均值.【小结反思】1. 用样本的数字特征估计总体的数字特征分两类:()用样本平均数估计总体平均数.()用样本标准差估计总体标准差.样本容量越年夜, 估计就越精确.2.平均数对数据有“取齐”的作用, 代表一组数据的平均水平.3.标准差描述一组数据围绕平均数摆荡的年夜小, 反映了一组数据变动的幅度.【自我测评】1.已知10个数据:1203 1201 1194 1200 1204 1201 1199 1204 1195 1199它们的平均数是( )A 1300B 1200C 1100D 14002.若M个数的平均数是X, N个数的平均数是Y,则这M+N个数的平均数是( )3.某工厂研制A、B两种灯胆, 为了比力这两种灯胆的平均使用寿命, 从这两种灯胆中各抽10只进行的使用寿命试验, 获得如下数据(单元:小时)A.1000 1200 1650 1342 1679 999 1320 1540 1276 1342B.1580 1420 1320 1149 1330 1178 1440 1553 1642 1005根据上述两个样本, 能对两种灯胆的平均使用寿命作出什么样的估计?“杂交水稻之父”的中国科学院院士袁隆平, 为了获得良种水稻, 进行了年夜量试验, 下表是在10个试验点对A、B两个品种的比较试验结果:试估计哪个品种的平均产量更高一些?【拓展尝新】5那【解答】1.B 2.C 3.甲种灯胆的平均使用寿命长.4.A品种的平均产量更高一些.5。
2.2.2用样本的数字特征估计总体的数字特征自学完美教案
分别求这些运动员成绩的众数、 中位数、 平均数(保留到小 数点后两位).并分析这些数据的含义.
(1)求出该工厂员工工资的众数、中位数、平均数. (2)在这个问题中, 平均数能客观地反映该工厂员工的工资 水平吗?为什么?
-2-
启航书院
高中数学必修三
2.2.2 用样本的数字特征估计总体的数字特征
例 2:在实施城乡清洁工作计划过程中,某校对各个班级 教室卫生情况的考评包括以下几项:黑板、门窗、桌椅、 地 面.一天,两个班级的各项卫生成绩分别下表:(单位:分)
⑶某城市只月份 I 日至 I0 日的最低气温随时间变化的图 象.
①根据左图提供的信息,在右图中补全直方图; ②在 10 天中最低气温的众数是_____℃,最低气温的中位 数是____℃,最低气温的平均数是_____℃.
-3-
启航书院
高中数学必修三
2.2.2 用样本的数字特征估计总体的数字特征
例 4:甲、乙两人数学成绩的茎叶图如图,试求这两位同学 的数学成绩的众数、中位数、平均数.
-1-
启航书院
高中数学必修三
2.2.2 用样本的数字特征估计总体的数字特征
4.平均数、中位数和众数的异同: (1)平均数、中位数和众数都是描述一组数据“集中趋势”的统计量,平均数是最重要的量. (2)平均数的大小与这一组数据里每一个数据均有关系,任何一个数据变化都会相应地引起平均数的变化. (3)中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响.中位数可能在所给的数据中,也可能不在所给 的数据中.当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势. (4)众数考察各数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中有不少数据重复出现时,众数往往 更能反映问题. 5.三种数字特征的优缺点:
数学课件:2-2-2-用样本的数字特征估计总体的数字特征
3.平均数 (1)定义:一组数据的和与这组数据的个数的商.数据
x1+x2+„+xn n x1,x2,„,xn的平均数为 x n= .
(2)特征:平均数对数据有“取齐”的作用,代表该组数 据的 平均水平. 任何一个数据的改变都会引起平均数的变 化,这是众数和中位数都不具有的性质.所以与众数、中位 数比较起来,平均数可以反映出更多的关于样本数据全体的
小.
现有10个数,其平均数为3,且这10个数的平方和是 100,那么这个数组的标准差是( A.1 B.2 ) C .3 D.4
[答案] A
[解析] 32=1.
1 2 2 1 2 2 2 由s = (x1+x2+„+xn)- x ,得s = ×100- n 10
2
5.方差 (1)定义:标准差的平方,
4.标准差 (1)定义:标准差是样本数据到平均数的一种平均距离, 一般用s表示,通常用以下公式来计算
1 2 2 2 [ x 1- x +x2- x +„+xn- x ] n .
s=
可以用计算器或计算机计算标准差.
(2)特征:标准差描述一组数据围绕 平均数 波动的大小, 反映了一组数据变化的幅度和离散程度的大小.标准差较 大,数据的离散程度较大 ;,4,3,5的众数是________.
[答案] 5
[解析] 在该组数据中,3出现两次,2,4,7分别出现一
次,5出现三次,5出现的次数最多,所以5为众数.
2.中位数 (1)定义:一组数据按从小到大的顺序排成一列,处于
中间 位置的数称为这组数据的中位数.
(2)特征:一组数据中的中位数是 唯一 的,反映了该组数 据的 集中趋势. 在频率分布直方图中,中位数左边和右边的 直方图的面积 相等.
第二章
2.2.2-用样本的数字特征估计总体的数字特征第1课时
2.2.2 用样本的数字特征估计总体的数字特征教学目标:1.掌握众数、中位数、平均数的定义和特征。
2.会求众数、中位数、平均数并能用来解决有关问题。
3.理解用样本的数字特征估计总体的数字特征方法。
重点难点教学重点:根据实际问题对样本数据中提取基本的数据特征并作出合理解释,估计总体的基本数字特征;教学难点:在频率分布直方图中分析出众数、中位数、平均数。
教学过程导入新课在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员:7,8,6,8,6,5,8,10,7,4;乙运动员:9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究.——用样本的数字特征估计总体的数字特征.(板书课题)提出问题(1)什么是众数、中位数、平均数?众数:在一组数据中,出现次数最多的数称为众数。
中位数:一组数据按大小排列居中的一个数据是中位数,如果这组数据是偶数个,则居中的两个数的平均数是中位数。
平均数平均数是指一组数据中所有数据之和再除以数据的个数。
这些数字都能够为我们提供关于样本数据的特征信息。
(2)如何从频率分布直方图中估计众数、中位数、平均数?请学生翻开课本67页,看图2.2-1,回答图中众数是多少?月均用水量的众数是2.25 t(最高的矩形的中点),它告诉我们,该市的月均用水量为2.25 t的居民数比月均用水量为其他值的居民数多。
请学生翻开课本67页,看图2.2-1,回答图中中位数是多少?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.由此可以估计出中位数的值为2.02t.请学生翻开课本67页,看图2.2-1,回答图中平均数是多少?同样的,可以从频率分布直方图中估计平均数,上图就显示了居民用水的平均数,它等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.由估计可知,居民的月均用水量的平均值为2.02 t.由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数、众数都不具有的性质.(请学生举一下例子)总结利用频率分布直方图估计众数、中位数、平均数的方法。
2.2.2 用样本的数字特征估计总体的数字特征 课件
s乙
4
5
6
7
8
9
10
例题1:画出下列四组样本数据的直方图 说明它们的异同点. 例题 画出下列四组样本数据的直方图,说明它们的异同点 画出下列四组样本数据的直方图 说明它们的异同点 (1) 5, 5, 5, 5, 5, 5, 5, 5, 5; (2) 4, 4, 4, 5 , 5, 5, 6, 6, 6; (3) 3 , 3 , 4 , 4 , 5, 6 , 6, 7 , 7; (4) 2 , 2 , 2 , 2, 5 , 8 , 8 , 8 , 8 ; 四组样本数据的直方图是: 解:四组样本数据的直方图是 四组样本数据的直方图是 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 o 频率
−
−
x =5
S=0.82
−
x=5
S=1.49
1 2 3 45 (2)
6 7 8
1 2 3 45
6 7 8
x =5
S=2.83
1 2 3 4 5 6 7 8
四组数据的平均数都是5.0,标准差分别是 标准差分别是0.00,0.82, 四组数据的平均数都是 标准差分别是 1.49,2.83.虽然它们有相同的平均数 但是它们有不 虽然它们有相同的平均数,但是它们有不 虽然它们有相同的平均数 同的标准差,说明数据的分散程度是不一样的 说明数据的分散程度是不一样的. 同的标准差 说明数据的分散程度是不一样的 标准差还可以用于对样本数据的另外一种解释.例如 标准差还可以用于对样本数据的另外一种解释 例如, 例如 − x 在关于居民月均用水量的例子中,平均数 在关于居民月均用水量的例子中 平均数 = 1.973 标准差s=0.868 ,所以 标准差 所以 − −
2.2.2-1用样本的数字特征估计总体的数字特征(公开课原)
频率 组距
频率分布直方图
众数?
0.6 0.5 0.4 0.3 0.2 0.1 0
0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
归纳总结得:
因为在频率分布直方图中,各小长方形 的面积表示相应各组的频率,也显示出样本 数据落在各小组的比例的大小,所以从图中 可以看到,在区间[2,2.5)的小长方形的面 积最大,即这组的频率是最大的,也就是说 月均用水量在区间[2,2.5)内的居民最多, 即众数就是在区间[2,2.5)内。 众数在样本数据的频率分布直方图中, 就是最高矩形的中点的横坐标。
0.6 0.5 0.4 0.3
0.22 0.25
提示:与小长 方形面积的比 例有关吗?
0.2
0.15
0.14 0.08 0.04
0.1 0
0.06 1
0.5 0.5 0.75
.
.
.
1.25
1.5
.
1.75
2
2.5 2.25 2.75
.
.
3
3.5 3.25 3.75
.
0.04
.
0.02 4 4.5 4.25
答:
我认为这句话是这样解释的:这个企 业的老板以员工平均工资收入水平去描述 他们单位的收入情况。我觉得这是不合理 的,因为这些员工当中,少数经理层次的 收入与大多数一般员工收入的差别比较大, 所以平均数不能反映该单位员工的收入水 平。这个老板的话有误导与蒙骗行为。
3、思考讨论
假设你是一名交通部门的工作人员,你 打算向市长报告国家对本市26个公路项目 投资的平均资金数额,其中一条新公路的 建设投资为2000万元人民币,另外25个项 目的投资是20~100万元。中位数是25万元, 平均数是100万元,众数是20万元。你会 选择哪一种数据特征来表示国家对每一个 项目投资的平均金额?你选择这种数字特 征的缺点是什么?
必修三2-2-2用样本的数字特征估计总体的数字特征
课前探究学习
课堂讲练互动
活页规范训练
规律方法 1.中位数的求法 (1)当数据个数为奇数时,中位数是按从小到大顺序排列 的中间那个数. (2)当数据个数为偶数时,中位数为排列的最中间的两个 数的平均数. 2.深刻理解和把握平均数、中位数、众数在反映样本数 据上的特点,并结合实际情况,灵活应用.
课前探究学习
课堂讲练互动
活页规范训练
自学导引
众数、中位数、平均数的概念 1. 次数 最多的数称为这组数据的 (1)众数:一组数据中出现_____ 众数.一组数据中的众数可能不止一个,也可能没有.众 集中趋势 .在频率分布直方图中, 数反映了该组数据的_________ 中点 就是数据的众数. 最高矩形的_____ (2)中位数:一组数据按从小到大的顺序排成一列,处于 _____ 中间 位置的数称为这组数据的中位数(或两个数据的平均 数).一组数据中的中位数是唯一的,反映了该组数据的 集中趋势.在频率分布直方图中,中位数左边和右边的直 方图的面积_____ 相等 .
课前探究学习 课堂讲练互动 活页规范训练
1 解 (1) 利 用 平 均 数 计 算 公 式 得 x = (82×27 + 48 80×21)≈81.13(分). (2)∵男同学的中位数是75, ∴至少有14人得分不超过75分.
又∵女同学的中位数是80, ∴至少有11人得分不超过80分. ∴全班至少有25人得分低于80分(含80分). (3)男同学的平均分与中位数的差别较大,说明男同学中 两极分化现象严重,得分高的和低的相差较大.
课前探究学习
课堂讲练互动
活页规范训练
(4)数据的离散程度可以通过极差、方差或标准差来描 述.极差反映了一组数据变化的最大幅度,它对一组数据 中的极端值非常敏感,方差则反映了一组数据围绕平均数 波动的大小.为了得到以样本数据的单位表示的波动幅 度,通常用标准差——样本方差的算术平方根来描述. (5)标准差的大小不会越过极差. (6)方差、标准差、极差的取值范围:[0,+∞).当标准 差、方差为0时,样本各数据全相等,表明数据没有波动 幅度,数据没有离散性. (7)因为方差与原始数据的单位不同,且平方后可能夸大 了偏差的程度,所以虽然方差和标准差在刻画样本数据的 分散程度上是一样的,但在解决实际问题时,一般采用标 准差.
山东省高中数学《2.2.2 用样本的数字特征估计总体的数字特征》教案2 新人教A版必修3
第2课时标准差导入新课思路1平均数为我们提供了样本数据的重要信息,但是,有时平均数也会使我们作出对总体的片面判断.某地区的统计显示,该地区的中学生的平均身高为176 cm,给我们的印象是该地区的中学生生长发育好,身高较高.但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态.所以我们学习从另外的角度来考察样本数据的统计量——标准差.(教师板书课题)思路2在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员:7,8,7,9,5,4,9,10,7,4;乙运动员:9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?我们知道,x甲=7,x乙=7.两个人射击的平均成绩是一样的.那么,是否两个人就没有水平差距呢?从上图直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据——标准差.推进新课新知探究提出问题(1)如何通过频率分布直方图估计数字特征(中位数、众数、平均数)?(2)有甲、乙两种钢筋,现从中各抽取一个标本(如下表)检查它们的抗拉强度(单位:kg/mm2),通过计算发现,两个样本的平均数均为125.甲110 121312512125135125135125乙115 112513115125125145125145哪种钢筋的质量较好?(3)某种子公司为了在当地推行两种新水稻品种,对甲、乙两种水稻进行了连续7年的种植对比实验,年亩产量分别如下:(千克)甲:600, 880, 880, 620, 960, 570, 900(平均773)乙:800, 860, 850, 750, 750, 800, 700(平均787)请你用所学统计学的知识,说明选择哪种品种推广更好?(4)全面建设小康社会是我们党和政府的工作重心,某市按当地物价水平计算,人均年收入达到1.5万元的家庭即达到小康生活水平.民政局对该市100户家庭进行调查统计,它们的人均收入达到了1.6万元,民政局即宣布该市民生活水平已达到小康水平,你认为这样的结论是否符合实际?(5)如何考查样本数据的分散程度的大小呢?把数据在坐标系中刻画出来,是否能直观地判断数据的离散程度?讨论结果:(1)利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点) 估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. (2)由上图可以看出,乙样本的最小值100低于甲样本的最小值110,乙样本的最大值145高于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定.我们把一组数据的最大值与最小值的差称为极差(range ).由上图可以看出,乙的极差较大,数据点较分散;甲的极差小,数据点较集中,这说明甲比乙稳定.运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论. (3)选择的依据应该是,产量高且稳产的品种,所以选择乙更为合理.(4)不符合实际.样本太小,没有代表性.若样本里有个别高收入者与多数低收入者差别太大.在统计学里,对统计数据的分析,需要结合实际,侧重于考察总体的相关数据特征.比如,市民平均收入问题,都是考察数据的分散程度.(5)把问题(3)中的数据在坐标系中刻画出来.我们可以很直观地知道,乙组数据比甲组数据更集中在平均数的附近,即乙的分散程度小, 如何用数字去刻画这种分散程度呢? 考察样本数据的分散程度的大小,最常用的统计量是方差和标准差.标准差:考察样本数据的分散程度的大小,最常用的统计量是标准差(standard deviation).标准差是样本数据到平均数的一种平均距离,一般用s 表示. 所谓“平均距离”,其含义可作如下理解:假设样本数据是x 1,x 2,…,x n ,x 表示这组数据的平均数.x i 到x 的距离是|x i -x |(i=1,2,…,n).于是,样本数据x 1,x 2,…,x n 到x 的“平均距离”是S=nx x x x x x n ||||||21-++-+- .由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差: s=])()()[(122221x x x x x x nn -++-+- .意义:标准差用来表示稳定性,标准差越大,数据的离散程度就越大,也就越不稳定.标准差越小,数据的离散程度就越小,也就越稳定.从标准差的定义可以看出,标准差s≥0,当s=0时,意味着所有的样本数据都等于样本平均数.标准差还可以用于对样本数据的另外一种解释.例如,在关于居民月均用水量的例子中,平均数x =1.973,标准差s=0.868,所以x +s=2.841,x +2s=3.709; x -s=1.105,x -2s=0.237.这100个数据中,在区间[x -2s,x +2s ]=[0.237,3.709]外的只有4个,也就是说,[x -2s, x +2s ]几乎包含了所有样本数据.从数学的角度考虑,人们有时用标准差的平方s 2——方差来代替标准差,作为测量样本数据分散程度的工具: s 2=n1[(x 1-x )2+(x 2-x )2+…+(x n -x )2].显然,在刻画样本数据的离散程度上,方差与标准差是一样的.但在解决实际问题时,一般多采用标准差.需要指出的是,现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.两者都是描述一组数据围绕平均数波动的大小,实际应用中比较广泛的是标准差.如导入中的运动员成绩的标准差的计算器计算.用计算器计算运动员甲的成绩的标准差的过程如下:即s 甲=2.用类似的方法,可得s 乙≈1.095.由s 甲>s 乙可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定. 应用示例思路1例1 画出下列四组样本数据的条形图,说明它们的异同点. (1)5,5,5,5,5,5,5,5,5; (2)4,4,4,5,5,5,6,6,6; (3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8. 分析:先画出数据的条形图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差.解:四组样本数据的条形图如下:四组数据的平均数都是5.0,标准差分别是:0.00,0.82,1.49,2.83. 它们有相同的平均数,但它们有不同的标准差,说明数据的分散程度是不一样的.例2 甲、乙两人同时生产内径为25.40 mm 的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm): 甲25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.39 乙25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 25.36 25.3425.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?分析:每一个工人生产的所有零件的内径尺寸组成一个总体.由于零件的生产标准已经给出(内径25.40 mm),生产质量可以从总体的平均数与标准差两个角度来衡量.总体的平均数与内径标准尺寸25.40 mm 的差异大时质量低,差异小时质量高;当总体的平均数与标准尺寸很接近时,总体的标准差小的时候质量高,标准差大的时候质量低.这样,比较两人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可.但是,这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本的平均数、标准差,以此作为两个总体之间差异的估计值. 解:用计算器计算可得甲x ≈25.401,乙x ≈25.406;s 甲≈0.037,s 乙≈0.068.从样本平均数看,甲生产的零件内径比乙的更接近内径标准(25.40 mm),但是差异很小;从样本标准差看,由于s 甲<s 乙,因此甲生产的零件内径比乙的稳定程度高得多.于是,可以作出判断,甲生产的零件的质量比乙的高一些.点评:从上述例子我们可以看到,对一名工人生产的零件内径(总体)的质量判断,与所抽取的零件内径(样本数据)直接相关.显然,我们可以从这名工人生产的零件中获取许多样本.这样,尽管总体是同一个,但由于样本不同,相应的样本频率分布与平均数、标准差等都会发生改变,这就会影响到我们对总体情况的估计.如果样本的代表性差,那么对总体所作出的估计就会产生偏差;样本没有代表性时,对总体作出错误估计的可能性就非常大.这也正是我们在前面讲随机抽样时反复强调样本代表性的理由.在实际操作中,为了减少错误的发生,条件许可时,通常采取适当增加样本容量的方法.当然,关键还是要改进抽样方法,提高样本的代表性. 变式训练某地区全体九年级的3 000名学生参加了一次科学测试,为了估计学生的成绩,从不同学校的不同程度的学生中抽取了100名学生的成绩如下:100分12人,90分30人,80分18人,70分24人,60分12人,50分4人.请根据以上数据估计该地区3 000名学生的平均分、合格率(60或60分以上均属合格). 解:运用计算器计算得:100450126024701880309012100⨯+⨯+⨯+⨯+⨯+⨯=79.40,(12+30+18+24+12)÷100=96%,所以样本的平均分是79.40分,合格率是96%,由此来估计总体3 000名学生的平均分是79.40分,合格率是96%.思路2例1 甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm 2),试根据这组数据估计哪一种水稻品种的产量比较稳定.品种 第1年 第2年 第3年 第4年 第5年 甲 9.8 9.9 10.1 10 10.2 乙9.410.310.89.79.8解:甲品种的样本平均数为10,样本方差为 [(9.8-10)2 +(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02. 乙品种的样本平均数也为10,样本方差为 [(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.24. 因为0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.例2 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差.天数151—180 181—210 211—240 241—270 271—300 301—330 331—360 361—390灯泡数1111820251672分析:用每一区间内的组中值作为相应日光灯的使用寿命,再求平均寿命. 解:各组中值分别为165,195,225,255,285,315,345,375,由此算得平均数约为165×1%+195 ×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天). 这些组中值的方差为1001×[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+25×(285-268)2+16×(315-268)2+7×(345-268)2+2×(375-268)2]=2 128.60(天2). 故所求的标准差约6.2128≈46(天).答:估计这种日光灯的平均使用寿命约为268天,标准差约为46天. 知能训练 (1)在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为____________.(2)若给定一组数据x 1,x 2,…,x n ,方差为s 2,则ax 1,ax 2,…,ax n 的方差是____________. (3)在相同条件下对自行车运动员甲、乙两人进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:甲 27 38 30 37 35 31 乙 33 29 38 34 28 36试判断选谁参加某项重大比赛更合适? 答案:(1)9.5,0.016 (2)a 2s 2(3)甲x =33,乙x =33,33734722=>=乙甲s s ,乙的成绩比甲稳定,应选乙参加比赛更合适. 拓展提升某养鱼专业户在一个养鱼池放入一批鱼苗,一年以后准备出售,为了在出售以前估计卖掉鱼后有多少收入,这个专业户已经了解到市场的销售价是每千克15元,请问,这个专业户还应该了解什么?怎样去了解?请你为他设计一个方案.解:这个专业户应了解鱼的总重量,可以先捕出一些鱼(设有x 条),作上标记后放回鱼塘,过一段时间再捕出一些鱼(设有a 条),观察其中带有标记的鱼的条数,作为一个样本来估计总体,则鱼塘中鱼的总条数鱼的条数鱼塘中所有带有标记的条鱼中带有标记的条数)(x aa =这样就可以求得总条数,同时把第二次捕出的鱼的平均重量求出来,就可以估计鱼塘中的平均重量,进而估计全部鱼的重量,最后估计出收入. 课堂小结1.用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数,平均数对数据有“取齐”的作用,代表一组数据的平均水平.用样本标准差估计总体标准差.样本容量越大,估计就越精确,标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度. 2.用样本估计总体的两个手段(用样本的频率分布估计总体的分布;用样本的数字特征估计总体的数字特征),需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本容量越大,估计的结果也就越精确. 作业习题2.2A 组4、5、6、7,B 组1、2.设计感想统计学科,最大的特点就是与现实生活的密切联系,也是新教材的亮点.仅仅想借助“死记硬背一些概念及公式,简单模仿课本例题”来学习,是绝对不行的.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差,其原因在于样本的随机性.这种偏差是不可避免的.虽然我们从样本数据得到的分布、均值和标准差并不是总体的真正分布、均值和标准差,而只是总体的一个估计,但这种估计是合理的,特别是当样本的容量很大时,它们确实反映了总体的信息.教师建议:亲身经历“提出问题,收集数据,分析数据,并作出合理决策”过程,在此过程中不仅可以加深对概念等知识的深刻理解,更重要的是发展了思维,培养了分析及解决问题能力,同时在情感、意志等领域也得到了协调发展,这才是学校学习的科学而全面的目标,习题设置有层次,尽量源于教材,又高于教材,这也是高考命题原则.。
2.2.2用样本的数字特征估计总体的数字特征课件人教新课标
[类题通法] 众数、中位数、平均数与频率分布直方图的关系
众数
众数是最高长方形底边的中点所对应的数据, 表示样本数据的中心值
[解] ①周平均收入 x 1=17(3 000+450+350+400+320+320+410)=750(元). ②这个平均收入不能反映打工人员的周收入水平,可以看出 打工人员的收入都低于平均收入,因为老板收入特别高,这是一 个异常值,对平均收入产生了较大的影响,并且他不是打工人员. ③去掉老板的收入后的周平均收入 x 2=16(450+350+400+ 320+320+410)=375(元).这能代表打工人员的周收入水平.
[例 1] (1)已知一组数据按从小到大排列为-1,0,4,
x,6,15 , 且 这 组 数 据 的 中 位 数 是 5 , 那 么 数 据 的 众 数 是
________,平均数是________. [解析] ∵中位数为 5,∴4+2 x=5,即 x=6
∴该组数据的众数为 6,平均数为-1+0+46+6+6+15
[对点训练]
从甲乙两个城市分别随机抽取 16 台自动售货机,对其销售额
进行统计,统计数据用茎叶图表示(如图所示),设甲、乙两
组数据的平均数分别为 x 甲, x 乙,中位数分别为 m 甲,m 乙,
则
()
A. x 甲< x 乙,m 甲>m 乙 C. x 甲> x 乙,m 甲>m 乙
B. x 甲< x 乙,m 甲<m 乙 D. x 甲> x 乙,m 甲<m 乙
2.2.2 用样本的数字特征估计总体的数字特征 课件
O 1 2 3 4 5 6 7 8 (2)
(3) 3,3,4,4,5,6,6,7,7; (4) 2,2,2,2,5,8,8,8,8.
频率
频率
x = 5
1.0 0.8 0.6 0.4 0.2
x= 5
1.0 0.8 0.6 0.4 0.2
s = 1.49
s = 2.83
O
1 2 3 4 5 6 7 8
思考8:一组数据的中位数一般不受少数几个极端值的 影响,这在某些情况下是一个优点,但它对极端值的不 敏感有时也会成为缺点,你能举例说明吗?样本数据的 平均数大于(或小于)中位数说明什么问题?你怎样理 解“我们单位的收入水平比别的单位高”这句话的含义? 如:样本数据收集有个别差错不影响中位数;大学 毕业生凭工资中位数找单位可能收入较低. 平均数大于(或小于)中位数,说明样本数据 中存在许多较大(或较小)的极端值. 这句话具有模糊性甚至蒙骗性,其中收入水平 是员工工资的某个中心点,它可以是众数、中位数 或平均数.
解:在17个数据中,1.75出现了4次,出现的次数最 多,即这组数据的众数是1.75. 上面表里的17个数据可看成是按从小到大的顺序排 列的,其中第9个数据1.70是最中间的一个数据,即这 组数据的中位数是1.70;
这组数据的平均数是
答:17名运动员成绩的众数、中位数、平均数依次是 1.75(米)、1.70(米)、1.69(米).
3、平均数
(1)x = 1/n(x1+x2+„„+xn)
练习: 在一次中学生田径运动会上,参加男子跳高 的17名运动员的成绩如下表所示:
成绩 (单位: 米)
1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90 2 3 2 3 4 1 1 1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
s
2
.
(2)新数据 ax1 , ax2 , , axn的平均数为 a x , 方差为 a 2 s 2 . (3)新数据 ax1 b, ax2 b, , axn b 的平均数为 ax b,方差为a 2 s 2 .
2、样本中位数不受少数极端值的影响,这 在某些情况下是一个优点,但它对极端值 的不敏感有时也会成为缺点。你能举例说 明吗? 答:优点:对极端数据不敏感的方法能够 有效地预防错误数据的影响。
对极端值不敏感有利的例子:例如当样本数据质 量比较差,即存在一些错误数据(如数据录入错 误、测量错误等)时,用抗极端数据强的中位数 表示数据的中心值更准确。
甲.乙两名射击队员,在进行的十次射击中成绩分别是: 甲: 10; 9; 8; 10; 8; 8; 10; 10; 9.5; 7.5
乙: 9; 9; 8,5; 9; 9; 9.5; 9.5; 8.5; 8.5; 9.5
试问二人谁发挥的水平较稳定?
分析:甲的平均成绩是9环.乙的平均成绩也是9环.
情境二:
1
1.5
2
2.5
3
3.5
4
4.5
月平均用水量(t)
可将众数看作直方图中面积最大长方形的“中心”
频率 组距
如何在频率分布直方图中估计中位数
0.6 0.5 0.4 0.3 0.2 0.1 0
前四个小矩形的 面积和=0.49
后四个小矩形的 面积和=0.26
0.25
0.22
0.15 0.08 0.04 0.5 1 1.5 2 2.5
极差体现了数据的离散程度
为了对两人射击水平的稳定程度,玉米生长的 高度差异以及钢筋质量优劣做个合理的评价,这 里我们引入了一个新的概念,方差和标准差.
设一组样本数据 x1,x2,…,xn ,其平均数为 x ,则
s
2
1 n
[( x 1 x ) ( x 2 x )
2
2
( xn x ) ]
如何在频率分布直方图中估计平均数
( x 1 x 2 x 100 )
x 1 4 8 100
1 100
( x 1 x 4 ) ( x 5 x 12 ) ( x 99
2 x 99 100
4 4 .5 2
因为 x 甲 小于 x 乙 ,所以甲水稻的产量比
较稳定。
三.当堂反馈
1、在一次歌手大奖赛上,七位评委为歌手打出的分 数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去 掉一个最高分和一个最低分后,所剩数据的平均值和 方差分别为_________________;
9.5,0.016
思考一下:
1、2.02这个中位数的估计值,与样本的中 位数值2.0不一样,你能解释其中原因吗? 答:2.02这个中位数的估计值,与样本的中 位数值2.0不一样,这是因为样本数据的 频率分布直方图,只是直观地表明分布的 形状,但是从直方图本身得不出原始的数 据内容,直方图已经损失一些样本信息。 所以由频率分布直方图得到的中位数估计 值往往与样本的实际中位数值不一致.
选择平均数更好:因为,此时的众数20万比中位数25万还小, 所以众数代表的是局部的数。中位数代表的虽然是大多数公路 投资的数额,但由于其不受极端值的影响,不能代表全体,因 而此时成了它的缺点。选择平均数较好,能比较好的代表整体 水平,但缺点是仍不能显示出具体的数字特征
(二)
一.实例引入 情境一;
在样本中中位数的左右各有50%的样本数, 条形面积各为0.5,所以反映在直方图中位数 左右的面积相等.
0 . 04 0 . 08 0 . 15 0 . 22 0 . 49
x 0 . 02
中位数
2 0 . 02 2 . 02
可将中位数看作整个直方图面积的“中心”
思考讨论以下问题:
问题1:众数、中位数、平均数这三个数 一般都会来自于同一个总体或样本,它们 能表明总体或样本的什么性质? 众数:反映的往往是局部较集中的数据信息
中位数:是位置型数,反映处于中间部位的 数据信息
平均数:反映所有数据的平均水平
1、求下列各组数据的众数
(1)、1 ,2,3,3,3,5,5,8,8,8,9,9 众数是:3和8 (2)、1 ,2,3,3,3,5,5,8,8,9,9 众数是:3 2、求下列各组数据的中位数
2
x乙
s乙
2
1 ( 9 . 4 10 . 3 10 . 8 9 . 7 9 . 8 ) 10 5
2 2 2 2 2
[( 9 . 4 10 ) (10 . 3 10 ) (10 . 8 10 ) ( 9 . 7 10 ) ( 9 . 8 10 ) ] 5 0 . 24
1
1.90
1
分别求这些运动员成绩的众数,中位数与平均数 。 解:在17个数据中,1.75出现了4次,出现的次数最多, 即这组数据的众数是1.75. 上面表里的17个数据可看成是按从小到大的顺序排 列的,其中第9个数据1.70是最中间的一个数据,即这组 数据的中位数是1.70; 这组数据的平均数是
x 1 17 (1 .5 0 2 1 .6 0 3 ... 1 .9 0 1) 1 .6 9 米
某农场种植了甲、乙两种玉米苗,从中各抽取 了10株,分别测得它们的株高如下:(单位cm)
甲: 31
乙: 53
32
16
35 37 33 30 32 31 30 29
54 13 66 16 13 11 16 62
哪种玉米苗长得高? 问: 哪种玉米苗长得齐?
x甲 =32
x乙 =32
怎 么 办 呢 ?
甲: 31 乙: 53 甲
32 16
35 54
37 13
33 66
30 16
32 13
31 11
30 16
29 62
29 32
37
乙
11 32 66
甲 乙
37(最大值) 66(最大值)
29(最小值) 11(最小值)
8 55
极 差
极差: 一组数据的最大值与最小值的差
极差越大,数据越分散,越不稳定 极差越小,数据越集中,越稳定
和中位数作为参考指标,选择平均工资较高且 中位数较大的公司就业.
三、 众数、中位数、平均数的简单应用
例1、下表是七位评委给某参赛选手的打分,总分为10分, 你认为如何计算这位选手的最后得分才较为合理?
评委 1号 打分 9.6
2号 9.3
3号 9.3
4号 9.6
5号 6号 9.9 9.3
7号 9.4
课堂练习: 1、假设你是一名交通部门的工作人员。你打算向市长报告国 家对本市26条公路项目投资的平均资金数额,其中一条新公 路的建设投资为2 200万元人民币,另外25个项目的投资在 20万与100万.中位数是25万,平均数是100万,众数是20万 元。你会选择哪一种数字特征来表示每一个项目的国家投资? 你选择这种数字特征的缺点是什么?
答:17名运动员成绩的众数、中位数、平均数依次是 1.75(米)、1.70(米)、1.69(米)。
二、众数、中位数、平均数与频率 分布直方图的关系
如何在频率分布直方图中估计众数
频率 组距
众数在样本数据的频率分布直方图中, 就是最高矩形的中点的横坐标。
0.5 0.4 0.3 0.2 0.1
O
0.5
x 100 )
x 5 12
0 .5 1 2
100
0 . 04
0 0 .5 2
平均数的估计值等于频率分 布直方图中每个小矩形的面 积乘以小矩形底边中点的横 坐标之和。
0 . 08
0 . 02
=2.02
可将平均数看作整个直方图面积的“重心”
思考讨论以下问题:
(1)、1 ,2,3,3,3,4,6,8,8,8,9,9 中位数是:5 (2)1 ,2,3,3,3,4,8,8,8,9,9 中位数是:4
3、在一次中学生田径运动会上,参加男子跳高的17名 运动员的成绩如下表所示:
成绩(米)
人数
1.50 1.60
2 3
1.65
2
1.70
3
1.75
4
1.80
1
1.85
a3 2、已知数据 a 1 , a 2 ,的方差为 2,则求数据 的方差。
2 a1 , 2 a 2 , 2 a 3
方差的运算性质: 如果数据 x1 , x2 , , xn 的平均数为 x , 2 方差为 s ,则 (1)新数据 x1 b, x2 b, , xn b 的平均数为
缺点:(1)出现错误的数据也不知道; (2)对极端值不敏感有弊的例子:某人具 有初级计算机专业技术水平,想找一份收 入好的工作。这时如果采用各个公司计算 机专业技术人员收入的中位数作为选择工 作的参考指标就会冒这样的风险:
很可能所选择公司的初级计算机专业技术水平 人员的收入很低,其原因是中位数对极小的数 据不敏感。这里更好的方法是同时用平均工资
例1.计算数据89,93,88,91,94,90,88,87的 方差和标准差。(标准差结果精确到0.1)
解:x
90
1 8
( 1 3 2 1 4 0 2 3) 9 0
.
所以这组数据的方差为5.5,标准差为2.3 . 见课本76-77页
练习:若甲、乙两队比赛情况如下,下列说法哪些 说法是不正确的:
0.14 0.06 0.04 3 3.5 4 0.02
4.5
2.02
月均用水量/t
分组 [0, 0.5) [0.5, 1) [1, 1.5) [1.5, 2) [2, 2.5) [2.5, 3) [3,, 3.5) [3.5, 4) [4,) 4.5]