用样本的数字特征估计总体的数字特征方差标准差
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x1xx2xxnx
S
.
n
方差、标准差是样本数据到平均数的一种 平均距离。它用来描述样本数据的分散程度。 在实际应用中,标准差常被理解为稳定性。
假设样本数据是 x1,x2,xn, 平均数是 x
1、方差(标准差的平方)公式为:
s2 1 n [x 1 ( x )2 (x 2 x )2 (x n x )2 ]
2、标准差公式为:
s1 n[x (1x)2(x2x)2 (xnx)2]
在刻画样本数据分散程度上,两者是一致的!
如 试比较以下两组样本数据的分散程度 101,98,102,100,99 1 ,3 ,5 ,7 ,9
经验总结: 标准差用来描述样本数据的分散程度。
标准差
方差、标准差是样本数据到平均数的一种平均 距离。它用来描述样本数据的离散程度。在实际应 用中,标准差常被理解为稳定性。
规律:标准差越大, 则a越大,数据的 离散程度越大;反 之,数据的离散程 度越小。
性质归纳:kan b的平均数和方差:
已a1 知 , a2, , an的平均 3,数 方2. 是 差 则 a1b, a2b, , anb的平均 3b, 数 方差 2. 是 k1 , ak2 , a , kn 的 a 平3均 , k 数 方 2是 2 . k 差
数学应用:
例1、已知有一个样本的数据为1,2,3, 4,5,求平均数,方差,标准差。
解:平均数 x 3,
方 S 2 1 ( 差 1 3 ) 2 ( 2 3 ) 2 ( 3 3 ) 2 ( 4 3 ) 2 ( 5 3 ) 2 5 2.
标准S差 2.
例2 甲乙两人同时生产内径为25.40mm的一种零件.为 了对两人的生产质量进行评比,从他们生产的零件中各 抽出20件,量得其内径尺寸如下(单位:mm) 甲 25.46, 25.32, 25.45, 25.39, 25.36
标准差是样本平均数的一种平均距离,一般用s表示.
所谓“平均距离”,其含义可作如下理解:
xx xx x x
假 设 样 本 数 据 是 1 ,2 , . . . n,表 示 这 组 数 据 的 平 均 数 , i到
, 的 距 离 是
-
xi - x(i= 1,2,…,n).
-
于 是 样 本 数 据 x 1 , x 2 , x n 到 x 的 “ 平 均 距 离 ” 是
x甲 7
x乙 7
两人射击 的平均成绩是一样的. 那么两个
人的水平就没有什么差异吗?
频率
0.3
0.2
0.1
频率
4 5 6 7 8 9 10
(甲)
0.4 0.3 0.2 0.1
4 5 6 7 8 9 10 (乙)
发现什么?
环数
为此,我们还 需要从另外一 个角度去考察 这两组数据!
环数
直观上看,还是有差异的.如:甲成绩比较分散, 乙成绩相对集中(如图示).因此,我们还需要从另外的 角度来考察这两组数据.例如:在作统计图,表时提到 过的极差.
• [正解] 小明5次考试成绩,从小到大排列为 45,93,95,96,98,中位数是95,应评定为“ 优秀”.
新课引入
样本的众数、中位数和平均数常用来表示样本 数据的“中心值”,其中众数和中位数容易计算, 不受少数几个极端值的影响,但只能表达样本数据 中的少量信息. 平均数代表了数据更多的信息,但 受样本中每个数据的影响,越极端的数据对平均数 的影响也越大.当样本数据质量比较差时,使用众数、 中位数或平均数描述数据的中心位置,可能与实际 情况产生较大的误差,难以反映样本数据的实际状 况,因此,我们需要一个统计数字刻画样本数据的 离散程度.
二 、众数、中位数、平均数与频率分布直方图的关系
1、众数在样本数据的频率分布直方图中,就是最高 矩形的中点的横坐标。
2、在频率分布直方图中,中位数左边和右边的直方 图的面积相等!
3、将频率分布直方图中每个小矩形的面积与小矩形 底边中点的横坐标之积相加,就是样本数据的估值平 均数.
小明是班里的优秀学生,他的历次数学成绩是 96,98,95,93分,但最近的一次考试成绩只有45 分,原因是他带病参加了考试.期末评价时, 怎样给小明评价?
[错解] 这五次数学考试的平均分是
96+98+955+93+45 = 85.4 , 则 按 平 均 分 给 小 明 一 个 “ 良
好”.
• [错因分析] 这种评价是不合理的,尽管平 均分是反映一组数据平均水平的重要特征, 但任何一个数据的改变都会引起它的变化, 而中位数则不受某些极端值的影响.本题中 的5个成绩从小到大排列为:45,93,95,96,98 ;中位数是95,较为合理地反映了小明的数 学水平,因而应该用中位数来衡量小明的数 学成绩.
用样本的数字特征估计总体 的数字特征方差标准差
复习回顾
一.什么是一组数据的众数、中位数及平均数?
众数:一组数据中出现次数最多的数据。
中位数:把数据从小到大排列,若数据个数为奇数 个,最中间的数据就是中位数;若数据个数为偶数 个,则最中间两位数据的平均数就是中位数。
平均数:各数据总和除以数据个数所得的商.
问题提பைடு நூலகம்:
有两位射击运动员在一次射击测试中 各射靶十次,每次命中的环数如下: 甲 74 84 75 97 57 47 98 190 97 104 乙 95 56 76 87 77 67 87 68 87 97
如果你是教练,你应当如何对这次射击情 况作出评价?如果这是一次选拔性考核,你应 当如何作出选择?
25.34, 25.42, 25.45, 25.38, 25.42 25.39, 25.43, 25.39, 25.40, 25.44 25.40, 25.42, 25.35, 25.41, 25.39
乙 25.40, 25.43, 25.44, 25.48, 25.48 25.47, 25.49, 25.49, 25.36, 25.34 25.33, 25.43, 25.43, 25.32, 25.47 25.31, 25.32, 25.32, 25.32, 25.48
甲的环数极差=10-4=6
乙的环数极差=9-5=4.
它们在一定程度上表明了样本数据的分散程度,与 平均数一起,可以给我们许多关于样本数据的信息.显 然,极差对极端值非常敏感,注意到这一点,我们可以 得到一种“去掉一个最高分,去掉一个最低分”的统计 策略.
课程讲授
考察样本数据的分散程度的大小,最常用的统计量 是标准差.