数据的数字特征
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
极差和方差来反映离散程度
问题1 在上一节中,从甲乙两个城市随机抽取的
16台自动售货机的销售额可以甲用的茎中叶位数图:表1示8 2如2 下
众数:10 18 30
1极°差甲分乙别两是组多数少据?的中位数众甲数乙的的平众8中极均数8位甲差84数:06数::250:352320132.478
乙
31
028
2°你能从上图中分别比较甲乙的方平差极均:差7数2051::002.3298823.6
乙 1 40 40 40 40 39.9 40 10 0.06
方法4
甲 1 40 40 3 39.8 40 3 39.8 40 3 10 0.005 (mm 2 )
乙
1 40 40 3 40 40 3 39.9 40 3
10 0.0006 (mm 2 )
直径/mm
你能选择适当的数分别表示这两组数据吗?
40.3 40.2 40.1
40 39.9 39.8 39.7 39.6
1 2 3 4 5 6 7 8 9 10
产品编号
它们的平均数都是40,因此仅用平均水平还 难以准确地刻画一组数据
方法1(极差)
甲:40.2-39.8=0.4
乙:40.1-39.9=0.2
02337 12448
乙两组数据的平均数和方差 的大小吗?
方差:131581.245
238
例1某某公公司司员员工工的的月月工工资资情情况况如如表表:: 我的工资 是2000
我的工资是 1500
职员c
我的工 资是 4000
职员D
我的可以拿 到???
工程师
应聘者
月工资/元 8000 5000 4000 2000 1000 800 700 600 500
2、避免过于复杂、烦琐的计算 我们采用excel计算数据 http://www.hongen.com/pc/oa/excel2k/ex2k0101.htm
从某个确定的时间“开始”计时,经过一段时间 后叫“停止”,试估计这段时长
1°记录下你的估计时间;
2°汇总全班同学的估计时间,并利用适当的统计 图表刻划它;
甲:s=0.16(mm) 乙:s=0.077(mm)
因为甲的标准差比乙大,因此乙更稳定
1、对数据数字特征内容的评价,应当更多地 关注对其本身意义的理解和在新情境中的应 用,而不是记忆和使用的熟练程度.因此, 在分析数据的过程中,要理解数据的平均值 和标准差在此处的意义,再对估计结果作出客 观的评判
如果你应聘该公司,你怎样看待公司员工的收入情况?
平均数是将所有的数据都考虑进去得到的度 量,它是反映数据集中趋势最常用的统计量; 中位数将观测数据分成相同数目的两部分, 其中一部分都比这个数小而另一部分都比这 个数大,对于非对称的数据集,中位数更实 际地描述了数据的中心;当变量是分类变量 时,众数往往经常被使用
员工数/人 1
2
4 6 12 8 20 5 2
(1)分别计算该公司员工月工资的平均数、中位数和众数。
(2)公司经理会选取上面哪个来代表该公司员工的月工资情 况,税务官呢?工会领导呢?
分析:1.根据平均数、中位数的计算公式,可以算出平均数 为:1373元,中位数为:800元,众数为:700元
2.不同身份的人代表不同阶层人的利益,对公司领导平均数 好,对税务官中位数比较好,对工会领导众数即使他的选择
例2 甲乙两台机床同时生产直径为40mm的零件,为 了检验产品的质量,从两台机床生产的产品中个抽 取10件进行测量,结果如下:
甲/mm
40.0 39.8 40.1 40.2 39.9 40.0 40.2 39.8 40.2 39.8
乙/mm
40.0 40.0 39.9 40.0 39.9 40.1 40.1 40.1 40.0 39.9
用不同的方式刻画数据离散程度,其理想的形式满 足一下三条 :
1°应充分利用数据,以便提供更确却的信息 2°仅用一个数据来刻画数据的离散程度 3°对于不同的数据,当离散程度大时,该数亦大
问题这么多方式都可以表达,那么什么方式表 达最好呢?
方法1(即极差)因为极差对极值过于敏感,显然不满足第一条 原则,因此有时我们去掉最小的25%的数据与最大的25%的数 据,然后求出剩下的中间数据的极差,这中间50%数据的极差, 我们称之为四分位数极差
偶数个数时,中位数有2个
④众数:就是一组数据中出现次数最多的数.
⑤极差:就是一组数据中最大数与最小数之间的差.
⑥方差:就是一组数据中所有数与平均数的差的平 方和的平均数.设有n个数据x1,x2,…,xn,这组数 据的方差为:
s2 (x1 x)2 (x2 x)2 (xn x)2 n
其中平均数、加权平均数、中位数或众数反映集中趋势
方法2(方差)
甲: s甲2
1 [(40 40)2 10
39.8 402
39.8 402 ]
=0.026(m㎡)
乙
s甲2
1 [(40 40)2 10
40 402
39.9 402 ]
=0.006(m㎡)
方法3
甲 1 40 40 39.8 40 39.8 40 10 0.14
②加权平均数:就是一组数据的加权平均.设有 n个数据x1,x2,…,xn,它们的权分别为l1, l2,…,ln,这组数据的加权平均数为:
x x1l1 x2l2 xnln
由此可以看出,平均数是加权平均数的一个特例, 也就是说,它们的权都是1/n ③中位数:就是一组数据按照从小到大或从大到小的 顺序进行排列时,处于中间位置的数. 奇数个数时,中位数有1个
3°计算这些数据的平均值、标准差,并与确却的 时间进行比较,你会发现什么?
数据的数字特征
Data’s characteristic
复习回顾 前面我们学习了利用统计图表显示数据的特征
条形统计图
统计图
折线统计图 扇形统计图
茎叶图
数据的特征除了利用统计图表外,还可以利用一些统计量 来表述,前面我们在表示数据的集中趋势和离散程度时, 我们利用平均数、中位数,众数、极差、方差等来表示。
方法3(即绝对差)满足理想形式的三条原则,它也是刻画
数据离散程度的标一种准方差法:,但方是差在的实际平中方,根人们更多使用的
是标准差
其主要原因是:从数学上来说,二次函数的性质比绝 对值函数要好,比较方便运算
问题3 分别计算上题中的甲乙车床的标准差? 根据标准差计算公式
s (x1 x)2 (x2 x)2 (xn x)2 n
①平均数:就是一组数据的平均,设有n个数据, x1 ,x2, …,xn,这组数据的平均数为:
x x1 x2 xn n
特别地,如果上面n个数据中不同数据x1,x2,…,xn的个 数分别为k1,k2,…,kn,那么它们的平均数为
x x1k1 x2k2 xnkn k1 kቤተ መጻሕፍቲ ባይዱ kn
问题1 在上一节中,从甲乙两个城市随机抽取的
16台自动售货机的销售额可以甲用的茎中叶位数图:表1示8 2如2 下
众数:10 18 30
1极°差甲分乙别两是组多数少据?的中位数众甲数乙的的平众8中极均数8位甲差84数:06数::250:352320132.478
乙
31
028
2°你能从上图中分别比较甲乙的方平差极均:差7数2051::002.3298823.6
乙 1 40 40 40 40 39.9 40 10 0.06
方法4
甲 1 40 40 3 39.8 40 3 39.8 40 3 10 0.005 (mm 2 )
乙
1 40 40 3 40 40 3 39.9 40 3
10 0.0006 (mm 2 )
直径/mm
你能选择适当的数分别表示这两组数据吗?
40.3 40.2 40.1
40 39.9 39.8 39.7 39.6
1 2 3 4 5 6 7 8 9 10
产品编号
它们的平均数都是40,因此仅用平均水平还 难以准确地刻画一组数据
方法1(极差)
甲:40.2-39.8=0.4
乙:40.1-39.9=0.2
02337 12448
乙两组数据的平均数和方差 的大小吗?
方差:131581.245
238
例1某某公公司司员员工工的的月月工工资资情情况况如如表表:: 我的工资 是2000
我的工资是 1500
职员c
我的工 资是 4000
职员D
我的可以拿 到???
工程师
应聘者
月工资/元 8000 5000 4000 2000 1000 800 700 600 500
2、避免过于复杂、烦琐的计算 我们采用excel计算数据 http://www.hongen.com/pc/oa/excel2k/ex2k0101.htm
从某个确定的时间“开始”计时,经过一段时间 后叫“停止”,试估计这段时长
1°记录下你的估计时间;
2°汇总全班同学的估计时间,并利用适当的统计 图表刻划它;
甲:s=0.16(mm) 乙:s=0.077(mm)
因为甲的标准差比乙大,因此乙更稳定
1、对数据数字特征内容的评价,应当更多地 关注对其本身意义的理解和在新情境中的应 用,而不是记忆和使用的熟练程度.因此, 在分析数据的过程中,要理解数据的平均值 和标准差在此处的意义,再对估计结果作出客 观的评判
如果你应聘该公司,你怎样看待公司员工的收入情况?
平均数是将所有的数据都考虑进去得到的度 量,它是反映数据集中趋势最常用的统计量; 中位数将观测数据分成相同数目的两部分, 其中一部分都比这个数小而另一部分都比这 个数大,对于非对称的数据集,中位数更实 际地描述了数据的中心;当变量是分类变量 时,众数往往经常被使用
员工数/人 1
2
4 6 12 8 20 5 2
(1)分别计算该公司员工月工资的平均数、中位数和众数。
(2)公司经理会选取上面哪个来代表该公司员工的月工资情 况,税务官呢?工会领导呢?
分析:1.根据平均数、中位数的计算公式,可以算出平均数 为:1373元,中位数为:800元,众数为:700元
2.不同身份的人代表不同阶层人的利益,对公司领导平均数 好,对税务官中位数比较好,对工会领导众数即使他的选择
例2 甲乙两台机床同时生产直径为40mm的零件,为 了检验产品的质量,从两台机床生产的产品中个抽 取10件进行测量,结果如下:
甲/mm
40.0 39.8 40.1 40.2 39.9 40.0 40.2 39.8 40.2 39.8
乙/mm
40.0 40.0 39.9 40.0 39.9 40.1 40.1 40.1 40.0 39.9
用不同的方式刻画数据离散程度,其理想的形式满 足一下三条 :
1°应充分利用数据,以便提供更确却的信息 2°仅用一个数据来刻画数据的离散程度 3°对于不同的数据,当离散程度大时,该数亦大
问题这么多方式都可以表达,那么什么方式表 达最好呢?
方法1(即极差)因为极差对极值过于敏感,显然不满足第一条 原则,因此有时我们去掉最小的25%的数据与最大的25%的数 据,然后求出剩下的中间数据的极差,这中间50%数据的极差, 我们称之为四分位数极差
偶数个数时,中位数有2个
④众数:就是一组数据中出现次数最多的数.
⑤极差:就是一组数据中最大数与最小数之间的差.
⑥方差:就是一组数据中所有数与平均数的差的平 方和的平均数.设有n个数据x1,x2,…,xn,这组数 据的方差为:
s2 (x1 x)2 (x2 x)2 (xn x)2 n
其中平均数、加权平均数、中位数或众数反映集中趋势
方法2(方差)
甲: s甲2
1 [(40 40)2 10
39.8 402
39.8 402 ]
=0.026(m㎡)
乙
s甲2
1 [(40 40)2 10
40 402
39.9 402 ]
=0.006(m㎡)
方法3
甲 1 40 40 39.8 40 39.8 40 10 0.14
②加权平均数:就是一组数据的加权平均.设有 n个数据x1,x2,…,xn,它们的权分别为l1, l2,…,ln,这组数据的加权平均数为:
x x1l1 x2l2 xnln
由此可以看出,平均数是加权平均数的一个特例, 也就是说,它们的权都是1/n ③中位数:就是一组数据按照从小到大或从大到小的 顺序进行排列时,处于中间位置的数. 奇数个数时,中位数有1个
3°计算这些数据的平均值、标准差,并与确却的 时间进行比较,你会发现什么?
数据的数字特征
Data’s characteristic
复习回顾 前面我们学习了利用统计图表显示数据的特征
条形统计图
统计图
折线统计图 扇形统计图
茎叶图
数据的特征除了利用统计图表外,还可以利用一些统计量 来表述,前面我们在表示数据的集中趋势和离散程度时, 我们利用平均数、中位数,众数、极差、方差等来表示。
方法3(即绝对差)满足理想形式的三条原则,它也是刻画
数据离散程度的标一种准方差法:,但方是差在的实际平中方,根人们更多使用的
是标准差
其主要原因是:从数学上来说,二次函数的性质比绝 对值函数要好,比较方便运算
问题3 分别计算上题中的甲乙车床的标准差? 根据标准差计算公式
s (x1 x)2 (x2 x)2 (xn x)2 n
①平均数:就是一组数据的平均,设有n个数据, x1 ,x2, …,xn,这组数据的平均数为:
x x1 x2 xn n
特别地,如果上面n个数据中不同数据x1,x2,…,xn的个 数分别为k1,k2,…,kn,那么它们的平均数为
x x1k1 x2k2 xnkn k1 kቤተ መጻሕፍቲ ባይዱ kn