数据的数字特征
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例2、 在上一节中,从甲乙两个城市随机抽取的 甲的中位数:20 16台自动售货机的销售额可以用茎叶图表示如下
众数:10 18 30 极差:53 1°甲乙两组数据的中位数众数 乙的中位数:29 极差分别是多少? 众数:23 34 极差:38
甲 865 0 2°你能从上图中分别比较甲 甲的平均数: 8 8 4 0 0 22.8 1 52 2 乙两组数据的平均数和方差 方差:7210.9 0 0 28.6 3 乙的平均数: 的大小吗? 31 4 方差:115.2 8 5
方法2(方差) 1 2 2 2 2 s [( 40 40 ) 39 . 8 40 39 . 8 40 ] 甲: 甲 10
=0.026(m㎡) 乙 s 2 1 [( 40 40 ) 2 40 40 2 39 .9 40 2 ] 甲
你能选择适当的数分别表示这两组数据吗?
40.3 40.2 40.1 40 39.9 39.8 39.7 39.6 1 2 3 4 5 6 7 产品编号 8 9 10
直径/mm
它们的平均数都是40,因此仅用平均水平还 难以准确地刻画一组数据
方法1(极差) 甲:40.2-39.8=0.4 乙:40.1-39.9=0.2
该数亦大
问题这么多方式都可以表达,那么什么方式表达最好呢?
方法1(即极差)因为极差对极值过于敏感,显然不满足第一条原则。 方法2(即方差)满足理想形式的三条原则,它是刻画数据离散程度的一 种方法,但是它的单位是原观测数据的单位的平方。 方法3(即绝对差)满足理想形式的三条原则,它也是刻画数据离散程度 的一种方法。 方法4、满足理想形式的三条原则,它也是刻画数据离散程度的一种方法。 但运算量大。
如果你应聘该公司,你怎样看待公司员工的收入情况?
平均数是将所有的数据都考虑进去得到的度 量,它是反映数据集中趋势最常用的统计量; 中位数将观测数据分成相同数目的两部分, 其中一部分都比这个数小而另一部分都比这 个数大,对于非对称的数据集,中位数更实 际地描述了数据的中心;当变量是分类变量 时,众数往往经常被使用
乙
1 3 3 3 40 40 40 40 39.9 40 10 2 0.0006 (m m )
用不同的方式刻画数据离散程度,其理想的形式满 足一下三条 :
1°应充分利用数据,以便提供更确却的信息 2°仅用一个数据来刻画数据的离散程度
3°对于不同的数据,当离散程度大时,
乙
028 02337 12448 238
例3、 甲乙两台机床同时生产直径为40mm的零件, 为了检验产品的质量,从两台机床生产的产品中个 抽取10件进行测量,结果如下:
甲/mm 乙/mm 40.0 40.0 39.8 40.0 40.1 39.9 40.2 39.9 40.0 40.2 40.0 39.9 40.1 40.1 39.8 40.1 40.2 39.8 40.0 39.9
一、复习:常用的特征数
1、平均数: 就是一组数据的平均,设有n个数据,x1 ,x2, …,xn,
这组数据的平均数为:
x1 x2 xn x n
特别地,如果上面n个数据中不同数据x1,x2,…,xn的个 数分别为k1,k2,…,kn,那么它们的平均数为
x1k1 x2 k2 xn kn x k1 k2 kn
5、方差: 就是一组数据中所有数与平均数的差的平方和 的平均数.设有n个数据x1,x2,…,xn,这组数据的 方差为:
2 2 2 ( x x ) ( x x ) ( x x ) 2 n s2 1 n
极差和方差反映数据的离散程度
源自文库
例1 某公司员工的月工资情况如表:
月工资/元 员工数/人 8000 1 5000 2 4000 2000 1000 800 4 6 12 8 700 20 600 5 500 2
§4 数据的数字特征
Data’s characteristic
复习回顾
条形统计图
折线统计图 统计图 扇形统计图
茎叶图
利用统计图表可以显示样本数据的特征
数据的特征除了利用统计图表外,还可 以利用一些统计量(多个数据“加工”为一 个数值)来表述,使这个数值能反映这组数 据的某些重要的整体特征。前面我们在表示 数据的集中趋势和离散程度时,我们利用平 均数、中位数,众数、极差、方差等来表示。
(1)分别计算该公司员工月工资的平均数、中位数和众数。 (2)公司经理会选取上面哪个来代表该公司员工的月工资情 况,税务官呢?工会领导呢? 分析:1.根据平均数、中位数的计算公式,可以算出平均数 为:1373元,中位数为:800元,众数为:700元
2.不同身份的人代表不同阶层人的利益,对公司领导平均数 好,对税务官中位数比较好,对工会领导众数即使他的选择
2、中位数: 就是一组数据按照从小到大或从大到小的顺序进 行排列时,处于中间位置的数(或中间两数的平均数)称 为这组数据的中位数. 奇数个数时,中间那1个 偶数个数时,中间那两个的平均数
3、众数:
就是一组数据中出现次数最多的数.
平均数、中位数或众数反映数据的集中趋势
4、极差: 就是一组数据中最大数与最小数之间的差.
10
=0.006(m㎡)
方法3
甲
1 40 40 39.8 40 39.8 40 10 0.14
乙
1 40 40 40 40 39.9 40 10 0.06
方法4
甲
1 3 3 3 40 40 39.8 40 39.8 40 10 2 0.005(m m )
所以在实际中,人们更多使用的是标准差
二、标准差
1、方差的正的平方根
( x1 x) 2 ( x2 x) 2 L ( xn x) 2 2、公式: s s n
2
3、优点: (1)、从数学上来说,二次函数的性质比绝对值函数要好; (2)、单位一致; (3)、比较方便运算 。