第4章数据分布特征的测度(修改版)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
合计
300
100
—
—
—
—
众数:不满意
2、分组数据例-单项式分组
某200名手机使用者目前已更换手机数量频 数分布表
更换手机数量
0 1 2 3及以上 合计
人数(人)
6 82 76 36 200
频率(%)
3 41 38 18 100
众数:1
2、分组数据例-组距分组
某地 区农 民家 庭年 人均 收入 资料
众数:122
2、分组数据例-品质型分组
某城市居民关注广告类型的频数分布
广告类型
商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告
人数(人)
112 51 9 16 10 2
频率(%)
56.0 25.5 4.5 8.0 5.0 1.0
合计
200
100.0
众数:商品广告
甲城市家庭对住房状况满意程度的频数分布
按年人均收入 分组(元)
农民家庭数 (户)
1000~1200 1200~1400 1400~1600 1600~1800 1800~2000 2000~2200 2200~2400 2400~2600
240 480 1050 600 270 210 120 30
合计
3000
M
o
1400
(1050
1050 480 480) (1050
定义:是指一组数据中出现次数最多的变量值, 用MO表示。
实际应用:当更感兴趣的是最普遍的尺寸而不是平均
尺寸的大小时众数是一个合适的集中趋势代表值。
众数的确定方法
1. 未分组数据 2. 分组数据
3. -品质型分组 -数值型分组
1、未分组数据例
某生产车间50名工人日加工零件数原始资料(单位:个) 107 108 108 110 112 112 113 114 115 117 117 117 118 118 118 119 120 120 121 122 122 122 122 123 123 123 123 124 124 124 125 125 126 126 127 127 127 128 128 129 130 131 133 133 134 134 135 137 139 139
楼市价格下降?
❖ 《2010年3月广州市十区房地产交易登记情 况通报》,数据显示,广州十区3月的一手住 宅成交量环比回升两成,达到62.35万平方米, 成交量接近去年3月“小阳春”。
❖ 今年3月楼市成交回暖是否也是楼价低的因素? 因为广州3月楼价环比下降了9.2%。
❖ 表面看来是如此。
集中趋势的概念 与测度指标
满意 户数 程度 (户)
非常 不满意
24
百分比 (%)
向上累积
户数 百分比 (户) (%)
8
24
8.0
向下累积
户数(户)
百分比 (%)
300 100
不满意 108
36
132
44.0
276 92
一般
93
31
225
75.0
168 56
满意
45
15
270
90.0
非常 满意
30
10
300 100.0
75 25 30 10
❖统计学中是用一个或几个数据测度(刻画) 数据总体的分布特征。
❖统计学中刻划数据分布特征的最主要的代表 有数据分布的集中趋势、离散程度和分布形态。
描述统计
统计数据 的收集
统计数据
统计数据
的整理与显示 分布特征的测度
第四章 数据分布特征的测度
主要内容和学习目标
集中趋势的测度(重点掌握) 离散程度的测度(重点掌握) ——均从未分组和分组两角度进行介绍 偏度与峰度的测度(了解)
平均数的种类
位置平均数
数值平均数
众数
算术平均数
中位数
调和平均数
几何平均数
众数
定义 确定方法 特点 总结
众数的引例
❖ 一个班30名同学参加英语考试,成绩如下:
❖ 2名同学——60分
❖ 10名同学——72分
❖ 15名同学——80分 ❖ 3名同学——85分
众数
❖ 5名同学——90分
众 数 (Mode)
按年人均收入 分组(元)
1000~1200 1200~1400 1400~1600 1600~1800 1800~2000 2000~2200 2200~2400 2400~2600
合计
农民家庭数 (户)
240 480 1050 600 270 210 120 30
3000
一、集中趋势的测度
概念与测度指标 众 数(掌握) 中位数(掌握) 算术平均数(重点掌握) 调和平均数 几何平均数(掌握)
=1511.8(元)
源自文库 众数的确定方法总结
1、未分组数据的众数 MO=频(次)数最多的数据值(变量值、标志值)
2、分组数据的众数
(1) 品质数据和单项式分组的数值型数据 MO =频数最多组的数据值(变量值、标志值)
600)
200
1511.(8 元)
解:从表中的资料可以看出,出现频数最多的是1050, 即众数组为1400~1600,且
L=1400 fm 1050 fm1 480 fm1 600 d 200
根据众数公式可得:
Mo
1400
1050 480
200
(1050 480) (1050 600)
2、分组数据例-经过分组整理的数据
某城市居民关注广告类型的频数分布
广告类型
商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告
人数(人)
112 51 9 16 10 2
频率(%)
56.0 25.5 4.5 8.0 5.0 1.0
合计
200
100.0
某地 区农 民家 庭年 人均 收入 资料
集中趋势的概念:是指一组数据向某一中心值靠拢
的倾向,它反映了数据聚集的中心所在 。
集中趋势的测度:是指寻找数据(总体)一般水平
的代表值或中心值
集中趋势的测度指标:称之为平均指标(平均 数)——众数、中位数、算术平均数、调和平 均数、几何平均数。
集中趋势测度的作用: 可以用一个数值说明总体的一般水平。
未分组和分组数据辨析
1、未分组数据——未经过分组整理的数据
某生产车间50名工人日加工零件数原始资料(单位:个) 107 108 108 110 112 112 113 114 115 117 117 117 118 118 118 119 120 120 121 122 122 122 122 123 123 123 123 124 124 124 125 125 126 126 127 127 127 128 128 129 130 131 133 133 134 134 135 137 139 139