第二章 描述统计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
江西财经大学统计学院 14
统计学 第一节 概括质量数据
二、相对频数分布与百分比频数分布 1、定义
对于有n个观测值的数据集,每组的相对频数=组的频 数/n;
每组百分比频数=相对频数100。 2、举例:书中的表2-3 3、特点:用概括性表格数据的形式显示每组的相对频 数和每组的百分比频数。 三、条形图与饼图(自学)
江西财经大学统计学院 4
统计学 第一节 图表法
一、 统计表 (一)定义:容纳与表现统计资料的表格。 (二)制作:上下粗线、中间细线、两边开口。 (三)结构 1.从形式看 (1)总标题:时间、空间、总体、指标
2000年A国工业企业固定资产投资情况 → 总标题
按地区分组 完成投资额(亿元) 增长率(%) 比重(%)
江西财经大学统计学院 2
统计学 第二章 描述统计
要对上面的数据进行分析,你应该做些什么? 江西财经大学统计学院 3
统计学 第二章 描述统计
本章学习重点
1、理解数据图示的必要性,了解数据图示在数据分析中地位。 2、熟练数值平均数和位置平均数的计算。 3、理解变异指标的。
本章学习难点
1、变异指标的应用。 2、至少掌握一种软件分析工具制作频数分布表和各种图形。
14、19、18、15、15、18、17、20、27、22、23、22、21、33、 28、14、18、16、13。
试将其整理成合适的变量数列。 1、确定互不重叠的分组数量。(组数)
一般分5~20个组。 2、确定每组组距。
全距(R)=Xmax –Xmin=33—12=18 组距=全距/组数=18/5=4.2≈5
2000年A国工业企业固定资产投资情况 → 总标题
按地区分组 完成投资额(亿元) 增长率(%) 比重(%)
甲
(1)
(2)
(3)
纵栏 标题
横 东部地区
行 标
中部地区
题 西部地区
主词
12,188
4,121
2,387
宾
17、5
20、7
21、1
词
65、2 22、0 12、8
指标 数值
江西财经大学统计学院 6
江西财经大学统计学院 16
统计学 第二节 概括数量数据
二、频数分布的类型
1、钟形分布 特征:中间大、两头小。
[例]身高、体重、智商、纤维长度、细纱强度、粮食作物产量等。 (1)对称分布:正态分布及t分布。
年龄 人数
(2)偏态分布(不对
17
5
人数
称分布)
18
10
A、右(正)偏有
极大值;
19 20
15 10
江西财经大学统计学院 15
统计学 第二节 概括数量数据
一、频数分布 1、如何编制数量数据的频数分布表 A、确定互不重叠的分组数量。(组数) B、确定每组组距。 C、确定组限(上限、下限、组中值)。(组限的选择以数
量数据的精确度来衡量,采用不重叠的方式)
2、举例:表2—6 3、特点:它提供了数量数据是如何分布的,提供了比原 始数据更多的信息,比原始数据更易理解。
数分布和百分比频数分布。
六、散点图及直方图(自学)
七、累积分布和累积频数图 累积分布所显示的是小于或等于每个分组的上限值观测值
的数量,而不是每组的频数。 又分累积相对频数分布、累积百分比频数分布。 累积分布的图形称为累积频数图。
江西财经大学统计学院 24
统计学 第二节 概括数量数据
附录:1、用EXCEL软件绘制频数分布 2、用SAS软件绘制频数分布
统计学 第一节 图表法
江西财经大学统计学院 8
统计学 第一节 图表法
江西财经大学统计学院 9
统计学 第一节 图表法
江西财经大学统计学院 10
统计学 第一节 图表法
江西财经大学统计学院 11
统计学 第一节 图表法
江西财经大学统计学院 12
统计学 第一节 图表法
江西财经大学统计学院 13
统计学 第一节 图表法
合计
频数 4 8 5 2 1
20
末组组中值=(U+L)/2=[L+(L+i)]/2
=L+i/2=L+邻组i/2
6、对重叠组限,该组的频数统计遵循“上组限不在本组内”的原
则。
江西财经大学统计学院 23
统计学 第二节 概括数量数据
五、相对频数分布与百分比频数分布 我们以定义质量数据同样的方式来定义数量数据的相对频
顾客在交回问卷后,就对他们所购买的商品打九五折,以 表感谢。下面的A表是问卷回收后的原始记录。
江西财经大学统计学院 1
统计学
调查结束后,该超市针对顾客在调查中提出的问题,对员工 进行了培训,以改善服务质量。为比较改善服务质量后是否使 销售额有所提高,超市又对2004年第三季度各天的销售进行了 统计,结果如下表。
统计学 第二节 概括数量数据
4、组中值=(上限+下限)/2 推测本组平均水平。 (1)闭口组;(2)开口组。 首组组中值=(U+L)/2 =[U+(U-i)]/2 =U-i/2 =U-邻组i/2 假定:数据均匀分布或对称分布。
审计时间(天) 10—14 15—19 20—24 25—29 30—34
江西财经大学统计学院 21
统计学 第二节 概括数量数据
3、确定组限(上限、下限) 不重叠设计、第一组的下限<最小值、最末组的上限>最大值
审计时间(天) 10—14 15—19 20—24 25—29 30—34
合计
频数 4 8 5 2 1
20
注意:若数据中有异常 值,则应设置开口组。
江西财经大学统计学院 22
供
年龄
(1)正J分布:右大左小;
给
(
“供给曲线”。
需 求
)
(2)反J分布:左大右小;
“需求曲线”。
价格
江西财经大学统计学院 19
统计学 第二节 概括数量数据
三、数量数据频数分布(变量数列)的类型 1、单项式数列:一个变量值代表一组。 2、组距式数列:依组距分组等距数列、异距数列。
某地人口分布表
年 龄 人数(万人)
方法如下:A、用SAS软件中的INSIGHT作频数统计的步骤。
江西财经大学统计学院 25
统计学 第二节 概括数量数据
江西财经大学统计学院 26
统计学 第二节 概括数量数据
B、用编程的方法绘制频数分布表
江西财经大学统计学院 27
统计学 第二章 概括数量数据
江西财经大学统计学院 28
统计学 第二章 描述统计
统计实例 超市逐渐成为人们的主要购物场所。随着我国加入WTO,
国外的一些大型零售商也在国内的一些城市开设了连锁超市, 这无疑加剧了零售业的竞争态势。2003年,一家超市面对业界 新的形式,除了在硬件设施上加大投入外,更希望在服务质量 上下功夫。为了解顾客对服务质量的要求,这家超市随机抽取 了100名前来购物的顾客,让他们填写一份简单的调查问卷, 对本店的服务质量进行评价。其中的一个问题是:“你认为本 店服务质量如何?请在下面列出的选项上划‘’”。A.好 B. 较好 C.一般 D.较差 E.差
B、左(负)偏 有极小值。
21
5
22
3
23
1
年龄
合计 49
Baidu Nhomakorabea
江西财经大学统计学院 17
统计学 第二节 概括数量数据
江西财经大学统计学院 18
统计学 第二节 概括数量数据
2、U形分布
死
亡
分布特征:两头大、中间小。 率
[例]人或动物分年龄段的死亡率、 产品按使用时间的故障率。
3、J形分布
分布特征:一边大、一边小。
0—10
7
10—20
11
20—30
24
30—40
8
40—50
2
合计
52
A 班学生年龄分布表
年龄 人数 频率
17
6
0.12
18
14
0.28
19
18
0.36
20
9
0.18
21
3
0.06
合计 50
1.00
江西财经大学统计学院 20
统计学 第二节 概括数量数据
四、变量数列的编制 以下是某小型会计师事务所对20个客户年终审计所需天数:12、
统计学 第一节 图表法
二、次数分布图
(一)图示法
1、直方图:X轴“变量”; 人数f
Y轴 “次数”。
15
宽i,高各组f。 次数分布表
12
身高
人数
9
80—90
3
6
90—100
7
100—110 13
3
110—120
5
120—130
2
30
80 90 100 110 120 130
身高x
江西财经大学统计学院 7
甲
(1)
(2)
(3)
横 东部地区
行 标
中部地区
题 西部地区
12,188 4,121 2,387
17、5 20、7 21、1
65、2 22、0 12、8
纵栏 标题
指标 数值
江西财经大学统计学院 5
统计学 第四节 图表法
(2)横行标题:总体或其分组的名称; (3)纵栏标题:指标名称; (4)指标数值。 2.从内容来看 (1)主词:说明的对象; (2)宾词:指标名称、指标数值。
统计学 第一节 概括质量数据
二、相对频数分布与百分比频数分布 1、定义
对于有n个观测值的数据集,每组的相对频数=组的频 数/n;
每组百分比频数=相对频数100。 2、举例:书中的表2-3 3、特点:用概括性表格数据的形式显示每组的相对频 数和每组的百分比频数。 三、条形图与饼图(自学)
江西财经大学统计学院 4
统计学 第一节 图表法
一、 统计表 (一)定义:容纳与表现统计资料的表格。 (二)制作:上下粗线、中间细线、两边开口。 (三)结构 1.从形式看 (1)总标题:时间、空间、总体、指标
2000年A国工业企业固定资产投资情况 → 总标题
按地区分组 完成投资额(亿元) 增长率(%) 比重(%)
江西财经大学统计学院 2
统计学 第二章 描述统计
要对上面的数据进行分析,你应该做些什么? 江西财经大学统计学院 3
统计学 第二章 描述统计
本章学习重点
1、理解数据图示的必要性,了解数据图示在数据分析中地位。 2、熟练数值平均数和位置平均数的计算。 3、理解变异指标的。
本章学习难点
1、变异指标的应用。 2、至少掌握一种软件分析工具制作频数分布表和各种图形。
14、19、18、15、15、18、17、20、27、22、23、22、21、33、 28、14、18、16、13。
试将其整理成合适的变量数列。 1、确定互不重叠的分组数量。(组数)
一般分5~20个组。 2、确定每组组距。
全距(R)=Xmax –Xmin=33—12=18 组距=全距/组数=18/5=4.2≈5
2000年A国工业企业固定资产投资情况 → 总标题
按地区分组 完成投资额(亿元) 增长率(%) 比重(%)
甲
(1)
(2)
(3)
纵栏 标题
横 东部地区
行 标
中部地区
题 西部地区
主词
12,188
4,121
2,387
宾
17、5
20、7
21、1
词
65、2 22、0 12、8
指标 数值
江西财经大学统计学院 6
江西财经大学统计学院 16
统计学 第二节 概括数量数据
二、频数分布的类型
1、钟形分布 特征:中间大、两头小。
[例]身高、体重、智商、纤维长度、细纱强度、粮食作物产量等。 (1)对称分布:正态分布及t分布。
年龄 人数
(2)偏态分布(不对
17
5
人数
称分布)
18
10
A、右(正)偏有
极大值;
19 20
15 10
江西财经大学统计学院 15
统计学 第二节 概括数量数据
一、频数分布 1、如何编制数量数据的频数分布表 A、确定互不重叠的分组数量。(组数) B、确定每组组距。 C、确定组限(上限、下限、组中值)。(组限的选择以数
量数据的精确度来衡量,采用不重叠的方式)
2、举例:表2—6 3、特点:它提供了数量数据是如何分布的,提供了比原 始数据更多的信息,比原始数据更易理解。
数分布和百分比频数分布。
六、散点图及直方图(自学)
七、累积分布和累积频数图 累积分布所显示的是小于或等于每个分组的上限值观测值
的数量,而不是每组的频数。 又分累积相对频数分布、累积百分比频数分布。 累积分布的图形称为累积频数图。
江西财经大学统计学院 24
统计学 第二节 概括数量数据
附录:1、用EXCEL软件绘制频数分布 2、用SAS软件绘制频数分布
统计学 第一节 图表法
江西财经大学统计学院 8
统计学 第一节 图表法
江西财经大学统计学院 9
统计学 第一节 图表法
江西财经大学统计学院 10
统计学 第一节 图表法
江西财经大学统计学院 11
统计学 第一节 图表法
江西财经大学统计学院 12
统计学 第一节 图表法
江西财经大学统计学院 13
统计学 第一节 图表法
合计
频数 4 8 5 2 1
20
末组组中值=(U+L)/2=[L+(L+i)]/2
=L+i/2=L+邻组i/2
6、对重叠组限,该组的频数统计遵循“上组限不在本组内”的原
则。
江西财经大学统计学院 23
统计学 第二节 概括数量数据
五、相对频数分布与百分比频数分布 我们以定义质量数据同样的方式来定义数量数据的相对频
顾客在交回问卷后,就对他们所购买的商品打九五折,以 表感谢。下面的A表是问卷回收后的原始记录。
江西财经大学统计学院 1
统计学
调查结束后,该超市针对顾客在调查中提出的问题,对员工 进行了培训,以改善服务质量。为比较改善服务质量后是否使 销售额有所提高,超市又对2004年第三季度各天的销售进行了 统计,结果如下表。
统计学 第二节 概括数量数据
4、组中值=(上限+下限)/2 推测本组平均水平。 (1)闭口组;(2)开口组。 首组组中值=(U+L)/2 =[U+(U-i)]/2 =U-i/2 =U-邻组i/2 假定:数据均匀分布或对称分布。
审计时间(天) 10—14 15—19 20—24 25—29 30—34
江西财经大学统计学院 21
统计学 第二节 概括数量数据
3、确定组限(上限、下限) 不重叠设计、第一组的下限<最小值、最末组的上限>最大值
审计时间(天) 10—14 15—19 20—24 25—29 30—34
合计
频数 4 8 5 2 1
20
注意:若数据中有异常 值,则应设置开口组。
江西财经大学统计学院 22
供
年龄
(1)正J分布:右大左小;
给
(
“供给曲线”。
需 求
)
(2)反J分布:左大右小;
“需求曲线”。
价格
江西财经大学统计学院 19
统计学 第二节 概括数量数据
三、数量数据频数分布(变量数列)的类型 1、单项式数列:一个变量值代表一组。 2、组距式数列:依组距分组等距数列、异距数列。
某地人口分布表
年 龄 人数(万人)
方法如下:A、用SAS软件中的INSIGHT作频数统计的步骤。
江西财经大学统计学院 25
统计学 第二节 概括数量数据
江西财经大学统计学院 26
统计学 第二节 概括数量数据
B、用编程的方法绘制频数分布表
江西财经大学统计学院 27
统计学 第二章 概括数量数据
江西财经大学统计学院 28
统计学 第二章 描述统计
统计实例 超市逐渐成为人们的主要购物场所。随着我国加入WTO,
国外的一些大型零售商也在国内的一些城市开设了连锁超市, 这无疑加剧了零售业的竞争态势。2003年,一家超市面对业界 新的形式,除了在硬件设施上加大投入外,更希望在服务质量 上下功夫。为了解顾客对服务质量的要求,这家超市随机抽取 了100名前来购物的顾客,让他们填写一份简单的调查问卷, 对本店的服务质量进行评价。其中的一个问题是:“你认为本 店服务质量如何?请在下面列出的选项上划‘’”。A.好 B. 较好 C.一般 D.较差 E.差
B、左(负)偏 有极小值。
21
5
22
3
23
1
年龄
合计 49
Baidu Nhomakorabea
江西财经大学统计学院 17
统计学 第二节 概括数量数据
江西财经大学统计学院 18
统计学 第二节 概括数量数据
2、U形分布
死
亡
分布特征:两头大、中间小。 率
[例]人或动物分年龄段的死亡率、 产品按使用时间的故障率。
3、J形分布
分布特征:一边大、一边小。
0—10
7
10—20
11
20—30
24
30—40
8
40—50
2
合计
52
A 班学生年龄分布表
年龄 人数 频率
17
6
0.12
18
14
0.28
19
18
0.36
20
9
0.18
21
3
0.06
合计 50
1.00
江西财经大学统计学院 20
统计学 第二节 概括数量数据
四、变量数列的编制 以下是某小型会计师事务所对20个客户年终审计所需天数:12、
统计学 第一节 图表法
二、次数分布图
(一)图示法
1、直方图:X轴“变量”; 人数f
Y轴 “次数”。
15
宽i,高各组f。 次数分布表
12
身高
人数
9
80—90
3
6
90—100
7
100—110 13
3
110—120
5
120—130
2
30
80 90 100 110 120 130
身高x
江西财经大学统计学院 7
甲
(1)
(2)
(3)
横 东部地区
行 标
中部地区
题 西部地区
12,188 4,121 2,387
17、5 20、7 21、1
65、2 22、0 12、8
纵栏 标题
指标 数值
江西财经大学统计学院 5
统计学 第四节 图表法
(2)横行标题:总体或其分组的名称; (3)纵栏标题:指标名称; (4)指标数值。 2.从内容来看 (1)主词:说明的对象; (2)宾词:指标名称、指标数值。