第2章统计数据的描述1

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

提供统计数据的部分政府网站
美国政府机构 人口普查局 联邦储备局 预算编制办公室 商务部 网 址 数据内容
http://www.census.gov 人口和家庭等 http://www.bog.frb.fed. 货币供应、信誉、 us 汇率等 http://www.whitehouse. 财政收入、支出、 gov/omb 债券等 http://www.doc.gov 商业、工业等
一、列名尺度
它能按事物的某种属性对其进行平行分组。 特点:其测量的数据(即各类别)是文字并且是 平等并列的,各类之间顺序可以改变。
二 、顺序尺度
它能根据事物的某种属性将事物区分为不同的类别,这些 类别也是文字。与列名尺度不同的是,这些类别可以排序。
三、间隔尺度
它能用自然的或物理单位测量出事物的具体数值。 特点:该类尺度测量的数据是数值,根据这些数值可 以对事物进行分类、排序和加减运算,但这些数值不能进


②规定统一的标准时点。 ③仅用于反映国情国力的重大问题的调查。
2、抽样调查(随机抽样调查,即概率抽样)
从调查对象的总体中随机地抽取部分单位作为样本进行 调查,并根据样本调查结果来推断总体数量特征的一种非全 面调查。

总体
随机样本

二、统计数据的间接来源
1、统计部门和政府部门公布的有关资料,如各 类统计年鉴。 2、各类经济信息中心、信息咨询机构、专业调 查机构等提供的数据。 3、各类专业期刊、报纸、书籍所提供的资料。 4、各种会议,如博览会、展销会、交易会及专 业性、学术性研讨会上交流的有关资料。 5、从互联网或图书馆查阅到的相关资料 。
90
100
110
120
130
某车间工人周加工零件直方图
(二)折线图 把直方图中各矩形顶边中点连接起来,形成一条折线,然 后把折线两端分别与其所在组竖边中点相连并延长至横轴上。
折线图与直方图 下的面积相等!
12
8
4
0
80
90
100
110
120
130
某车间工人周加工零件折线图
(三)次数分布的类型
1、钟形分布。越靠近变量值中点的变量值,其次数越多。
统计数据的来源主要有两个: 一是直接来源,即来源于直接的调查和科学试验, 得到第一手数据。 二是间接来源,即来源于别人调查或试验的数 据,得到第二手数据。
见第8-9页
一、统计数据的直接来源 1、普查
(1)概念 为了某一特定目的而专门组织的一次性全面调查。 (2)特点 ①具有一次性和周期性。
“一次性”是指调查现象在某一时点上的数据。
(5)全距:全体数据中最大标志值与最小标志值之差。
(6)累计次数:
向上累计:从表的下方向表的上方依次对各组次数累计相加。
向下累计:从表的上方向表的下方依次对各组次数累计相加。
见第19页的表2.9
三、组距式变量数列的编制(以等距数列为例)
步骤:(以第17页的【例2.1】为例)
1、排序
2、确定组距 (1)组距最好是5、10的倍数。 (2)组距先取小一点不断地试,直到各组的次数表现出 一定的分布特征为止。
809010011012013012某车间工人周加工零件直方图某车间工人周加工零件直方图某车间工人周加工零件直方图某车间工人周加工零件直方图我一眼就看出来了周加工零件在100110之间的人数最多
第2章 统计数据的描述(1)
第一节 数据的计量尺度
计量尺度由低级到高级、由粗略到精确分为四个层 次:列名尺度、顺序尺度、间隔尺度和比例尺度。
3、确定组限
注意: (1)组限最好是5、10的倍数; (2)最小组的下限应比最小的变量值略小;最大组 的上限应比最大的变量值略大。
(3)相邻组的组限应重合。
4、统计汇总 注意:应坚持“上限不在组内”的原则。(EXCEL软件是 坚持“下限不在组内”的原则)
次数分配表的编制
【例】某车间
30 名工人每周 加工某种零件 件数如右表试 对数据进行分 组。
第二节
统计数据的搜集
一次失败的统计调查
在1936年的美国总统选举前,一份名为 Literary Digest 杂 志进行了一次民意调查。调查的焦点是谁将成为下一届总 统—是挑战者,堪萨斯州州长Alf Landon,还是现任总统 Franklin Delano Roosevelt。为了解选民意向,民意调查专 家们根据电话簿和车辆登记簿上的名单给一大批人发了简 单的调查表(电话和汽车在1936年并不像现在那样普及, 但是这些名单比较容易得到)。尽管发出的调查表大约有 一千万张,但收回的比例并不高。在收回的调查表中, Alf Landon非常受欢迎。于是该杂志预测 Landon 将赢得 选举。但事实上是Franklin Roosevelt赢得了这次选举。 在经济大萧条时期调查有电话和汽车的人们,并不能 够反映全体选民的观点。此外,只有少数的问卷被收回。 这些都是值得怀疑的。
第四节
洛伦次曲线与基尼系数
1、20世纪初美国经济学家、统计学家洛伦茨(M.E. 2、描述收入和财富分配性质
的曲线分析该国家或地区 分配的平均程度。
Lorentz) 根据意大利经济学家巴雷特(V. Pareto)提出的收入分配公 式绘制而成。 100%
累 积 的 收 入 百 分 比
A
B
累积的人口百分比 100% 绝对不公平线
次数分配表
四、次数分布曲线图的绘制
(一)直方图(等距数列) 步骤: 第一、在横轴上描出各组组限;在纵轴上描出各组次数 (或频率); 第二,以各组组距为宽度,以各组次数(或频率)为高
度绘出一组矩形。
我一眼就看出 来了,周加工 零 件 在 100 ~ 110 之 间 的 人 数最多!
12
8
4
0
80
宏观经济、财经、 货币金融等
中国经济信息网
华通数据中心 中国决策信息网 三农数据网
http://www.cei.gov.cn
http://data.acmr.com.cn http://www.juece.gov.cn http://www.sannong.gov.cn
经济信息及各类 网站
国家统计局授权 的数据中心 决策知识及案例 三农信息、论坛 及相关网站
行乘除运算。
四、比例尺度
其测量的数据是也是事物的具体数值。根据这 些数值可以对事物进行分类、排序和加减运算,但 与间隔尺度不同的是这些数值还可以进行乘除运算。
间隔尺度和比例尺度的区别
在间隔尺度中没有绝对零点,即在该尺度中“0”是表示一 个数值,而不表示“没有”或“不存在”;而比例尺度有一个 绝对零点,即在该尺度中“0”表示 “没有”或“不存在”。
绝对公平线
0
基尼系数
1、20世纪初意大利经济学家基尼 (G. Gini)根据洛伦茨曲线给出了衡量收入 分配平均程度的指标。 A 基尼系数 A B 2、A表示实际收入曲线与绝对平均线之间的面积。 3、B表示实际收入曲线与绝对不平均线之间的面积。
4、如果A=0,则基尼系数=0,表示收入绝对平均。
(1)对称分布:以变量值的中点为对称轴的对称分布。
(2)偏态分布:
①左偏分布:左边的线比较长比较低,意味着出现了极小值, 而这些极小值个数又比较少。 ②右偏分布:右边的线比较长比较低,意味着出现了极大值, 而这些极大值个数又比较少。
2、U形分布(又称生命曲线或浴盆曲线) 越靠近变量值中点的变量值,其次数越少。 3、J形分布 ①正J形分布:随着变量值的增加,次数不断地增加。 ②反J形分布:随着变量值的增加,次数不断地 减少。
第三节 统计整理
一、统计整理的概念和步骤
概念:统计整理是根据统计研究的目的和要求,把统计调查 从而得到反映事物总体特征资料的过程。 步骤:
所取得的各项资料进行科学地综合加工,使之系统化、条理化,
第一,统计资料审核(对资料的及时性、准确性、完 整性进行审核) 第二,统计分组 第三,统计汇总 第四,编制统计表或绘制统计图
单位数在各组分布情况的数列。
各组单位数叫频数或次数,各组次数在总次数
所占的比重叫频率。
见第18-19页的表2.3、2.5、2.9
2、分布数列的分类
(1)品质数列:按品质标志分组后所形成的分布数列。
(2)变量数列:按数量标志分组后所形成的分布数列。又分为:
①单项式变量数列:用一个数值代表一个组形成的数列。
ቤተ መጻሕፍቲ ባይዱInternet
http//WWW.
中 国 人 口 统 计 年 鉴
中 国 市 场 统 计 年 鉴
提供统计数据的部分政府网站
中国政府及相关机构 网 址 数据内容
国家统计局
国务院发展研究中心 信息网
http://www.stat.gov.cn
http://www.drcnet.com.cn
统计年鉴、统计 月报等
②组距式变量数列:用变量值变动的一定范围来代表一个组
所形成的数列。
3、组距式变量数列中的几个概念
(1)组限:表示各组界限的变量值。大的叫上限,小的叫下限。
(2)组距:各组上下限之间的距离。
组距=上限-下限 (3)等距数列:各组组距均相等的数列。 异距数列:各组组距不完全相等的数列。
(4)组中值:上下限之间中点的值。
二、统计分组与统计汇总
(一)概念
统计分组:按照某一个标志将总体中所有单位划分为若 干个性质不同的组成部分就叫统计分组。 见第18-19页的表2.3、2.5、2.9 统计汇总:在统计分组的基础上,将统计资料归并到各 组中去,并计算出各组和总体的单位合计数的工作过程。
(二)分布数列
1、概念:统计分组和统计汇总后所形成的总体
组中值=(上限+下限)/2=上限-组距/2 =下限+组距/2
“××以上”、“××以下”这样的组叫开口组。一般假 定开口组的组距与其相邻组的组距相等。其组中值计算如下: 缺下限最小组的组中值=上限-相邻组组距/2 缺上限最大组的组中值=下限+相邻组组距/2 见第27页的表2.11
注意:
(1)开口组的组中值是在假设开口组的组距与其相邻组的 组距相同时计算出来的,所以开口组的组中值是近似值。 (2)计算组中值的目的是为了用组中值来代表该组中的每 一个值。因为我们只知道各组中有多少个值,而这些值具体是 多少并不知道,但有时又需要算出各组中所有值的总和,这时 我们就假定该组中的每一个值等于该组的组中值。但要用组中 值来代表该组中的每一个值,必须假定该组中各数是呈均匀分 布的。
5、如果B=0,则基尼系数=1,表示收入绝对不平均。 6、基尼系数在0 和1之间取值。
A
B
7、一般认为,基尼系数若小于0.2,表明分配平均;基尼系数在 0.2至0.4之 间是比较适当的,即一个社会既有效率又没有造成极大的分配不公;基 尼系数在0.4被认为是收入分配不公平的警戒线,超过了0.4应该采取措 施缩小这一差距。
相关文档
最新文档