第一章统计和数据
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【例题1.1】下面变量中属于顺序变量的是(
)。[2008年中级真题]
A.职业
B.产品产量
C.年龄
D.产品等级
【答案】D
【解析】变量可分为:①分类变量是指只能反
映现象分类特征的变量;②顺序变量,是说明事物
有序类别的一个名称,这类变量的具体表现就是顺
Hale Waihona Puke Baidu
序数据;③数值型变量,是说明事物数字特征的一
个名称。A项是分类变量;B、C项是数值型变量。
二、数据类型 1.定性变量(数据)与定量变量(数据) (1)定性变量(数据) 例如“天气形势”、“职业”和“教育程 度”,这样的变量称为定性变量,定性变量的观 察结果称为定性数据。这类数据的最大特点是它 只能反映现象的属性特点,而不能说明具体量的 大小和差异。
①分类变量 分类变量:只能反映现象分类特征的变量, 分类变量的观察结果就是分类数据。 分类变量没有数值特征,所以不能对其数据 进行数学运算。如“性别”就是分类变量。 分类数据只能用来区分事物,而不能用来表 明事物之间的大小、优劣关系。
②顺序变量 如果类别具有一定的顺序,如“教育程度”, 中学的教育程度就是比小学高,大学又比中学商, 这样的变量称为顺序变量,相应的观察结果就是 顺序数据。 顺序变量比分类变量向前进了一步,它不仅 能用来区分客观现象的不同类别,而且还可以表 明现象之间的大小、高低、优劣关系(如产品的 质量可以分为优质品、合格品、不合格品等)。
1.数据的直接来源—原始数据 搜集数据最基本的形式就是进行统计调查或 进行实验活动,统计调查或进行实验就是统计数 据的直接来源。 (1)统计调查 统计调查是指根据统计研究预定的目的、要 求和任务,运用科学的方法,有计划、有组织地 向客观实际搜集资料的过程。通过统计调查得到 的数据,一般称为观测数据。
顺序数据最主要的特征在于不论它的数据 是用数值表示的还是用文字表示的,都存在一 定的客观顺序,一定是可以按大小、高低、优 劣进行排序的,也就是数据之间是可以比较大 小、高低、优劣的。
顺序数据的数据之间虽然可以比较大小, 却无法计算相互之间大小、高低或优劣的距离。 这时顺序数据的数据仍然是用来表示事物在性 质上的差异,而不能用来反映事物在数量上的 差异。
2.观测数据和实验数据(根据获取数据的 方法不同)
观测数据可能是全面数据也可能是样本数 据;实验数据一般都是样本数据。
(1)观测数据 观测数据是对客观现象进行实地观测所取得 的数据,在数据取得的过程中一般没有人为的控 制和条件约束。 在社会经济问题研究中,观测是取得数据最 主要的方法。很多社会经济问题不适合应用实验 的方法,只能通过向实际做调查得到数据,用各 种调查方法得到的数据都属于观测数据。
(2)实验法 实验法是直接获得统计数据的又一重要来源。 通过实验法得到的数据就是实验数据。 在实验中,往往需要将研究对象分为两个组, 一个为实验组,另一个为对照组,对实验组的输 入变量加以控制或改变,而对照组则不加控制, 根据两组的输出结果,可以看到输入变量对输出 的影响。运用实验法要注意的是,
①实验组和对照组的产生应当是随机的,研 究对象的不同单位应当被随机地分配到实验组或 对照组,而不应是经过有意识的挑选的。
(2)定量数据 定量变量(数值变量):可以用数值表示其 观察结果,而且这些数值具有明确的数值含义, 不仅能分类而且能测量出来具体大小和差异。 定量变量的观察结果成为定量数据。
特征:都是以数值的形式出现的,有些数 值型数据只可以计算数据之间的绝对差(绝对 距离),而有些数值型数据不仅可以计算数据 之间的绝对差,还可以计算数据之间的相对差 (相对距离)。
(2)实验数据 实验数据一般是在科学实验环境下取得的 数据。在实验中,实验环境是受到严格控制的, 数据的产生一定是某一约束条件下的结果。在 自然科学研究中实验的方法应用非常普遍,因 此,自然科学研究中所用的数据多为实验数据。
第三节 数据来源与搜集数据的方法
一、数据的来源 从使用者的角度看,统计数据资料的来源主要有 两种渠道: ☞ 通过直接的调查或实验获得的原始数据,这是 统计数据的直接来源,一般称之为原始或第一手统计 数据; ☞ 别人调查的数据,并将这些数据进行加工和汇 总后公布的数据,通常称之为次级数据或第二手间接 的统计数据。一切间接的统计数据都是从原始的、第 一手数据过渡而来的。
二、统计的应用 1.统计的应用领域 统计是适用于所有学科领域的通用数据分析 方法,是一种通用的数据分析语言。 2.统计的误用与滥用 例如:错误的统计定义、错误的图标提示、 一个不合理的样本。数据的遗漏和逻辑错误等。
第二节 数据类型
一、变量与数据 变量的特点是从一次观察到下一次观察会出 现不同结果。把观察到的结果记录下来就是数据。
2.分类 (1)描述统计 描述统计是研究数据搜集、处理和描述的统计 学方法。其内容包括如何取得研究所需要的数据, 如何用图表形式对数据进行处理和展示,如何通过 对数据的综合、概括与分析,得出所关心的数据特 征。 (2)推断统计 推断统计则是研究如何利用样本数据来推断总 体特征的统计学方法,内容包括参数估计和假设检 验两大类。
数值型数据的计量功能要远大于前面介绍 的两种定性数据,其计量精度也远远高于定性 数据。因此,在统计研究中,数值型数据有着 最广泛的用途。
(3)三类数据的比较 从上述三类数据的基本特点可以看出,这三类 数据对事物的描述是由定性到定量、由低级到高级、 从粗略到精细。 相应的适用于不同数据的数据处理方法也是由 少到多,由易到难。很多适用于数值型数据的统计 方法并不适用于定性数据,但适用于定性数据的方 法则大多可以应用于数值型数据。
全国统计专业技术资格考试
《统计方法》
第一章 统计和数据 主讲教师:杨风寿
【大纲要求】 一、统计的含义 1.什么是统计学 2.统计的应用 二、数据类型 1.变量与数据 2.数据类型 三、数据来源与搜集数据的方法 1.数据的来源 2.搜集数据的方法
【要点详解】
第一节 统计的含义
一、什么是统计学 1.概念 统计学是用以收集数据,分析数据和由数据 得出结论的一组概念、原则和方法。