信息分析与决策Chapert2数据与数据的获得.pptx

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
考生A(姓名,年龄,考分,成绩…)
2-2 数据类型
2.2.1 数据测度的分类
1. Scale 刻度级数据 数据的最高等级,只能用数字来表示
比率级Ratio : 有具体的实际测量值, 可做+ - * / 运算.
间距级Interval: 具体有一定单位的实 际测量值。例如摄氏温度。可比较变 量之间的差异,作+ - 运算,不能进行* / 运算。
Ex:考生个体 考分(定量型Quantitative,有数值) 性别(定性型Qualitative) 受教育程度(半定量的Semi-Quantitative)
2.1 总体、个体、特征与数据
定性型的数据和半定量的数据,通常 是对个体分组(分类)的依据.
一个个体的所有特征的数据,被称为 一条记录或一个数据向量。
2.1 总体、个体、特征与数据
2. 个体( Individual Or Case) 或成分 (Elements) 组成总体的元素(Element), 称为个体 有限总体:在某个总体中,若个体的数 目是有限的Finite. 无限总体:总体中,个体的数目无限 (Infinite)
2.1 总体、个体、特征与数据
3. 指标或变量(Variable) 研究任何总体,必然对其个体的某些
特征感兴趣。 Ex:农民(总体)
年收入 对政策的态度 受教育程度 附着于“个体”的信息,即个体特征
2.1 总体、个体、特征与数据
表征个体特征(Characteristics)的量称为 指标或变量. Ex:
“学生” ----------考分 身高 “零件” ----------直径 长度 耐磨损度 “药品”-----------疗效 副作用 “企业”------年销售额 年利润 资金周转率
顺序级变量也可作为分类得依据,“受教育程 度”将职工总体分为教育程度由低到高的若干 组。
刻度级数据可用于分类,如按照“考试成绩” 将学生总体分类等等。
一般说来,等级高的数据, 兼具等级低的数据的功能;而等 级低的数据,不可能兼有等级高 的数据的功能。
名义级的数据,通常是样本 分类(分组)的依据。
2.2.3 观察数据与实验数据
从数据获得的角度对数据进行分类 观察数据:
在获得数据过程中,不对被调查对 象数据产生的条件施加任何控制所得到 的数据。观察数据通常是众多因素共同 作用的结果。
Ex: 调查农民年收入情况,农业技术 来源情况,受教育情况,地区差异 等等通常为观察数据。
农民的年收入显然是众多因素复合 作用的结果。
实验数据:在获得数据过程中, 对数据产生的条件实施了控制 而得到的数据为实验数据。实 验数据通常是单一因素作用的 结果。
3.(Nominal)名义级数据 数据的最低级,无次序之分,只是
一种标志,用以区分变量的不同值。可 用数字也可用字母。
Ex: 性别: 女(0) 女(F) 男(1) 男(M)
2.2.2 不同测度类型的数据的用途
在统计分析中,不同测度类型的 数据扮演不同的角色。不同测度级 别的数据,应用范围不同。 等级越 高,应用范围越广泛;等级越低, 应用范围越受限制。
抽样调查有两层含义 1.“抽样”:抽取部分个体 2.“调查”:调查反映在个体上的, 所要研究的特征的数据。
样本个体的特征数据为“样本数据”
相对于普查,抽样调查的成
本低,所耗费的时间少,在收集 个体信息方面,信息收集更为详 尽和准确。
从总体中,恰当地选取部分个 体进行调查,是统计学中最重要的 问题之一,也是“获得数据方法” 所要研究的中心内容。那么
实验方法
普查方法
抽样调查
2.3.1 概念与基本方法
1.普查 (Census) 普查针对有限总体而言。收集
有限总体中每个个体的有关指标 的指标值。 Ex: 人口普查
2.抽样调查(Sampling)与样本 (Sample)
在总体中选择一部分个体进行 调查,从所了解的局部数据来 了解总体情况。
总体中,部分个体所组成的集 合称为样本(Sample)集合。
2. Ordinal 序次级数据 数据的中间级。可用数字,字母来表示 Ex: 受教育程度
小学 = 1 初中 = 2 高中 = 3 大学本科 = 4 研究生 = 5
各编码的序值,代表了受教育 程度的高低差异。这一差异不 能准确描述差别的大小,但可 以确定其顺序,即可进行不等 式运算。
研究生 > 大学本科 > 高中> …
Charpter2 数据与数据的获得
2-1 总体、个体、特征与数据 2-2 数据类型 2-3 获得数据的调查方法 2-4 问卷设计
2-1 总体、个体、特征与数据
2.1 总体、个体、特征与数据
1. 总体 ( Population or Universe)
所研究对象的全体,称为总体.例 如,某专业同一年的考生可以构成 一个总体,一条生产线上生产出来 的某零件可以构成一个总体。
Ex: 研究汽油添加剂对增加汽车行程的影 响,实验中限制如下条件
剂量一致 同一辆汽车进行实验 同一道路上进行测试实验 选择无风的天气,排除风向和风速
对汽车行程的影响。
此时,影响“汽车行程”的因素基本 上是由添加剂本身的因素造成的。
wenku.baidu.com
2-3 获得数据的调查方法
获得数据的方法分为两大类
观察(调查)法
如何取样?
4. 抽样方法 Methods of Sampling 非随机抽样Judgment Sampling
不同测度类型的数据都可以作为统计 对象直接进入统计处理。
Ex: 当我们获得不同文化程度的顾客对某 种数码产品的偏好数据后,我们可以用 统计方法来分析两个变量(文化程度, 品 牌)是否相关。
文化程度:顺序型变量
品牌:名义级变量
分类分组作用
Ex: 名义级变量Categorical Variable,“职工的 性别”:将职工总体分为“男”“女”两组, 统计不同组的平均工资。
2.1 总体、个体、特征与数据
我们对任何总体感兴趣,其实是对总 体中的个体的特征感兴趣。当要联合考 察总体或个体的若干个特征,我们面对 的就是指标向量。
Ex: “学生” (考分 身高 年龄 性别 )
2.1 总体、个体、特征与数据
4. 指标值或数据(Data) 在研究一个总体时,所要研究的每个
特征,在每个个体上,都有一个反映 该特征的具体描述,被称之为指标值。
相关文档
最新文档