MBA必修《数据、模型与决策》之数据的意义、分类及来源

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
– “领导干部家属经商,是:” a) 与领导干部无关(“关系”层面) b) 领导自律不严(“态度”层面) c) 领导纵容包庇(“态度”层面) d) 权钱交易(“态度”层面) e) 。。。。。。
(4)无论对多选还是单选(特别单选)问题,任何一个备 选答案都不能有多重含义
– 在调查农民对土地使用权转让的态度问题时,设置问题,“你家 耕种土地,是因为:”
(2)对单选问题:备选答案不应是两个层面的混淆
– “领导干部家属经商,与领导干部的关系是(选一):” a) 无关(“关系”层面) b) 领导自律不严(“态度”层面) c) 领导纵容包庇(“态度”层面) d) 权钱交易(“态度”层面) e) 。。。。。。
(3)对多选问题:备选答案可以交叉,也可以处于不同层 面
• 注意:在一定区间内可以任意取值的变量叫连续变量,其数值是连 续不断的,相邻两个数值可作无限分割,即可取无限个数值.例如,生 产零件的规格尺寸,人体测量的身高,体重,胸围等为连续变量,其数 值只能用测量或计量的方法取得.
定性数据的测度
• 定名数据(无序分类尺度)
– 数值属于不同类型,没有任何数学意义或者排序上的意义 – 性别、宗教、种族
a) 。。。 b) 没有别的收入途径 c) 确保全家生计 d) 。。。。。。
• 选择b),则一定选c);c)包含b)
(6)问题设计的用词要准确
– 例如,提问中用“最”,就不能是多选题,也不能要求对备选答 案排序
(7)问题设计的用语要含义明确
– 在调查被访问对象是否上过因特网时,应注明“上网”含义,如 含不含收发EMAIL?(同单位人员之间可以通过电话拨号直接访 问服务器,无须通过因特网)
a) 有知识的人 b) 有钱的人 c) 有权的人
• 多数人会选a),但不一定真实;为验证可靠性 (诚实性),在其它位置设置如下问题:
• “假如你正在忙于一件对你个人非常重要的事,这时你的 同事告诉你,你的顶头上司找你有事,你会(选一)”:
a) 立即放下手头的事,去见你的上司 b) 请同事转告上司稍等一会儿,把手头的事处理到一个小段落后,
– 访问(面对面)调查 – 邮寄调查 – 电话调查 – 网络调查 – 座谈会 – 个别深度调查
• 访问(面对面)调查
– 回答率较高 – 容易收集到希望了解的信息 – 调查双方能互相启发,帮助弄清或理解问题 – 能够通过直接观察,辨别回答的客观性和真实性
• 邮寄调查
– 调查费用较低 – 调查人数、区域不受限制 – 有充分时间思考、作答 – 对问题看法不受调查员影响
问卷问题的产生
(1)依据研究目标,确定所需要收集的数据,从 而确定设置哪些问题
(2)对变量(特征)之间的相互关系的猜想,是 成功地设计问卷的关键之一。例如
– “企业对开展电子商务的政策要求”
• 做法:列举有关政策,请企业对其重要性表态 • 当猜想到企业的态度与开展电子商务有关情况有关,就应将
“开展电子商务的投资、收入”纳入问卷
定性决策:根据决策者的经验和判断力做出决断
定量决策:从描述与决策目标相关的的事物和
决策 现象状态、规模、变化趋势的数值出发,
按照一定的思维方式和方法找出方案的评价值,

再进行方案选择
DATA ?
• 数据:所研究的事物、现象的属性的具体描述,是决策所 依据的数值
• 分类:企业管理决策中,表现为各种资料
可控投入
不可控投入(环境因素) 决策模型
产出(决断)
MODELLING
• 构建决策模型是问题的核心。各种数学模型具体 结构不同,但都含有代表投入因素的变量(或常 量)和代表产出结果的变量,并且按特定联系法 则构成的数学表达式
• 建模就是抓住实际决策问题的主要环节,删繁就
简,提炼出投入变量。确定它们与结果变量的数
再去见上司 c) 请同事转告上司,现在很忙,办完手头的事就去
• 然后,再在其它位置设置如下问题:
• “假如你正在忙于一件对你个人非常重要的事,这时你的 同事告诉你,有位教授来访问,希望你去介绍情况,你会 (选一)”:
a) 立即放下手头的事,去见这位教授
b) 请同事转告教授稍等一会儿,把手头的事处理到一个小段落后, 再去见他
• 定秩数据(有序分类尺度)
– 数值属于不同类型,没有任何数学意义,但有排序意义(类型的 级别)
– 年级、酒店星级、体育竞赛金银铜牌 – 数据无量纲,数值间差值不代表具体差距
定量数据的测度
• 定距数据(间隔尺度)
– 数值有数学意义,差值代表具体差距;但“零点”是认为指定的, 数值间的比例没有意义
– 温度、效用、统计指数、智商
– 例如,研究个人所得税起征点与逃税时 – “当个人所得税起征点是如下哪种情况时,你认为不必逃税? ” a) 800 b) 1500 c) 2000 d) 2500 (谁愿意表示自己想逃税呢?)
(2)对怀疑得不到诚实回答的问题,应当在不同 位置,设置相同、相近、相反的问题,以求相 互验证
• 例如,在调查社会各阶层对官本位的态度时, 可以设置问题:“你最尊重的人是”
数据的意义、分类和来源
1. 数据、模型与决策的联系 2. 数据的分类 3. 数据的获取
Topics
数据、模型与决策的联系
• 决策:为达到某一预定目标,在掌握充分、必要的数据前 提下,按照一定的价值评判标准,运用逻辑和数学推理方 法,对可能采取的方案做出合理的选择
DECISION-MAKING ?
c) 请同事转告教授,现在很忙,办完手头的事再去
• 进而,不妨再在其它位置设置如下问题:
• “假如你正在忙于一件对你个人非常重要的事, 这时你的同事告诉你,市长来访问,希望你去介 绍情况,你会(选一)”:
a)立即放下手头的事,去见市长
b)请同事转告市长稍等一会儿,把手头的事处理到一个 小段落后,再去见他
– 空间:内部与外部资料 – 特征:数据型和文字型资料 – 时间:往期、当期和预测资料
• 数据的准确性对于决策至关重要
MODEL ?
• 模型:真实事物的人为再现或概要复制。模型略去次要枝 节,突出主干,浓缩了问题的核心
• 图解模型和数学模型
DATA AND MODEL
• 决策作为一个过程,以数据为投入,以对不同方案的选择 为产出,而模型是由数据到决断这一过程所遵循的思维方 式和方法
• 定性(类型)数据
– 非数值型,其值没有数学意义 – 性别、年级、主营业务、经济性质
• 定量数据
– 数值型,其值有数学意义 – 温度、重量、员工数、销售收入
• 定量数据
– 离散型数据(Discrete):取值不连续
• 汽车整车产量、电视机产量
– 连续型数据(Continuous):取值连续
• 灯泡使用寿命
• 电话调查
– 速度快 – 成本低 – 具备访问调查的一些优点

• 网络调查
– 高效、便利,趋势
• 座谈会
– 广开言路,有利于取得较为广泛、深入的意见
• 个别深度调查
– 一次只有一名受访者参与,适宜较隐秘和敏感问题研究
• 座谈会和个别深度调查属于定性法,不能对总体特征进行 推断
2. 观察法:调查人员深入现场亲自观察、测量计数取得数 据的方法
– 什么是“网民”?
– 申报博士点材料中,科研成果的统计,什么是“省部级奖励”? 什么是“本专业成果”?
(8)问题的不同提法,可能导致不同结果
– 赫兹伯格在数千个案例研究基础上发现双因素理论的过程:当你 问某个被访问者对某个问题的满意程度时,被访问者可能回答满 意程度是70%。因此,在多数人看来,被访问者对这个问题的不 满意程度是30%。但当你用同一个问题问同一个被访问者的不满 意程度时,赫兹伯格发现,绝大多数情况下的回答都不是30%, 而是40%、50%,甚至更多。据此,赫兹伯格提出了“双轨道” 论,即对某个问题的满意与不满意的感觉是两个平行的轨道,每 个轨道(满意或不满意)的刻度范围都是0%到100%,从而产生 了他的双因素理论
• 如果被调查对象是国有企业,也可以设置问题:“你对同 行业中民营企业逃税情况的判断是(选一):”
a) 逃税企业的比例低于5% b) 逃税企业的比例在5%到10%之间 c) 逃税企业的比例在10%到20%之间 d) 。。。。。。
• 定比数据(比例尺度)
– 数值的差值不仅代表具体差距,而且有自然的“零点” ,数值间 的比例有意义
– 重量、产量、高度、产品使用寿命
CASE
• 例:考察美国20所学校情况,获得如下数据:学校名称、 学生数量、每名学生月花费金额、教师的平均工资、学生 的智商
– 学校名称:定性、定名数据 – 学生数量:定量、定比数据 – 每名学生月花费金额:定量、定比数据 – 教师的平均工资:定量、定比数据 – 学生的智商:定距数据
a) 收入稳定,自己喜欢 b) 没有别的收入途径 c) 。。。。。。
• a)有:收入稳定与喜欢2层含义,无法区分究竟是因为收 入稳定,还是喜欢,导致自家耕种土地
(5)无论对多选还是单选(特别单选)问题,备选答案之 间不能有包含关系
– 在调查农民对土地使用权转让的态度问题时,设置问题,“你家 耕种土地,是因为:”
c)请同事转告市长,现在很忙,办完手头的事再去
• 这样,你就可以得到很有意思的回答,对于分析 问题、了解真实情况非常有帮助
• 如果担心还得不到诚实回答,可以分2次去调查同 一个人;把“教授”和“市长”的问题在2次问卷 分开
问卷问题写法的几个关键
(1)对单选问题:备选答案应是一个完备划分
– “领导干部家属经商,与领导干部的关系是(选一):” a) 无关 b) 少数有关 c) 半数有关 d) 多数有关 e) 全部有关
• 数据的来源与获取方法 • 总体与样本 • 统计调查方式
数据的获取 ?
数据的来源与获取方法
• 直接来源:专门为本次研究,通过一定方法而直接获取的 一手数据(primary data)
• 间接来源:通过各种渠道获取的已经存在的二手数据 (secondary data)
一手数据的获取
1. 询问法:直接向调查对象提出问题以获得信息的一种方 法。根据与被调查者接触方式不同分为
理关系,用数学表达式进行表达。一旦模型建立,
投入已知数据,经运算得出结果,据此对方案做
出选择
R
• 特征:附着在研究对象上的信息 • 变量:表示研究对象特征的量
– 性别、年级、温度、重量
• 变量值(数据):变量的具体取值
– 性别=男 – 年级=2年级 – 温度=摄氏30度 – 重量=70KG
数据的分类
– 优点:被调查者未察觉,表现自然。数据比较客观、准确 – 缺点:难以观察到决定外部反映的内在因素
3. 实验法:在人为设定的特殊实验场所、特殊状态下,对 调查者进行实验以取得数据的方法;分为室内或市场实 验法
4. 模拟法:不是从对象存在和发生的现场获取数据,而是 依据一定的基本数据和规律,用计算机产生大量随机数 据
对于得不到诚实回答而又必须了解 的数据的处理办法
(1)变换问题的提法,从而获得相应数据
– 例如,想要调查企业的逃税情况,可以按照如下方式设置问题: “你对同行业中逃税情况的判断是(选一):”
a) 逃税企业的比例低于5% b) 逃税企业的比例在5%到10%之间 c) 逃税企业的比例在10%到20%之间 d) 。。。。。。
二手数据的获取
• 公开出版或报道的数据
– 统计年鉴、学报、报告、报刊、杂志、图书、视频、因特网
• 未公开的数据
– 内部资料
• 引用应注明出处
数据调查中若干重要问题
• 数据调查通常以问卷为基础,问卷是管理学科调查收集 数据最重要的工具
• 问题
1. 问卷问题的产生 2. 问卷问题设立的关键:能够获得诚实的回答 3. 问卷问题写法的几个关键 4. 对于得不到诚实回答而又必须了解的数据的处理办法 5. 问卷设计一定要通过小规模访谈来修改
– “农民对土地使用权转让的态度”
• 做法:列举各种态度供选择 • 同时,纳入“农民年收入、非农收入占年收入比例”
(3)预先考虑到数据处理方法,也会影响到问卷问题的设 置(只有学完统计学后才可以理解)
问卷问题设立的关键:能够获得诚 实的回答 (1)凡是不能获得诚实回答的问题,都不应设置在问卷中
– 例如,在招聘时,想了解应聘者的情商 – “当你受挫折后,你的反应是” a) 非常沮丧,长时间不能恢复正常情绪 b) 很沮丧,较长时间不能恢复正常情绪 c) 很沮丧,但能很快恢复正常情绪 d) 越失败、越受挫折,越想再干 (哪个应聘者愿暴露弱点而不被录取呢?)
相关文档
最新文档