数据,模型与决策-运用电子表格建模与案例研究,pdf

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据,模型与决策:运用电子表格建模与案例研
究,pdf
篇一:数据模型与决策
2002年旅游产业企业及收入分析
一、研究的目的要求
旅游业在社会经济的持续发展中有着重要的作用。

旅游者合理的旅游消费模式和适度的旅游消费规模有利于经济持续健康的增长,而且这也是人民生活水平的具体体现。

改革开放以来随着中国经济的快速发展,人民生活水平不断提高,居民的旅游消费水平也不断增长。

但是在看到这个整体趋势的同时,还应看到全国各地区旅游经济发展速度不同,居民旅游消费水平也有明显差异。

例如,2002年全国旅游业全员劳动生产率为51.7万元/人, 最低的青海省仅为11.9万元,最高的北京市达110.7元,上海是黑龙江的9.3倍。

为了研究全国旅游业全员劳动生产率水平及其变动的原因,需要作具体的分析。

影响各地区旅游业全员劳动生产率有明显差异的因素可能很多,例如,旅游资源开发水平、宣传力度、
交通便利程度、旅游服务质量、旅游者兴趣爱好、购物环境等等都可能对旅游业全员劳动生产率有影响。

为了分析什么是影响各地区旅游业全员劳动生产率有明显差异的最主要因素,并分析影响因素与旅游业全员劳动生产率的数量关系,可以建立相应的计量经济模型去研究。

二、模型设定我们研究的对象是各地区旅游业全员劳动生产率的差异。

旅游业全员劳动生产率可分为境外旅游业全员劳动生产率和境内旅游业全员劳动生产率,由于各地区的境外与境内旅游者比例及兴趣爱好有较大差异,最具有直接对比可比性的是总的旅游业全员劳动生产率。

而且,由于各地区从业人员数量和旅游资源总量不同,只能用“旅游业全员劳动生产率”来比较,而这正是可从统计年鉴中获得数据的变量。

所以模型的被解释变量Y选定为“旅游业全员劳动生产率”。

因为研究的目的是各地区旅游业全员劳动生产率的差异,并不是旅游业全员劳动生产率在不同时间的变动,所以应选择同一时期各地区旅游业全员劳动生产率来建立模型。

因此建立的是2002年截面数据模型。

影响各地区旅游业全员劳动生产率有明显差异的因素有多种,但从理论和经验分析,最主要的影响因素应是旅行社数,其他因素虽然对旅游业全员劳动生产率也有影响,但有的不易取得数据,如“宣传力度”和“旅游者兴趣爱好”;有的与旅行社数可能高度相关,如“旅游服务质量”、“旅游资源
开发水平”;还
有的因素在运用截面数据时在地区间的差异并不大,如“购物环境”、“交通便利程度”。

因此这些其他因素可以不列入模型,即便它们对旅游业全员劳动生产率有某些影响也可归入随即扰动项中。

为了与“旅游业全员劳动生产率”相对应,选择在统计年鉴中可以获得的“旅行社数”作为解释变量X。

从2002年《中国统计年鉴》中得到表1的数据: 表 1 2002年中国各地区旅游业全员劳动生产率和旅行社数
作旅游业全员劳动生产率(Y)和旅行社数(X)的散点图,如图1:
1201008060402000
200
400
600
800
1000
1200
图1
从散点图可以看出旅游业全员劳动生产率(Y)和旅行社职工人数(X)大体呈现为线性关系,所以建立的计量经济模型为如下线性模型:
Yi=0.0491Xi+18.714
三、估计参数
假定所建模型及随机扰动项ui满足古典假定,可以用OLS法估计其参数。

运用计算机软件EViews作计量经济分析十分方便。

利用EViews作简单线性回归分析得表2的回归结果:

2
其中,参数估计的结果为:
Yi= 18.714 + 0.0491Xi (0.014039)(6.129993)t=(3.052906)(3.500938)r2=0.297082F=12.25657
四、模型检验
1、经济意义检验
所估计的参数X的系数为0.0491,说明城市旅行社数每相差1个,可导致旅游业全员劳动生产率相差0.0491万元。

2、拟合优度和统计检验
用EViews得出回归模型参数估计结果的同时,已经给出了用于模型检验的相关数据。

拟合优度的度量:由表2中可以看出,本例中可决系数为0.272843,说明所建模型整体上对样本数据拟合不是很好,即解释变量“旅行社数”对被解释变量“旅游业全员劳动生产率”的绝大部分差异不能完全作出解释。

对回归系数的t检验:由表2中还可以看出,估计的回归系数的标准误差和t值分别为:6.129993,3.052906;X的标准误差和t值分别为:0.014039,3.500938。

这表明,城市旅行社数对旅游业全员劳动生产率没有显著影响。

篇二:数据模型与决策完整
数据,模型和决策
第一章决策分析
一、比尔.桑普拉斯的夏季打工决策一个决策树模型及分析
比尔. 桑普拉斯(bill Sampras) 在麻省理工学院的斯隆管理学院就读第一学期,已经是第三周了。

除了花在准备功课上的时间外,bill开始认真考虑有关明年夏季打工的事情,特别是该决策在几周后必须做出。

8月底,在bill飞往波士顿的途中,他坐在vanessa Parker 的旁边,并与她就双方感兴趣的问题进行了交谈。

vanessa 是一个重要的商业投资银行有关资产预算的副总裁。

在飞机到达波士顿后,vanessa坦率地告(来自: 小龙文档网:数据,模型与决策:运用电子表格建模与案例研究,pdf)诉bill,她愿意考虑明年夏季雇佣bill的可能性,并希望在她的公司于11月中旬开始进行的夏季招聘计划时,请bill直接与她联系。

bill感觉到自己的经历和所具有的风度给vanessa留下了很深的印象(bill曾经在一个财富500
强公司的金融部门就来自税收业务的额外现金的短期投资工作过4年)。

当bill 8月离开公司去攻读MBA时,他的老板john Mason把他叫到一边,对他许诺,到第二年夏季可以雇佣他。

夏季回到公司进行为期12个星期的打工薪水将是12000美元。

但john也告诉bill夏季工作招聘期限仅到10月底有效。

因此,bill在得到vanessa提供夏季工作的细节之前,必须决定是否接受john的工作。

vanessa已经解释,她的公司在11月中旬之前不愿意讨论夏季工作计划的细节。

如果bill回绝john的好意,bill要么接受vanessa的提供(如果vanessa 接受bill的申请),要么通过参加斯隆管理学院在1月和2月举办的公司夏季招聘计划中,寻找另一个夏季工作机会。

决策准则
假设bill认为所有的夏季工作机会(为john工作,为vanessa工作和参加斯隆学院的夏季打工计划)都将会给bill 提供类似的学习、交流以及丰富经历的机会。

那么,bill判断夏季工作机会的优劣的唯一标准就是工作的薪水,以薪水越高越好。

构造一个决策树。

决策树(decision tree):由结点和分支组成。

三类结点:决策点□;状态(事件)点○和结果点△。

决策者在决策点上进行选择,每个选择对应一个方案,每个方案对应决策点的一个分支。

状态点对应于不确定事件,每
个事件对应状态点的一个分支。

每个决策在每个状态下会导致一个最终的结果,用结果点表示。

在bill的决策问题中,他首先必须决定是否接受john的提供;如果接受,则过程完成;否则,如果vanessa接受了他的申请,他要决定是去她那里还是参加斯隆学院的夏季工作计划。

如果vanessa不接受他的申请,他当然只能参加斯隆学院的计划了。

显然,为了进行选择,bill还需要知道一些必要的数据:他要知道每一个工作的薪水情况;他还要知道(估计)vanessa接受他的可能性。

bill通过斯隆学院职业服务中心收集到了前几届MBA学生打工的有关数据。

其中,根据去年vanessa公司提供给销售和贸易部门工作的学生的薪水,bill估计今年夏季为期12个星期的打工的MBA学生的薪水为14000美元。

收集到的去年提供给斯隆管理学院学生的所有夏季工作机会的有关薪水的数据如下:
如果没有更多的信息,可以假设vanessa 接受bill的申请的可能性为50%。

不过,飞机上的经历使bill确信,这个可能性应该有60%。

bill的决策树1、方案
方案一:到Vanessa Parker的银行打工,11月中旬开始招聘,薪水14000美元;方案二:回John Mason那里工作,10月底必须答复,薪水12000美元;
方案三:参加斯隆管院的夏季工作计划,1月和2月招聘。

薪水有以下情况:21000,16800,12000,6000,0。

2、涉及的数据:可选的方案;可能遇到的状况;各方案在各种状况下的收益;各状况出现的概率。

3、一些概念(术语):决策点,状态点(事件点),决策树,期望收益,灵敏度分析,决策策略。

4、方法:问题分析时建树(展开),决策时从树叶开始收拢(期望收益方法)。

5、利用电子表格。



21600 16800 12000 6000 0

决策点状态点
12000
21600 16800 12000 6000 0
Bill的决策树
电子表格:bill工作决策.xls
条件的修改和灵敏度分析:由于数据的统计性质和可能忽略的因素。

在excel上操作。

bill的最优决策策略:(每个决策点写一条)? bill应该拒绝john 的提供;? 如果vanessa 提供bill一个机会,则接受,如果vanessa不提供给bill机会,则他应
该参加斯隆学院的计划;? 该策略的期望收益是13032美元。

二、生物影像公司的发展战略(谈判的可能性)
1998年,为了开发、生产和开拓新的具有潜在收益的医疗诊断工具市场,james bates、scott tillman和michael ford 创立了生物影像公司。

james and scott是麻省理工学院(MIT)新近毕业的学生,michael是马萨诸塞州综合医院的神经学教授。

作为在MIT研究生学业的一部分,scott已经发展出了一种新技术和一个软件,利用个人计算机来处理病人大脑的磁共振影像(MRI)扫描。

该软件利用计算机图形学的技巧,能够构造一个病人大脑的三维图像,用来定位大脑损伤或脑肿瘤的精确位置,估计它的体积和形状,甚至确定可能会被肿瘤影响的大脑的中心位置。

scott的工作扩展了由james早期开发的二维图像处理技术,这个二维技术软件包已经在马萨诸塞州综合医院的michael小组中获得广泛的应用,用来分析脑损伤对病人语言能力的影响程度。

过去的几年,这个软件已经被用来对脑损伤和脑肿瘤做比较精确的测定和诊断。

虽然还没有被充分的试验,scott的更加先进的三维图像软件,展示出比其他方法精确的多的诊断脑损伤能力。

虽然世界各地的科学家都开发了他们自己的MRI图像处理软件,scott的新的三维程序却非常不同,且比任何现有的MRI图
像处理软件先进很多。

在james的提议下,三个人组建了一个生物影像公司(Bio-Imaging),旨在开发和生产一个医院和医生可以使用的商用软件包。

不久,他们就引起了Medtech Corporation 的注意,Medtech是一个大的医学图像处理和软件开发公司,希望用15万美元购买他们的还未完成的软件包,并获得在世界范围内的开发和推向市场的权利。

scott and michael授权james(三人中的“商人”)来考虑是否接受Medtech公司的提议。

如果他们拒绝这个提议,他们的计划是在未来6个月内继续开发他们自己的软件包。

这需要大约20万美元的投资,james认为这可以由合伙人的个人积蓄解决。

如果Bio-Imaging在开发完全运作的三维图像处理程序的努力获得成功,他们将要从两个发展战略中进行选择。

一个战略是半年后向国家健康协会(NIH)申请30万美元的小企业创新研究(SBIR)资助。

这个钱用来进一步的开发和向市场推出他们的产品。

另一个选择是从风险投资公司那里寻求进一步的项目投资资金。

事实上,风险投资公司Nugrowth Development已经跟他们有过多次接触,提出如果Bio-Imaging成功地研制出三维图像处理程序的原型,公司将提供100万美元给他们用于资金周转和开发市场。

条件是,三维图像处理原型程序完全运作起来之后,80%的利润归Nugrowth Development。

(NIH规则规定,得到NIH资助的
公司不能再接受风险公司的钱)。

james知道是否能够获得SBIR的资助本质上是不确定性,他也知道Bio-Imaging是否能够成功开发三维图像软件本质上也是不确定性。

不过,他认为,如果他们打算接受Nugrowth Development提供的风险资金,那么产品的收益可能比他们自己开发市场要高。

如果Bio-Imaging在开发三维图像软件原型方面的努力没有获得成功,james认为他们还可以用二维图像软件去申请SBIR资助。

他认为,这种情况下,获得资助的可能性比较小。

另外,在申请资助前,需要对二维图像软件进行临床调精测试,大约需要10万美元的成本。

Bio-Imaging面临的决策问题是,是接受Medtech的提议,还是继续完成三维原型的开
发。

如果他们开发成功,要决定是申请SBIR资助还是接受Nugrowth Development的风险投资。

如果三维图像软件原型的研制没有成功,要决定是否应该进一步对二维图像软件进行投资,并申请二维图像软件的SBIR资助,或者完全放弃。

其中,james也想知道Nugrowth Development公司资助的成本(未来利润的80%)是否对于资助额(100万美元)来说可能太高了。

1、方案
方案一:接受Medtech公司的提议,将技术卖给它;
方案二:继续开发,若成功,则接受Nugrowth Development公司的资助;方案三:继续开发,若成功,则申请SBIR资助;方案四:继续开发,若不成功,也申请SBIR资助;方案五:继续开发,若不成功,则放弃。

2、数据
四个分布:三维图像软件开发成功的概率60%;成功后获得SBIR资助的概率为70%,若不成功获得SBIR的资助的概率为20%;三维图像软件的市场状况的分布:高利润20%,中等利润40%,低利润40%;二维图像软件的市场状况分布:高利润25%,低利润75%。

收益值:在获得SBIR 资助(全部用于产品的生产开发和市场开发)的情况下三维图像软件的收益分别为300,500,0;二维图像软件的收益为150,0;如果接受Nugrowth Development的资助,三维图像软件的收益分别为1000,300,0(的20%)。

卖给Medtech 公司的收益为15。

成本:开发三维软件20万,继续优化二维软件10万。

3、节点
篇三:数据模型与决策
1、简述定量分析与定性分析的关系,并列举工作中定量分析的例子。

答:定量分析与定性分析的关系
定量分析(quantitative analysis)是测定试样中各种组分
(如元素、根或官能团等)含量的操作,指分析一个被研究对象所包含成分的数量关系或所具备性质间的数量关系;也可以对几个对象的某些性质、特征、相互关系从数量上进行分析比较,研究的结果也用“数量”加以描述;通常是对社会现象的数量特征、数量关系与数量变化的分析。

投资分析师使用数学模块对公司可量化数据进行的分析。

通过分析对公司经营给予评价并做出投资判断。

定量分析的对象主要为财务报表,如资金平衡表、损益表、留存收益表等。

其功能在于揭示和描述社会现象的相互作用和发展趋势。

定量分析方法很多,但各种方法在应用时往往都有一定的程序化。

如实验法、观察法、访谈法、社会测量法、问卷法、描述法、解释法、预测法等等。

定性分析(qualitative analysis)是指对研究对象进行“质”的方面的分析。

具体地说是运用归纳和演绎、分析与综合以及抽象与概括等方法,对获得的各种材料进行思维加工,从而能去粗取精、去伪存真、由此及彼、由表及里,达到认识事物本质、揭示内在规律。

定性分析的主要任务是确定物质(化合物)的组成,只有确定物质的组成后,才能选择适当的分析方法进行定量分析,如果只是为了检测某种离子或元素是否存在,为分别分析;如果需要经过一系列反应去除其他干扰离子、元素或要求了解有哪些其他离子、元素存在,为系统分析。

定性分析必须通过一系列的试验去完成,如果
试验结果与预期相符,称为得到一个“正试验”,或者称为试验阳性,也就是说某组分在试样中是存在的;反之,得到一个“负试验”或试验阴性表示某组分不存在。

定性分析与定量分析应该是统一的,相互补充的;定性分析是定量分析的基本前提,没有定性的定量是一种盲目的、毫无价值的定量;定量分析使定性分析更加科学、准确,它可以促使定性分析得出广泛而深入的结论。

定量分析是依据统计数据,建立数学模型,并用数学模型计算出分析对象的各项指标及其数值的一种方法。

定性分析则主要凭借分析者的直觉、经验,凭借分析对象过去和现在的延续状况及最新的信息资料,对分析对象的性质、特点、发展变化规律作出判断的一种方法。

相比而言,前一种方法更加科学,但需要较高深的数学知识,而后一种方法虽然较为粗糙,但在数据资料不够充分或分析者数学基础较为薄弱时比较适用,更适合于一般的投资者与经济工作者。

但是必须指出,两种分析方法对数学知识的要求虽然有高有低,但并不能就此把定性分析与定量分析截然划分开来。

事实上,现代定性分析方法同样要采用数学工具进行计算,而定量分析则必须建立在定性预测基础上,二者相辅相成,定性是定量的依据,定量是定性的具体化,二者结合起来灵活运用才能取得最佳效果。

不同的分析方法各有其不同的特点与性能,但是都具有一
个共同之处,即它们一般都是通过比较对照来分析问题和说明问题的。

正是通过对各种指标的比较或不同时期同一指标的对照才反映出数量的多少、质量的优劣、效率的高低、消耗的大小、发展速度的快慢等等,才能作为鉴别、下判断提供确凿有据的信息。

工作中定量分析的例子
1. 企业销售收入与产品销量之间的关系。

2. 企业通过打指纹进行考勤记录,并在每月工资条中显示具体的全勤奖金额。

3. 企业中员工的差旅费对企业总成本的影响。

4. 销售管理中,销售业绩指标与广告费用的确认分析等。

2、回归分析:作为交通安全研究的一部分,美国交通部采集了每1000个驾驶执照发生死亡事故的车祸次数和有驾驶执照的司机中21岁以下者所占比例的数据,样本由42个城市组成,在一年期间采集的数据如下。

利用回归分析去研究发生死亡事故的车祸次数和司机中21岁以下者所占比例之间的关系,并对你的研究结果进行讨论。

答:
Y = 发生死亡事故的车祸次数
X1= 司机中21岁以下者所占比例
通过对Excel中的数据使用CORREL命令,求出两列数据的相关系数,r值为0.83938748。

Line Graph图:
由上图可以看出,Y与X1的变化趋势相近,且r值很大,说明车祸发生次数与21岁以下年轻人所占比例有高度的线性相关关系。

设Y为被解释变量,X1为解释变量,建立如下线性模型。

Y=C1+C2*X1
将数据导入Eviews软件进行回归分析,运行结果如下:Deadcount = -1.597414 + 0.287053*Rate
t-Statistic (-4.297919) (9.767112)
Prob.(0.0001) (0.0000)
R-squared 0.704571
根据|t|=2 的标准,P值小于0.1,R值70.46%,可见发生死亡事故的车祸次数(Y)与司机中21岁以下者所占比例(X1)有显著的线性关系。

看到R平方只有70.46%,一般双对数回归模型的拟合优度会达到90%左右,这个值不是很大,说明发生死亡事故的车祸次数不仅仅与司机中21岁以下者所占比例有关,可能还与其他因素相关。

例如:天气恶劣、酒后驾车、路况条件不好等等因素。

另外,拟合优度不是很好的原因可能包括采集的数据质量存在问题。

比如,可能存在以下两种情况:
(1).数据采集中是否关注了男女比例的问题。

如果21岁以下的驾驶员存在男女驾驶技术不同的差异,而采集时又没有关注男女比例,则会造成偏差。

(2).不同城市间是否存在对于21岁以下驾驶员培训程度不同的情况。

如果存在不同,则42个城市选取的数据有可能会造成偏差。

(3).对发生死亡车祸的司机责任未进行区分,到底是主动造成车祸死亡还是被动造成车祸死亡。

如果是主动造成车祸死亡,那么与司机的驾驶经验、是否酒后驾车行为相关。

如果是被动造成车祸死亡,那么这些因素的影响程度就不是很显著。

3、利用双对数模型计算1980-2010能源消费弹性。

答:数据主要通过学校图书馆数据库-中国知网中的数据统计功能采集。

时间
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006 GDP(亿元)4545.6 4891.6 5323.4 5962.7 7208.1 9016.0 10275.2 12058.6 15042.8 16992.3 18667.8 21781.5 26923.5 35333.9 48197.9 60793.7 71176.6 78973.0 84402.3 89677.1 99214.6 109655.2
120332.7 135822.8 159878.3 183217.4 211923 能源消费总量(万吨标准煤)60275 43241.75 45724.76 48975.26 53369.44 76682 61284.3 66013.58 70863.71 96934 98703 103783 109170 115993 122737 131176 135192 135909 136184 140569 145531 150406 159431 183792 213456 235997 258676。

相关文档
最新文档