第12章管理统计学
社会统计学第十二章 相关与回归分析

2. 相关方向:正相关和负相关 所谓正相关关系是指一个变量的值增加时,另一变
量的值也增加。例如,受教育水平越高找到高薪水工作的 机会也越大。而负相关关系是指一个变量的值增加时,另 一变量的值却减少。例如,受教育水平越高,理想子女数 目越少。要强调的是,只有定序以上测量层次的变量才分 析相关方向,因为只有这些变量的值有高低或多少之分。 至于定类变量,由于变量的值并无大小、高低之分,故定 类变量与其他变量相关时就没有正负方向了。
父母智力 组合
优+优
优+劣 一般+一般
劣+劣
子女智力 子女智力
优秀
一般
71.6 25.4
33.6 42.7
18.6 66.9
5.4 34.4
子女智力 低下
3.0 23.7 14.5 60.2
通过列联表研究定类变量之间的关联性,这 实际上是通过相对频数条件分布的比较进行的。 如果对不同的X,Y的相对频数条件分布不同,且 和Y的相对频数边际分布不同,则两变量之间是 相关的。而如果变量间是相互独立的话,必然存 在着Y的相对频数条件分布相同,且和它的相对 频数边际分布相同。后者用数学式表示就是
r×c相对频数联合分布列联表
控制X,Y相对频数条件分布列联表
控制Y,X相对频数条件分布列联表
[例A1]试把下表所示的频数分布列联表,转 化为自变量受到控制的相对频数条件分布列联 表,并加以相关分析。
投票行为
受教育程度X
Y
大学以 大学以
FY
上
下
投票
160
129
289
弃权
7
61
68
合计:FX 167
r×c相对频数分布列联表的一般形式
在相对频数分布列联表中,各数据为各分类
(12)第12章 国民经济统计基础知(曾五一)

统计学 四、国民经济核算的基本原则
STATISTICS
(一)计量社会产品的生产性原则和社会性原则 “生产性原则”是指国民经济核算应对生产活动的 全部有效成果进行计量。 “社会性原则”是指作为核算对象的生产成果还必 须具有社会性,即不仅是生产者个人所需要的,而 且还是社会所需要的,是能得到社会承认的成果。 (二)国民经济核算的平衡原则 社会产品的生产、分配和使用三者在总量上应该是 恒等或平衡的。这就是所谓的“平衡原则”,国外 有的学者将这种关系称作“三方等价原理”。
最常用的国民经济总量指标。
12 - 18
图12-2 常用国民经济统计指标
统计学
STATISTICS
二、国民经济生产指标
(一)国内总产出 “国内总产出”是指一定时期内国民经济各部门生产的社会 总产品的价值总量。 从实物形态看,社会总产品可分为货物和服务两大类。从价 值形态看,国内总产出是社会总产品完全价值的总和,其价 值构成为:(1)生产资料转移价值c,包括劳动手段转移价值 (固定资产折旧)c1和劳动对象转移价值(即中间消耗)c2 ;(2) 活劳动新创价值,包括必要劳动价值v和剩余劳动价值m 。 国内总产出包括了生产资料转移价值的大量重复计算,并且, 这种重复计算的程度还与生产组织的内部结构的变化有关。 国内总产出只是一个有关国民经济生产的“总周转量”指标, 它能够表明全社会生产活动的总规模,并能用于对国民经济 各部门间的技术经济联系进行投入产出分析,但不能说明国 民经济生产活动的最终成果。
12 - 12
统计学 三、国民经济核算的行业与部门分类
STATISTICS
(一)机构部门分类和活动部门分类 1. 机构部门分类。按其在取得收入和支配收入、筹集资金和 运用资金的财务决策权同一性标准进行分类的一种方法。分 类的基本单位是能够拥有资产、承担负债,从事经济活动并 与其它单位进行经济交易的实体。 我国新国民经济核算体系中,常住单位分为四个机构部门: (1)非金融企业部门。 (2)金融机构部门。 (3)政府部门。 (4)住户部门。 2.活动部门分类。按各基层单位活动性质的同类性对掌握生 产经营决策权的基层单位进行分类。这种分类存在层次差别, 根据分析的需要,可粗可细。
12章 多元线性回归

统计学第十二章 多元线性回归一. 选择题1. 在多元线性回归分析中,t 检验是用来检验( ) A 总体线性关系的显著性 B.各回归系数的显著性 C.样本线性关系的显著性 D .H 0:β1=β2=…βk =02.在多元线性回归模型中,若自变量x i 对因变量y 的影响不显著,那么它的回归系数 βi 的取值( )A.可能为0B.可能为1C.可能小于0 D 可能大于13.在多元线性回归方程 y i ˆ=βˆ0+x 11ˆβ+x 22ˆβ+…+xkkβˆ中,回归系数βˆi表示( ) A.自变量x i 变动1个单位时,因变量y 的平均变动额为βˆiB.其他变量不变的条件下,自变量x i 变动1个单位时,因变量y的平均变动额为βˆiC.其他变量不变的条件下,自变量x i 变动1个单位时,因变量y的变动总额为βˆiD.因变量y 变动1个单位时,因变量x i 的变动总额为βˆi4.设自变量的个数为5个,样本容量为20。
在多元回归分析中,估计标准误差的自由度为( )A.20B.15C.14D.18 5.在多元回归分析中,通常需要计算调整的多重判定系数R a2,这样可以避免的值()A. 由于模型中自变量个数的增加而越来越接近1B. 由于模型中自变量个数的增加而越来越接近0C. 由于模型中样本容量的增加而越来越接近0D. 由于模型中样本容量的增加而越来越接近16.在多元线性回归分析中,如果F检验表明线性关系显著,则意味着()A.在多个变量中至少有一个自变量与因变量之间的线性关系显著B.所有的自变量与因变量之间的线性关系都显著C.在多个变量中至少有一个自变量与因变量之间的线性关系不显著D.所有的自变量与因变量之间的线性关系都不显著7.在多元线性回归分析中,如果t检验表明回归系数βi不显著,则意味着()A.整个回归方程的线性关系不显著B.整个回归方程的线性关系显著C.自变量x i与因变量之间的线性关系不显著D.自变量x i与因变量之间的线性关系显著8.设多元线性回归方程为Yˆ=βˆ0+x11ˆβ+x22ˆβ+…+xkkβˆ,若自变量x i的回归系数βˆi的取值接近0,这表明()A.因变量y对自变量ix的影响不显著B.因变量y对自变量ix的影响显著C.自变量ix对因变量y的影响不显著D.自变量x对因变量y的影响显著i9.一家出租汽车公司为确定合理的管理费用,需要研究出租车司机每天的收入(元)与他的行驶时间(小时)、行驶的里程(公里)之间的关系,为此随机调查了20位出租车司机,根据每天的收入(y)、行驶时间(x1)和行驶的里程(x2)的有关数据进行回归,得到下面的有关结果(a=0.05)根据上表计算的判定系数为()A. 0.9229B. 1.1483C. 0.3852D. 0.851610. 一家出租汽车公司为确定合理的管理费用,需要研究出租车四级每天的收入(元)与他的行驶时间(小时)、行驶的里程(公里)之间的关系,为此随机调查了20位出租车司机,根据每天的收入(y)、行驶时间(x1)和行驶的里程(x2)的有关数据进行回归,得到下面的有关结果(α=0.05)根据上表计算的估计标准误差为()A. 306.18B. 17.50C. 16.13D. 41.9311. 一家出租汽车公司为确定合理的管理费用,需要研究出租车司机每天的收入(元)与他的行驶时间(小时)、行驶的里程(公里)之间的关系,为此随机调查了20位出租车司机,根据每天的收入(y)、行驶时间(x1)和行驶的里程(x2)的有关数据进行回归,得到下面的有关结果(α=0.05)根据上表计算的用于检验线性关系的统计量F=()A. 306.18B. 48.80C. 5.74D. 41.9312.一家产品销售公司在30个地区设有销售分公司。
管理统计学12 第十二章 统计决策

❖
原概率修改为P(A1)P(a2/ A1)=0.6×0.1=0.06;
❖ 当新产品销路不好时,采用新产品就要亏损X21=-3万元;不采用新产 品,就有可能用更多的资金来发展老产品,获利X22=10万元。
❖ 现确定销路好(A1)的概率为P(A1)=0.6,
❖
销路差(A2)的概率为P(A2)=0.4。
方案 ❖
新产品销路好 A1
P(A1)概率 0.6
新产品销路差 A2
P(A1)概率 0.4
管理统计学 [第四版]
星蓝海学习网
第十二章 统计决策
• §12.1 统计决策概述 • §12.2 以期望值为准则的决策方法 • §12.3 以最大可能性为准则的决策方法 • §12.4 决策树方法 • §12.5 贝叶斯决策方法
星蓝1海学习网
案例导入
1981年3月30日,一个大学退学生Hinckley企图对里根总统行刺。他打伤了里根、 里根的新闻必输以及两个保安人员。在1982年审判他时,Hinckley以精神病为理由 作为其无罪的辩护。在18个医师中作证的医师是Daniel R.Weinberger,他告诉法院 当给被诊断为精神分裂症的人以CAT扫描(计算机辅助层析扫描)时,扫描显示 30%的案例为脑萎缩,而给正常人以CAT扫描时,只有2%的扫描显示脑萎缩。 Hinckley的辩护律师试图拿Hinckley的CAT扫描结果为证据,争辩说因为Hinckley的 扫描展示了脑萎缩,他极有可能患有精神病,从而免于受到法院的起诉。一般地, 在美国精神分裂症的发病率大约为1.5%。利用以上数据,运用贝叶斯公式,我们 可以算出即使Hinckley的扫描展示了脑萎缩,他也只有18.6%的可能性患有精神分 裂症,因此CAT扫描无法作为其无罪的证据。
统计学原理 第12章 统计报告

3. 鲜明。主题要明确表示赞成什么、反
对什么,观点明确,态度明朗,旗帜鲜明。 4.集中。全文要围绕主题,说深说透,选 材要力争选那些最能说明观点和材料,去掉次 要正文要严谨、分明 、
3.密度法,是指适当控制统计分析报告的 数字密度,数字不应太多,也不要过少,一 般控制在全文的10%~30%,其分布要均衡。
4. 概略法,是指把复杂的统计数字概算、 扩算或简化,使读者易读易记。它可采用概 数、大单位数、范围数、代表数、代替数等 方法。 5. 明晰法,是指把一些比较抽象、复杂 的统计数字采用抽象数变具体数,或数字加 解说的办法使其变得更清晰、更明确的方法。 6. 对衬法,是指将差别较大的两种事实 数字进行对照,引起读者注意。
务、研究重点、基本内容和结构形式特征,
统计报告归纳起来主要包括专题性的分析报
告、
总结性的分析报告、进度性的分析报告、预
测决策性分析报告。
二、 (一)“四性” 1.准确性,就是要数字准确,情况真实,观点
正确,分析符合客观实际,依数据分析、判断、提
炼的观点,必须准确。 2.针对性,就是有明确的目的性和实用性,为 一定的对象服务。要“适销对路”,对准需要,不 应“无的放矢”。
7.揭示法,是指揭示统计数字的背后实质, 加强统计数字的效果。 8. 联系法,是指运用突出的事实、典型的 事例,引起人们注意,加强统计数字效果。
9. 形象法,是指利用比喻、夸张等手法使 统计数字变得形象、具体,以使读者理解。 10.图表法,是指通过统计图表来表达统计 数字,给读者直观印象,以增强统计数字效果。
五、统计分析报告例析
END
3. 时效性,就是要保证统计信息的价值。统
第12章假设检验 《统计学实验》 ppt课程ppt

x=read.table(“li12.1.txt”,header=T) #从li11.1.txt中读 入数据,记为x。
(或者:x<c(500,505,482,480,481,501,498,482, 490,481) #输入样本数据x)
t.test(x,mu=500) #检验总体均值是否等于500
Z pˆ p0
p0 1 p0
质量 500 505 482 480 481 501 490 498
频数 20 16 9 1 8 20 8 18
以0.05为显著水平检验:包装机包装出来的茶叶 的平均质量是否为标准质量500克?
2012-6-26
【统计理论】
当样本来自于非正态总体时,要检验总体 均值是否等于某个常数,在原假设成立且n 充分大时,近似地有:
*
《统计学实验》第12章假设检验
(2) 这是一个左侧检验问题,即 H0 : 500 H1 : 500
处理方法与(1)类似,具体程序如下:
x<-c(500,505,482,480,481,501,498,482, 490,481) #输入样本数据x
t.test(x,mu=500,alternative="less") #备择
t = -3.4912, df = 16, p-value = 0.9985
alternative hypothesis: true difference in means is greater than 0
95 percent confidence interval:
-343.1434 Inf
sample estimates:
平均使用寿命短?
2012-6-26
应用统计学第12章多元线性回归

∴该商品在该市下一年的年需求量的置信度为90% 的预测区间为
( yˆ0 d, yˆ0 d ) = (11.20万台,14.46万台)
15
2. 控制
在多元回归情况下,由于解释变量有多个,若控制
当模型中解释变量很多时,通常会存在较多的不显 著变量,以上步骤就非常繁琐。更为有效的方法是采 用“逐步回归”来求解多元线性回归方程。
9
逐步回归方法简介
逐步回归的基本思想是: 采用一定的评价标准,将解释变量一个一个地逐步 引入回归方程。每引进一个新变量后,都对方程 中的所有变量进行显著性检验,并剔除不显著的 变量,被剔除的变量以后就不再进入回归方程。 采用逐步回归方法最终所得到的回归方程与前述方 法的结果是一样的,但计算量要少得多。 在 SPSS 软件的线性回归功能中就提供了逐步回归 的可选项。
16
案例3的控制要求分析
假定下一年度居民家庭的年平均收入估计在 30000-31000元之间,若要以90%概率使该商品在 的年需求量不低于12万台,问应将价格控制在什 么范围内?。 解:此问题仍是单测控制问题,即要控制 X1 的取值
范围,使 P{yˆ d 12} 0.90
其中 d t (N P 1) SE /(N P 1) = t0.1(7)×0.8618 = 1.2194
d t /2(N P 1) SE / (N P 1)
14
案例3的预测分析
预计下一年度该商品的价格水平为1800元,家庭 年平均收入为30000元,求该商品年需求量的置信 度为90%的预测区间。 解:由所得回归方程,可求得
yˆ0 11.167 1.903 1.8 0.1695 30 12.83
第12章 马可维兹均值方差模型

[5.27 2.80 1.74; 2.80 4.26 1.67; 1.74 1.67 2.90 ]; %组合中每个证券的初始权重(初始投资金额)/初始总金额 PortWts=1/3*ones(1,3); %调用portstats函数 [PortRisk, PortReturn] = portstats(ExpReturn, ExpCovariance,PortWts) %计算结果 %风险(标准差) >>PortRisk = 0.016617 %组合收益率 PortReturn = 3.5033e-004
12.4 约束条件下有效前沿
在实际构建投资组合时要考虑到合法合规或者风险管理等限制条件,这样会给 组合构建带来约束,例如基金“双百分之十规则”:基金投资于某一证券的市值不 能超过基金资产的10%,基金投资于某一上市公司股票不能超过该公司市值的10%; MATLAB求解约束条件下有效前沿的函数为portopt。 函数语法: [PortRisk, PortReturn, PortWts] = portopt(ExpReturn, ExpCovariance, NumPorts, PortReturn, ConSet, varargin)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Management statistics
管理统计学
• 分析结论如下:
• 从图12-2中观察到,3年移动平均趋势值放在第二项对应
的位置上,7年移动平均趋势值放在第4项对应的位置上。 • 同时,看到7年移动平均序列比3年移动平均序列表现的
趋势更明显,这是因为它的移动间隔更长。
• 移动间隔越长,可以得到的移动平均值越少,因此,长 于7年的移动间隔通常是不可取的,因为在序列的前几项 和后几项将失去太多的移动平均值,这可能导致脱离现 象发展的真实趋势。
假定某企业1986-2005年20年的销售额序列表如表12-5 所示。
Management statistics
管理统计学
• 使用Excel的做直线趋势分析 ,输出结果如下:
ˆ 496.656 45.485t • 从分析结果得直线趋势方程为:Y t • 管理统计学
Management statistics
时间序列分析概述
时间序列分析的应用范围十分广泛,可以根据对系统进行观测得
到的时间序列数据,用曲线拟合方法对系统进行客观的描述;可 以用一个时间序列中的变化去说明另一个时间序列中的变化,从 而深入了解给定时间序列产生的机理;还可以根据时间序列模型 调整输入变量,以使系统在发展过程中保持在目标值上,即预测 到过程要偏离目标时便可进行必要的控制。
移动平均法还需要有大量过去数据的记录,如果缺少历史
数据,移动平均法就无法使用。
管理统计学
Management statistics
• 指数平滑法
指数平滑法通过对历史时间数列进行逐层平滑计算,从而消 除随机因素的影响,识别经济现象基本变化趋势,并以此预 测未来。 简单移动平均法是对时间序列过去的近期数据加以同等利用, 但不考虑较远期的数据;加权移动平均法给予近期观测值更 大的权重;而指数平滑法则不舍弃过去的观测值,但是仅给 予逐渐减弱的影响程度,即随着观测期的远离,赋予逐渐收 敛为零的权数。
2001
97314.8 127627 56.5 2170
2002
105172.3 128453 59.6 2250
2003
117390.2 129227 68.4 2359
2004
136875.9 129988 61.8 2714
国内生产总值、年末总人口数是绝对数时间序列,其中国内生产 总值就是时期序列,年末总人口数是时点序列;第一产业贡献率 是相对数时间序列;房屋平均销售价格是平均数时间序列。
时间序列的分类
时间序列
绝对数时间序列
相对数时间序列
平均数时间序列
时期序列
时点序列
管理统计学
Management statistics
年度
国内生产总 值(亿元) 年末总人口 (万人) 第一产业贡 献率(%) 房屋平均销 售价格(元/ 平方米)
2000
89468.1 126743 66.0 2112
右图所示。 从时间序列图我们 的直观印象是长期趋 势不明显,我们很难 判断出这个序列是否 确实存在着长期逐渐 向上或逐渐向下的趋 势。
这时,移动平均法和指数平滑法可以用来对时间序列进行平 滑以描述序列的趋势。
Management statistics
管理统计学
移动平均法
移动平均法是用一组最近的实际数据值来预测时间序列未来 值的一种常用方法。它是采用逐项递移的办法分别计算一系 列移动的序时平均数.形成一个新的派生序时平均数时间数 列。在这个派生的时间数列中,短期的偶然因素引起的变动 被削弱,从而呈现出现象在较长时间的基本发展趋势。 移动平均法根据预测时使用的各元素的权重不同,可以分为 简单移动平均和加权移动平均。
时间序列的组成因素与模型
时间序列的组成因素
长期趋势(trend)
季节变动(seasonal)
循环波动(cyclical)
不规则(随机)波动(irregular)
统计学上,时间序列一般有两种的模型:乘 法模型和加法模型。
乘法模型: Y T S C I
加法模型: Y T S C I
管理统计学
ˆ 输出结果可得指数趋势方程为: lgYt 2.7405 0.0221t ˆ 550.174 1.052t t 采用对数还原可得到最终的指数趋势方程为 : Y 指数曲线方程如下图所示 :
Exponential curve fit 1,600.00 1,400.00 1,200.00
2
2
t Y at
2
ct 4
仍然以上例所示某企业1986-2005年20年的销售额序列 进行分析,Excel再一次用于计算以获得二次曲线趋势 方程。输出结果如下:
Management statistics
管理统计学
由上图输出结果可以看出二次曲线趋势方程为:
ˆ 513.05 40.686t 0.253t2 Y t
么这个时间序列的第二差异将相等,即
Y3 Y2 Y2 Y1 Y4 Y3 Y3 Y2 Yn Yn1 Yn1 Yn2
管理统计学
Management statistics
如果指数曲线趋势模型能完全适用于的一个时间序列,那
明显看出二次曲线趋势模型不如直线趋势模型适合这 个时间序列,它调整后的判定系数为0.965。
Management statistics
管理统计学
仍然以例12-3所示某企业1986-2005年20年的销售额序 列进行分析,使用Excel用于计算以获得指数趋势方程。 输出结果如下:
Management statistics
二次曲线方程如下图所示:
Polynomial Curve Fit 1,600.00 1,400.00 1,200.00 y = 0.2525x 2 + 40.181x + 472.62 R2 = 0.9689
销售值
1,000.00 800.00 600.00 400.00 200.00 0.00 0 5 10 t 15 20 25
Management statistics
管理统计学
平稳时间序列平滑与预测
如果某公司1986
销售额 2500 2000 1500 销售额 1000 500 0
1985 1987 1989 1991 1993 1995 1997 1999 2001 2003 2005 2007 2009
到2005的销售额如
管理统计学
使用第一、第二、百分数差异法选择模型
上面我们对表12-5所示某企业1986-2005年20年的销售额序
列分别使用了直线趋势模型、二次曲线趋势模型和指数曲
线趋势模型。 那么,怎么对一个时间序列判断应该使用什么模型呢?除 了直观观察法和比较调整后的判定系数外,我们还可以使 用第一、第二、百分数差异法选择模型。
第十二章
时间序列分析与预测
演讲者: XXX
管理统计学
Management statistics
目录
1.时间序列分析概述 2. 时间序列平滑与预测 3. 有趋势序列的最小二乘法模型预测
4. 有趋势序列的自回归预测模型 5.季节因素分析 6.循环因子分析
Management statistics
管理统计学
应用最小二乘法,可得到线形趋势方程中未知参数和的表达式: n tY ( Y )( t ) Y b( t ) b a n t ( t ) n n 假定时间序列的中间项为0,这样上述公式可以简化为 :
2 2
b
ty t
2
a y
管理统计学
Management statistics
Management statistics
管理统计学
如果直线趋势模型能完全适用于的一个时间序列,那么这
个时间序列的第一差异将相等,也就是说连续观察值之间
的差值应该是相等的 ,即
Y2 Y1 Y3 Y2 Yn Yn1
如果二次曲线趋势模型能完全适用于的一个时间序列,那
势值由序列中前5年的观察值相加再除以3得到:
MA (3) Y1 Y2 Y3 1587.7 1558.0 1752.5 1632 .73 3 3
依次类推,可得3年移动平均趋势值和7年移动平均趋势 值如图12-2所示。 在序列中前 L 1 2 年和后 L 1 2 年都不可能得到移动平均 值。所以,以3年移动平均序列为例,序列的前一年和后 两一年都是没有移动平均值的。
Management statistics
管理统计学
冬天即将来临,某从事汽车租赁业务的经理着手调查客户对防
雪汽车的需求情况。经过监测后,一场初冬的暴风雪席卷了整 个地区,正如所料,每天的需求量都有显著增长,这时,想知
道第10天应该储备多少辆防雪汽车以备第11天使用。
解:取 a 0.3 ,利用Excel分析的结果如图12-3所示。
Management statistics
管理统计学
线性趋势模型
• 在实际应用中,很多时间序列像销售额、进出口额和产品的产
量等都近似是一条直线。那么,可以用下面的线性趋势方程来
描述:
ˆ a bt Y t
ˆ 是时间t的预测值;是时间标号;是趋势线在纵轴上的截 Y a 式中, t
b 距;是趋势线的斜率。
• 直线曲线方程如下所示 :
Linear curve fit 1,600.00 1,400.00 1,200.00
销售值
1,000.00 800.00 600.00 400.00 200.00 0.00 0 5 10 t 15 20 y = 45.485x + 498.66 R2 = 0.9681