2007统计学第十三章
贾俊平《统计学》配套题库 【课后习题】详解 第13章~第14章【圣才出品】

二、练习题
1.下表是 1991~2008 年我国小麦产量数据。
年份
小麦产量(万吨) 年份
1991
9595.3
2000
1992
10158.7
2001
1993
10639.0
2002
1994
9929.7
2003
1995
10220.7
2004
1996
11056.9Leabharlann 2005199712328.9
2006
1998
3 / 52
圣才电子书 十万种考研考证电子书、题库视频学习平台
移动平均值,然后再计算出各比值的季度(或月份)平均值。 (3)季节指数调整。由于各季节指数的平均数应等于 1 或 100%,若根据第 2 步计算
的季节比率的平均值不等于 1 时,则需要进行调整。具体方法是:将第(2)步计算的每个 季节比率的平均值除以它们的总平均值。
圣才电子书 十万种考研考证电子书、题库视频学习平台
第 13 章 时间序列分析和预测
一、思考题 1.简述时间序列的构成要素。 答:时间序列的构成要素分为 4 种,即趋势、季节性或季节变动、周期性或循环波动、 随机性或不规则波动。 (1)趋势是时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,也称长 期趋势; (2)季节性也称季节变动,它是时间序列在一年内重复出现的周期性波动; (3)周期性也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或 振荡式变动; (4)随机性也称不规则波动,是指偶然性因素对时间序列产生影响,致使时间序列呈 现出某种随机波动。
2 / 52
圣才电子书 十万种考研考证电子书、题库视频学习平台
统计学教案习题13实验设计

第十三章实验设计一、教学大纲要求(一)掌握内容1. 实验设计的基本原则随机化原则、对照的原则(对照的类型,对照的设置)、重复的原则。
2. 实验设计的基本内容和步骤3. 常用的实验设计方法(1)随机化分组方法;(2)完全随机分组设计;(3)配对设计;(4)配伍组设计及随机分组方法。
4.确定样本含量确定样本含量应当具备的条件:α、1-β、δ、σ 。
(二) 熟悉内容1. 常用的估计样本含量的计算方法及估计该试验的检验效能的方法。
(1)两样本均数比较。
(2)配对试验。
(3)样本均数与总体均数的比较。
(4)两样本率的比较。
(5)配对资料进行卡方检验时的样本含量估计。
(6)抽样调查估计总体均数的样本含量。
(7)抽样调查估计总体率的样本含量。
2. 一致性检验:Kappa值的意义及计算。
(三)了解内容1 实验设计的特点和分类。
2.临床设计书的主要内容。
3.Kappa值的抽样误差和假设检验。
二、教学内容精要(一)实验设计的特点和分类实验研究(experimental study)是指研究者根据研究目的(或研究假设),主动加以干预措施,并观察总结其结果,回答假设研究所提出的问题的一种研究方法。
实验研究可根据研究对象的不同分为两类:以动物或标本为研究对象的实验研究(experiment)和以人为研究对象的临床试验(clinical trial)。
(二)实验设计的基本原则1.随机化原则总体中的每一个观察单位都有同等的机会被选入实验组和对照组或进入样本,保证了非处理因素在各组间均衡一致而使样本具有代表性。
2.对照原则正确的设立对照可可控制实验过程中非实验因素的影响和偏倚,从而使处理因素的效应充分的显露出来。
设立对照组的常见方法有:空白对照、安慰剂(placebo)对照、实验对照、标准对照及自身对照。
3.重复的原则保证每一个处理都有足够的重复数(样本量),避免把偶然性或巧合的现象当作必然的规律性现象,并能正确的估计实验误差。
第十三章 数量性状

1、平均数
X1 +
(∑x) —————— ∑ ( x x ) ∑x n 方差(s2)= ——————— = ———————————— n-1 n-1
— 2 2 _____ 2 = __________________ 2
2
标准差(s) = √ s
√
∑ (x-x) ——————— n-1
方差:是平均单个变量与平均值(即中间值)的 偏差的平方。方差值的大小说明什么?为什么不直 接用各个变量的平均的离均差? n-1 理由:小样本数( 30以下)时用n-1(样本数-1), 样本数大时,直接用 n . ● 标准差:方差值的平方根。
VI —互作方差或上位方差(非等位基因之间的 相互作用,及上、下位效应,也会造成个体间表型上 的差异,也提供了一定量的表型方差) VP F2 代的表型方差,它包含了全部方差成 分,是全部方差成分的集中表现。
表兄、妹婚配的近交系数——假定有某基因
第一代
兄、妹 表兄、妹
a 1a 2
a 3a 4
a1 carrier ? a1 =1/2 a1 carrier ? a1 =1/2 ×1/2
a1 carrier ? a1 =1/2 a1 carrier? a1 =1/2 ×1/2 a1= 1/2 ×1/2 ×1/2 a1 a1 =1/8 ×1/8=1/64
三、数量性状遗传分析的统计学基础
x2 + x3 +… + xn 平均数(X)= n x —— 随机变量(通过实验取样测得一个个具体 的数据), n —— 随机变量的个数(样本的个数)。 关于平均数的代表性… 它不不能描述(反映)一 个群体个体的集中度(或个体的分散度)。它是重要 的指标,但代表性有限,需要另外的指标来补充描述。 2、方差(variance)与 标准差(standard deviation)
贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第13章 时间序列分析和预测)【圣才

第13章时间序列分析和预测13.1 考点归纳【知识框架】【考点提示】(1)时间序列构成要素及平稳序列、非平稳序列的含义(简答题考点);(2)时间序列的描述性分析(简答题、计算题考点);(3)平稳序列的预测,重点是移动平均法、一次平滑指数法(选择题、简答题、计算题考点)。
【核心考点】考点一:时间序列1.成分分解表13-1 时间序列的成分2.分解模型表13-2 时间序列构成因素的组合模型【注意】四种因素不一定同时存在于每个时间序列中。
一般情况下,经常存在的是长期趋势,季节变动因素和周期变动因素则不一定存在。
3.平稳序列与非平稳序列(1)平稳序列平稳序列是基本上不存在趋势的序列。
这类序列中的观察值基本上在某个固定的水平上波动,虽然在不同的时间段波动的程度不同,但并不存在某种规律,其波动可以看成是随机的。
(2)非平稳序列非平稳序列是包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合。
其又可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。
考点二:时间序列的描述性分析1.速度分析指标(1)增长率环比增长率:G i =(Y i -Y i -1)/Y i -1=Y i /Y i -1-1(i =1,…,n )定基增长率:G i =(Y i -Y 0)/Y 0=Y i /Y 0-1(i =1,…,n )式中,Y 0表示用于对比的固定基期的观察值。
(2)平均增长率(平均增长速度)111n n Y G Y -=⨯⨯-=- 式中,G _表示平均增长率;n 为环比值的个数。
(3)增长率分析中应注意的问题①当时间序列中的观察值出现0或负数时,不宜计算增长率,此时直接用绝对数进行分析;②增长1%的绝对值表示增长率每增长一个百分点而增加的绝对数量,其计算公式为:增长1%的绝对值=前期水平/100。
2.水平分析指标【考点拓展】表13-3考点三:平稳序列的预测1.简单平均法112111()t t t i i F Y Y Y Y t t +==+++=∑ 12121111()11t t t t i i F Y Y Y Y Y t t +++==++++=++∑2.移动平均法对于t+1期的简单移动平均预测值为:F t+1=Y_t=(Y t-k+1+Y t-k+2+…+Y t-1+Y t)/k【注意】移动平均后的序列项数较原序列减少,当k为奇数时,新序列首尾各减少(k -1)/2项;当k为偶数时,首尾各减少k/2项。
《统计学》课后练习题答案

A.透视表B.合并计算C.单变量求解D.分类汇总
5.小张收集了1957-2007年中国GDP的数据,如果要反映这50年我国生产发展的趋势,用什么图形最为合适?()(知识点3.5答案:D)
A.直方图B.散点图C.饼图D.折线图
37
பைடு நூலகம்33.6
130-140
12
10.9
103
93.6
19
17.3
140-150
5
4.5
108
98.2
7
6.4
150-160
2
1.8
110
100.0
2
1.8
合计
110
100
—
—
—
—
A.树苗高度低于110厘米的占总数的39.1%B.树苗高度低于110厘米的占总数的84.5%
C.树苗高度高于130厘米的有19棵D.树苗高度高于130厘米的有103棵
第二章数据的收集与整理
2.1数据的来源
2.2统计调查方案设计
2.3调查方法
2.4调查的组织方式:普查、抽样调查、重点调查、典型调查
2.5抽样的组织方式:简单随机抽样、系统抽样、分层抽样、整群抽样
2.6数据的审定:误差
2.7数据的分组
2.8.编制次数分布表:频数(次数)、频率
习题
一、单项选择题
1.小吴为写毕业论文去收集数据资料,()是次级数据。(知识点:2.1答案:C)
A.指标B.标志C.变量D.标志值
8.以一、二、三等品来衡量产品质地的优劣,那么该产品等级是()。(知识点:1.7答案:A)
A.品质标志B.数量标志C.质量指标D.数量指标
第一章 统计学绪论

福州大学管理学院统计系
郑珍远
2007年7月
※
第一章统计学绪论
※ 第二章 统计数据的收集、整理与显示 ※ 第三章 统计数据分布特征的描述 ※ 第四章 统计指数
※
第五章 时间序列分析
※ 第六章 抽样分布与参数估计 ※
第七章 统计假设检验
第八章 列联分析 ※ 第九章 方差分析 ※ 第十章 相关与回归分析
1.1.1 统计无时不有
封建社会我国的统计已略具规模。 如春秋时期的政治家管仲就曾指出:“不明于计数而欲 举大事,犹无舟楫而欲经于水险也。”“举事必成,不知计 数不可”。 战国时期的政治家商鞅也指出:“欲强国,不知 十三数,地虽利,民虽众,国愈弱,至削” 。 秦汉有地方田亩和户口资料的记载;唐宋有计口授田和 田亩鱼鳞册土地调查制度;明清则有经常的人口登记和保甲 制度等等。 但是,在前资本主义社会,由于社会经济的落后、宗教 思想的阻挠、思维方式的局限和计算技术的笨拙,统计只在 有限的范围内应用,统计发展极其缓慢。
1.1.1 统计无时不有
统计的广泛发展开始于资本主义社会。17世纪,欧洲 资本主义发展,商业、航运、海关、外贸、交通、工业、 农业等都进入了一个空前发展的阶段。为了适应社会生产 发展的需要,统计也有了很大的发展,从国家管理领域扩 展到社会经济活动的许多领域,产生了工业、农业、商业、 外贸、银行、保险、交通、邮电、海关、文教卫生等专业 统计,积累了大量的统计资料和丰富的统计实践经验。统计 工作的广泛发展,不仅提出了创立统计科学的要求,而且也 为统计科学的创立准备了社会条件。
1.1.1 1.1.2 1.1.3 1.1.4
统计无时不有 统计无处不在 统计学的产生与发展 现代统计学的发展趋势
1.1.1 统计无时不有
第十三章 一元线性回归

变量之间存在关系的两种类型: 确定性关系(函数关系) 不确定性关系(相关关系)
函数关系
1.
2.
3.
是一一对应的确定关系:一 个(或多个)确定的自变量 的值对应一个确定的因变量 的值。 y 设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完 全依赖于 x ,当变量 x 取某 个数值时, y 依确定的关系 取相应的值,则称 y 是 x 的 函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量 x 各观测点落在一条线上
l xy = ( x x)( y y ) = xy N x y
则:a = y b x
b = l xy / l xx
步骤:1、由变量x求 x来自l xx (自方差) 2、由变量y求 y,l yy 3、由x、y求l xy (协方差) 4、求a、b ˆ 5、写出方程:y = a + bx
【例】有15个学生,数学和物理成绩列于表内, 现想求一个物理成绩对数学成绩的一元回归方 程。
23 8 40 19 60 69 21 66 15 46 26 32 30 58 28 22 23 33 41 57 7 57 37 68 27 41 20 30
数学(x) 31 物理(y) 32
解:
1.
2.
3.
相关分析中,变量 x 变量 y 处于平等的地位;回 归分析中,变量 y 称为因变量,处在被解释的地 位,x 称为自变量,用于预测因变量的变化 相关分析中所涉及的变量 x 和 y 都是随机变量; 回归分析中,因变量 y 是随机变量,自变量 x 可 以是随机变量,也可以是非随机的确定变量 相关分析主要是描述两个变量之间线性关系的密 切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制
第十三讲 统计分析的原则与方法

其它资料分析
交叉设计 资料 方差分析,见第 8章 方差分析,见第8章
析因设计(可分析 交互作用)资料 重复测量设 计资料
重复测量资料的方差分析,见第 8章
二、单变量计数资料分析
单样本Z检验/基于 二项分布的确切概 率法
总体与样本 两 个 率
两 个 样 本
配对
配对χ2 (McNemar)
χ2 /Fisher确切概率法 /两样本率Z检验
非配对
双向无序
多样本率/构成比
关联度
卡方检验
列联系数 卡方检验 秩和检验 McNemar 秩相关分析/ 线性趋势检验
R× C表
单向有 序 双向有序
分组变量有序 反应变量有序 配对/配伍设计 非配对/配伍 设计
分层计数资料
分层卡方检验M-H/CMH 检验
三、单变量等级资料分析 两 组 比 较 两 组 比 较 配对 非配对 Wilcoxon符号秩检验 Wilcoxon符号秩和检验
第十讲 统计分析的一般原则与方法
第一节 数据来源与录入 数据分为观察性数据和实验性数据。 观察性数据:国家法定卫生工作报表、例如传染病 、职业病、医院工作报表。病历资料,分析时要注 意其局限性。 实验性数据:临床试验或大型调查研究,制定统一 的数据采集标准,试验记录、病历和报表要规范、 完整、准确、及时,保证质量。要重视对漏报、重 报和错误检查,防止伪造和篡改科研资料。
二、变量设置 连续变量和离散变量数据化 三、缺失值处理 缺失值来源于资料收集中的漏报和漏填。其数量 不超过10%。缺失值不等于“0”。统计软件中, 缺失值定义为“.”。考虑缺失值的填补方法。 四、离群数据处理问题
离群值是偏离数据主体分布过远,特大或特小 值。分析离群值可用频数表或直方图、离箱图的 P25或P75过远。若数据是正态分布,可考虑
第十三章 协方差分析

SS总 SS回
S S回 b l XY
S S 修 正+ S S 组 内 残 差
( l2 )组 内 XY =( l Y Y )组 内 - ( lXX )组 内
- xi )
2
SS修正 SS总残 SS组内残差
总 残 差= N - 2
修 正= k -1
SS组内残差
组 内 残 差= 总 残 差- 修 正
32
1. 进行各组间线性趋势的初步判断: 绘制散点图
33
1. 进行各组间线性趋势的初步判断: 绘制散点图
34
1. 进行各组间线性趋势的初步判断: 绘制散点图
35
1. 进行各组间线性趋势的初步判断: 绘制散点图
120
增 重ห้องสมุดไป่ตู้( Y) kg
110
100
90 C增 重 80 C初 始 重 量 B增 重 70 B初 始 重 量 A增 重 60 10 20 30 40 A初 始 重 量
XY 组内
420.87 2 1238.38 227.64 175.25
21 1 20
2 ˆ 修正均数 (Y Y ) 934.84 227.64 707.20
22 20 2
MS组内 227.64 / 20 11.38 MS修正 707.20/2 353.60 353.60 F 31.07 11.38 F0.05(2,20) 3.49
10
问题的解决
在实际工作中,类似于以上的影响因素在实验 设计时是难以控制的,如何扣除或均衡这些不可 控因素的影响,可在统计分析阶段采用协方差分 析的方法。
11
协方差分析是将线性回归分析和方 差分析结合起来的一种统计方法。
统计学十三章趋势的分类

统计学十三章趋势的分类
统计学第十三章涵盖了趋势分析的方法和技术。
趋势分析是一种描述和预测数据随时间变化的模式的统计方法。
在统计学中,趋势可以分为以下几类:
1. 线性趋势:数据随时间的变化呈现直线关系,可以用线性回归模型进行拟合。
2. 非线性趋势:数据随时间的变化呈现曲线关系,线性回归模型不能很好地描述数据的变化,需要使用非线性回归模型或其他非线性趋势模型进行分析。
3. 季节性趋势:数据随时间的变化呈现明显的季节性模式,例如销售量在特定季节会出现明显的波动。
可以使用季节性分解方法或季节性ARIMA模型进行分析。
4. 周期性趋势:数据随时间的变化呈现周期性模式,周期可能不规则,例如经济周期。
可以使用周期性分解方法或周期性ARIMA模型进行分析。
5. 短期趋势:数据随时间的变化呈现短期内的波动,可能由于随机因素引起,可以使用移动平均法或指数平滑法进行分析。
6. 长期趋势:数据随时间的变化呈现较长周期的趋势模式,可能由于长期结构性因素引起,可以使用趋势分解方法进行分析。
以上是一些常见的趋势分类,实际分析中可能还会有其他特定的趋势模型。
根据具体的数据特点,选择合适的趋势分析方法可以帮助我们更好地理解数据的变化规律和未来的走势。
第十三讲《统计学》讲义32页PPT

基本原理图示
•小概率原理:如果对总体的某种假设是真实的,那么不利于 或不能支持这一假设的事件A(小概率事件) 在一次试验中几乎不可能发生的;要是在一次 试验中A竟然发生了,就有理由怀疑该假设的 真实性,拒绝这一假设。
总体
抽样
(某种假设)
检验
(接受)
小概率事件 未发生
样本 (观察结果)
(拒绝) 小概率事件 发生
当然,我们也可能推断错了,即产品的合格率 确实是99%,100件产品中确实仅有1件次品, 而在这次抽取中恰好被抽到了。
• 事件的概率小到什么程度才算小概率事件,没 有一个绝对的标准,要根据具体问题而定,一 般概率为0.10、0.05 或0.01的事件,就可以认 为是小概率事件。
四、否定域和接受域
“H :总体服从正态分布”和“H : p≠0.05 ”
是复合假设。
三、假设检验的基本原理
• 进行假设检验的基本原理就是小概率原理。小概率原 理是说概率很小的事件(称为“小概率事件”)在一 次试验中几乎是不可能发生的。
• 根据小概率原理进行假设检验的方法就是概率意义下 的反证法,其思想是:为了检验原假设H0是否正确, 我们首先假定“H0正确”,然后来看在H0是正确的假 定下能导出什么结果。如果导出一个与小概率原理相 矛盾的结果,则说明“H0正确” 的假定是错误的,即 原假设H0不正确,于是我们应作出否定原假设H0的决 策;如果没有导出与小概率原理相矛盾的结果,则说 明“H0正确” 的假定没有错误,即不能认为原假设H0 是不正确的,于是我们应作出不否定原假设H0的决策。
第六章 假设检验 第一节 假设检验的基本概念
假设检验问题
2007统计学第十三章

第十三章时间序列分析§1 时间序列及其分解一、时间序列及其分类时间序列是指一组按照时间顺序或时间段排列的数据序列.它由时间和水平两个因素组成:一个是统计数据所属的时间(或时间段),另一个是序列水平的统计数据.依照时间因素,时间序列可分为时期序列和时点序列.依照水平因素,时间序列可分为绝对数时间序列、相对数时间序列和平均数时间序列.由一系列绝对数按时间(或时间段)顺序排列而成的序列称为绝对数时间序列.绝对数时期序列具有可加性,相加后的值可以反映更长一个时期的水平.由绝对数时间序列可以派生出相对数时间序列和平均数时间序列.下表给出了四个不同类型的时间序列.人口自然增居民消费水GDP(亿元)198919901991199219931994199519961997199819992000200120022003时间序列中各期指标是许多不同因素共同影响的结果.对各种因素按其作用来划分,可大致分为四种:长期趋势(Secular trend),季节变动(Seasonal fluctuation),循环变动(Cyclical movement)和不规则变动(Irregular variations).长期趋势是指时间序列所反映的现象在某一个相对较长的时期内持续发展变化的趋势.它受根本性因素的作用和制约.就经济系统而言,它反映基本经济力量的作用.形式上,可表现为向上趋势,向下趋势,平稳趋势,直线趋势,二次曲线趋势和指数曲线趋势等. 长期趋势为平稳趋势的时间序列也称为平稳序列。
季节变动是指一年以内的、具有一定周期性且每年重复出现的变动.循环变动是一种围绕长期趋势出现的具有一定起伏形态的周期性波动.循环周期时间间隔在一年以上.循环周期的持续时间和振幅的大小不一定相等,因而较难预测与把握.不规则变动,又称随机变动,是除去长期趋势,季节变动和循环变动之后余下的变动.包括严格的随机变动(由许多细小原因综合引起)和偶发性变动(如政治动荡,战争爆发,大的自然灾害产生的影响).上述四种因素的共同作用使得时间序列的指标值呈现出不规则的变化.(传统)时间序列分析即是要把序列指标值分解为与上述四种因素对应的四个部分.一般地,有所谓加法模型和乘法模型.加法模型: I C S T Y +++= 乘法模型: I C S T Y ⋅⋅⋅=加法模型中, S,C,I 均是对T 的定量偏差,四种因素相互独立,都用原始单位表示.乘法模型中,趋势通常用原始单位表示,其余三个因素则表示成相对数或百分数.§2 时间序列的描述性分析 一、时间序列的图形描述时间序列的图形描述即是将时间序列数据按时间顺序在平面坐标图上描出,必要时加上折线、直线或曲线,用以直观地、定性地描述时间序列的变化模式及变化趋势。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十三章时间序列分析§1 时间序列及其分解一、时间序列及其分类时间序列是指一组按照时间顺序或时间段排列的数据序列.它由时间和水平两个因素组成:一个是统计数据所属的时间(或时间段),另一个是序列水平的统计数据.依照时间因素,时间序列可分为时期序列和时点序列.依照水平因素,时间序列可分为绝对数时间序列、相对数时间序列和平均数时间序列.由一系列绝对数按时间(或时间段)顺序排列而成的序列称为绝对数时间序列.绝对数时期序列具有可加性,相加后的值可以反映更长一个时期的水平.由绝对数时间序列可以派生出相对数时间序列和平均数时间序列.下表给出了四个不同类型的时间序列.人口自然增居民消费水GDP(亿元)198919901991199219931994199519961997199819992000200120022003时间序列中各期指标是许多不同因素共同影响的结果.对各种因素按其作用来划分,可大致分为四种:长期趋势(Secular trend),季节变动(Seasonal fluctuation),循环变动(Cyclical movement)和不规则变动(Irregular variations).长期趋势是指时间序列所反映的现象在某一个相对较长的时期内持续发展变化的趋势.它受根本性因素的作用和制约.就经济系统而言,它反映基本经济力量的作用.形式上,可表现为向上趋势,向下趋势,平稳趋势,直线趋势,二次曲线趋势和指数曲线趋势等. 长期趋势为平稳趋势的时间序列也称为平稳序列。
季节变动是指一年以内的、具有一定周期性且每年重复出现的变动.循环变动是一种围绕长期趋势出现的具有一定起伏形态的周期性波动.循环周期时间间隔在一年以上.循环周期的持续时间和振幅的大小不一定相等,因而较难预测与把握.不规则变动,又称随机变动,是除去长期趋势,季节变动和循环变动之后余下的变动.包括严格的随机变动(由许多细小原因综合引起)和偶发性变动(如政治动荡,战争爆发,大的自然灾害产生的影响).上述四种因素的共同作用使得时间序列的指标值呈现出不规则的变化.(传统)时间序列分析即是要把序列指标值分解为与上述四种因素对应的四个部分.一般地,有所谓加法模型和乘法模型.加法模型: I C S T Y +++= 乘法模型: I C S T Y ⋅⋅⋅=加法模型中, S,C,I 均是对T 的定量偏差,四种因素相互独立,都用原始单位表示.乘法模型中,趋势通常用原始单位表示,其余三个因素则表示成相对数或百分数.§2 时间序列的描述性分析 一、时间序列的图形描述时间序列的图形描述即是将时间序列数据按时间顺序在平面坐标图上描出,必要时加上折线、直线或曲线,用以直观地、定性地描述时间序列的变化模式及变化趋势。
二、时间序列的水平分析(一)发展水平与平均发展水平发展水平是时间序列的统计指标的数值.序列第一个指标值称为最初水平, 最末一个指标值称为最末水平,被研究的那一时期的指标水平称为报告期水平,用来作比较的水平称为基期水平.平均发展水平是时间序列在一个时间段内各期水平的平均值,也称为序时平均数.序时平均数因时间序列指标性质的不同而有不同的计算方法.1、绝对数时间序列的序时平均数绝对数时间序列可分为时期序列和时点序列. 时期序列序时平均数的计算公式为nYnY Y Y Y ni in∑==+++=121 .时点序列序时平均数的计算公式为∑-=--⋅+++⋅++⋅+=1111232121222n i in n n T T Y Y T Y Y T Y Y Y , 式中,T i 为观察值Y i 与Y i+1之间的时间间隔.2、相对数或平均数时间序列的序时平均数相对数和平均数通常由两个绝对数对比而成.所以,计算序时平均数时,应先分别求出构成相对数或平均数的分子和分母的平均数,然后再进行对比,即如果ii i b a Y =则 b a Y =.时间序列.xls (sheet2)(二)增长量与平均增长量增长量是时间序列中报告期水平与基期水平之差,用于描述现象在观察期内增长的绝对数量.因采用基期不同,增长量可分为逐期增长量与累积增长量.逐期增长量 = 报告期水平 - 前期水平; 累积增长量 = 报告期水平 - 基期水平;平均增长量 =时段长度累积增长量逐期增长量个数逐期增长量之和=.三、时间序列的速度分析(一)发展速度与增长速度(增长率)发展速度是报告期发展水平与基期发展水平之比,用于描述现象在观察期内相对的发展变化程度. 因采用基期不同,发展速度可分为环比发展速度与定基发展速度.设时间序列为n Y Y Y ,,,10 ,则环比发展速度与定基发展速度的一般形式可写成环比发展速度: n i Y Y R i ii ,,2,1,1==-定基发展速度: n i Y Y R ii ,,2,1,0==. 显然,观察期内各个环比发展速度的连乘积等于最末期的定基发展速度.增长速度是增长量与基期水平之比,用于描述现象的相对增长程度.1-=-==发展速度基期水平基期水平报告期水平基期水平增长量增长速度.增长速度也可分为环比增长速度和定基增长速度. 环比增长速度=环比发展速度-1 定基增长速度=定基发展速度-1 例(二)平均发展速度与平均增长速度平均发展速度是各个时期环比发展速度的几何平均数,用于描述现象在观察期内平均发展变化的程度. 平均增长速度则是用于描述现象在观察期内平均增长变化的程度,它通常用平均发展速度减1来求得.设时间序列为n Y Y Y ,,,10 ,则从第一期到第n 期的平均发展速度为n n nn n Y Y Y Y Y Y Y Y R 011201=⋅⋅⋅=- ;平均增长速度为 1-=R G .例(三)关于速度分析的说明1、 当时间序列中的观察值出现0或负数时,不宜计算速度。
2、 在评价一个企业的经营业绩,一个地区的经济发展时,要将增长速度和绝对水平结合考虑。
通常以增长1%的绝对值作为参考。
增长1%的绝对值=前期水平/100例13-3 将增长速度和绝对水平结合考虑.§3 时间序列预测的程序(略)§4 平稳序列的预测时间序列分析的一项重要内容就是根据过去已有的数据来预测未来的结果。
当序列的长期趋势呈现平稳趋势时,可用简单平均法、移动平均法和指数平滑法对时间序列进行短期预测。
一、简单平均法简单平均法就是将过去所有观察值的平均值作为下一期预测值的预测方法。
计算公式为tYtY Y Y Y F ti itt t ∑=+=+++==1211二、移动平均法简单移动平均法是将时间序列的数据逐项移动,依次计算包含一定期数(最近k 期)的序时平均数。
以此平均数作为下一期数据的预测值。
计算公式为kY Y Y F tk t k t t +++=+-+-+ 211,k 称为移动平均的移动步长。
应用移动平均法时应注意,若序列有围绕趋势的周期性变动(季节的或循环的),移动步长应与周期相同,以消除这些变动(其原因在于,在每一次平均中,有一半的数据在循环中点的上半部, 另一半的在循环中点的下半部,通过平均使得上下两部分数据差异大致相互抵消)。
例 具有明显趋势的时间序列不适宜用移动平均法进行预测。
时间序列.xls(sheet5) 例居民消费指数(上年为100)三期移动预测值1989 99.51990 103.41995 107.51996 109.11997 104.21998 105.5 106.9333 1999 107.9 106.26672000 108.3 105.8667 2001 105.3 107.2333 2002 106.2 107.1667 2003106.3106.6105.9333加权移动平均就是在预测时,对近期的观察值和远期的观察值赋予不同的权数后再进行预测。
一般而言,近期观察值的权数较大,远期观察值的权数较小。
三、指数平滑法指数平滑法的第1+t 期预测值的计算公式为t t t F Y F )1(1αα-+=+,其中t Y 为第t 期实际观察值,t F 为第t 期预测值,α称为平滑系数。
实际应用中,第1期预测值往往取成第1期观察值。
例 居民消费指数时间序列.xls (sheet7)§5 趋势型序列的预测当长期趋势表现的比较明显时,我们常用一个比较合理的函数来拟合序列的长期趋势,并称其为所讨论序列的趋势函数(或趋势方程). 描述时间序列长期趋势的方程通常有直线方程和曲线方程,曲线方程又可分为二次曲线,三次曲线,指数曲线,修正指数曲线,Gompertz 曲线,Logisti 曲线等.(一)直线趋势的测定当我们通过散点图认为时间序列的长期趋势大致呈直线形态时,可利用上一章介绍的最小二乘法得出序列的直线趋势方程.例 人口自然增长率时间序列.xls (sheet1)(二)曲线趋势的测定在测定时间序列的曲线趋势时,首先要通过散点图或理论分析选择合适的曲线方程形式,然后再通过变量替换进行线性回归或直接进行非线性回归.1、 二次曲线当现象的发展趋势呈现抛物线形态时,可用二次曲线拟合趋势线,其一般方程为2ct bt a Y ++=,式中,三个未知参数a,b,c 可由最小二乘估计得出。
例 我国糖产量的预测糖产量.xls2、 指数曲线指数曲线用以描述以几何级数递增或递减的现象。
指数曲线的一般形式为xab Y =.例13-10 我国轿车产量预测时间序列.xls (sheet5) 设趋势曲线拟合方程为 xab Y = .方程两端取对数,得 b x a Y log log log +=. 将有关数据列表计算,利用最小二乘估计方法,得b a log ,log所以 285.1,038.4==b a ,即曲线趋势拟合方程为 xY 285.1038.4⨯=. 拟合情况见下图.3、 修正指数曲线修正指数曲线的一般方程为 tab K Y +=, 其中10,0,0<<<>b a K .修正指数曲线常用于描述这样一类现象:初期增长迅速,随后增长率逐渐降低,最终以K 为增长极限。
例如,某种刚刚问世的新产品,初期销售量增长可能很快,当社会拥有量接近饱和时,销售量逐渐趋于某个稳定的水平。
修正指数曲线方程中的未知参数可由如下两种方法确定:(1)当K 可以预先确定时,其它两个参数可用最小二乘法估计得出;(2)三和法。
三和法是确定修正指数曲线中未知参数的常用方法。
其基本思想是:将时间序列观察值等分为三个部分,每部分有m 个时期,从而根据趋势值的三个局部总和分别等于原序列观察值的三个局部总和来确定三个参数。
设观察值的三个局部总和分别为321,,S S S ,即∑==mt t y S 11,∑+==mm t tyS 212,∑+==mm t tyS 3123.根据三和法的假设,有⎪⎩⎪⎨⎧+++=+++=+++=+++=+++=++++=-++-++-)1()1()1(112312*********m m m m m m m m m m b b ab mK ab ab mK S b b ab mK ab ab mK S b b ab mK ab ab ab mK S 即⎪⎪⎪⎩⎪⎪⎪⎨⎧--⋅+=--⋅+=--⋅+=++111111123121b b abm K S b b ab m K S b b ab m K S mm mm m解之,得 ⎪⎪⎪⎪⎩⎪⎪⎪⎪⎨⎧---⋅=--⋅-=⎪⎪⎭⎫ ⎝⎛--=)1)1((1)1(1)(121211223b b ab S m K b b b S S a S S S S b m m m 例解:由上表中的数据及修正指数曲线中参数的计算公式,得87864.01325417955179552011861=⎪⎭⎫ ⎝⎛--=b6733.2227)187864.0(87864.0187864.0)1325417955(26-=-⨯-⋅-=a 2346.3660=K .所以,小麦单位面积产量的修正指数曲线为:t tY 87864.06733.22272346.3660ˆ⨯-=.小麦产量.xls4、 Gompertz 曲线Gompertz 曲线的一般方程为 tb Ka Y =, 其中10,10,0≠<≠<>b a K .Gompertz 曲线所描述的现象的特点是:初期增长缓慢,以后逐渐加快,达到一定程度后,增长率又逐渐下降,最后接近一条水平线。