基于马尔科夫链的房价预测研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
[3 ]
进口价格的预测。另有学者将该模型应用到气候变 市场营销、 进出口贸易等领域, 并成功地做出了 化、 各种预测。本文利用数理统计方法计算得到北京市 2009 年 1 月至 2012 年 5 月商品住宅销售价格月度 对北京市 2012 年 指数的马尔科夫链状态转移概率, 6 - 12 月的房屋价格走势进行预测分析 。 二、 马尔科夫法 马尔可夫模型预测是利用概率建立一种随机型 通常称马尔可夫法。 马 时序模型进行预测的方法, 尔可夫法是以俄国数学家 Markov 名字命名的一种方 通过对事物 法。它将时间序列看作一个随机过程, 不同状态的初始概率和状态之间转移概率的研究, 确定状态变化趋势, 以预测事物的未来。 马尔可夫 法是一种随机时间序列分析法。 当一个随机过程在 给定现在状态及所有过去状态情况下, 其未来状态 的条件概率分布仅依赖于当前状态, 与过去状态 ( 即 该过程的历史路径) 是条件独立的, 那么此随机过程 即具有马尔可夫性质。 ( 一) 马尔科夫链的定义 马尔可夫链是数学中具有马尔可夫性质的离散 时间随机过程。 该过程中, 在给定当前知识或信息
北京市商品住宅价格变化状态 5月 E1 E1 E1 E2 6月 E1 E2 E2 7月 E1 E2 E2 8月 E1 E2 E2 9月 E1 E1 E2 10 月 E1 E1 E2 11 月 E1 E1 E3 12 月 E1 E1 E3
41
( 二) 基于马尔科夫模型对北京住房价格的预测 在预测中, 对预测对象状态的划分通常有两大 类: 一类是预测对象本身有明显的状态界限 , 则以其 界限划分; 另一类是根据实际情况人为划分。 本文 根据实际情况将北京市商品住宅价格月度变化分为 3 个状态, “上升 ” 、 “稳定” “下降” 。记 E1 为 “上 即 和 E2 为 “稳定” E3 为“下降 ” 升” 状态, 状态, 状态 ( 波动 在 0. 1 % 范围内视为稳定状态 ) 。 从表 2 中可以知 道, 在 25 个从 E1 出发 ( 转移出去 ) 的状态中: 有 22 个 是 从 E1 转 移 到 E1 的; 有 3 个 是 从 E1 转 移 到 E2 的。 P11 = P ( E1 →E1 ) = P ( E1 | E1 ) = P12 = P ( E1 →E2 ) = P ( E2 | E1 ) = P13 = 0 。 同理可得: P21 = 0. 200 ; P22 = 0. 600 ; P23 = 0. 200 。 P31 = 0 ; P32 = 0. 167 ; P33 = 0. 833 。 从而得出北京市商品住宅价格月度变化的状态 转移概率矩阵为: 0. 880 P = 0. 200 0 0. 120 0. 600 0. 167 0. 200 0. 833 0 ( 1) 22 = 0. 880 ; 25 3 = 0. 120 ; 25
40
的情况下, 过去 ( 即当期以前的历史状态 ) 对于预测 将来( 即当期以后的未来状态 ) 是无关的。如果随机 t ∈ T 具有如下特殊性质: X t = i, 即过程在 过程{ X t } , t i , t + 1 将处于状 时刻 处于状态 则其在下一时刻 j P , P { X = j | X X1 态 的概率是固定的 ij 即有 t +1 0 = K0 ,
S ( 1) = S ( 0) ·P S ( 2) = S ( 1) ·P = S ( 0) ·P2 ………… S ( k + 1 ) = S ( k) · P = S ( 0 ) · P k + 1 所以, 上式又可以写成: S ( k + 1) = S ( 0) ·P k + 1 S 式中,
( 0)
E i →E n , 将这种转移的可能性用概率描述, 就是状态转 移概率。状态转移概率中最基本的是一步转移概率 P ( E i ︱E j ) , 它表示由状态 E i 经过一步转移到状态 E i P( E i →E j ) = P( E i | E j ) = P ij 。 的概率, 也记作 P ij , 所以, 事物若有 n 种状态, 则从某一状态开始, 相应地有 n 个
2009 年 1 月至 2012 年 5 月商品住宅销售价格的月度统计数据, 进行时间序列的平稳化处理, 并利用数理统计方法计算得到其 马尔科夫链状态转移概 率, 由 此 对 北京市 2012 年 6 - 12 月 房 屋 价格 走 势 进行 预测 分析, 从 而对 居民 进行房 屋 消费 引 导, 并为 政府房价调控提供政策建议。 关键词: 马尔科夫链; 房屋价格指数; 状态转移概率; 价格预测 中图分类号: F201 ; F063. 2 文献标识码: A 文章编号: 1007 - 5682 ( 2012 ) 05 - 0040 - 03
2012 年 10 月 第 28 卷 第 5 期
消费经济 CONSUMER ECONOMICS
Oct. 2012 Vo1. 28 No. 5
基于马尔科夫链的房价预测研究
□ 谷秀娟 李 超
( 河南工业大学 经济贸易学院, 郑州 450001 ) 摘 要: 近年来中国房价持续高涨, 引起了社会各界的广泛 关 注。本文 视 房 屋 价格 动态 过程 为 马尔科夫链, 根 据北京市
在采用马尔科夫预测模型分析时, 首先要确保 时间序列是平稳的, 可以通过 d 次差分来实现序列 的平稳化。应用 Eviews6 进行单位根检验如表 1 所 示, 原序列 t 检验统计量大于在各个显著性水平下给 通过一阶差分后的序列 t 检验统计量小 出的临界值, 因此, 一阶差 于在各个显著性水平下给出的临界值, 分后的时间序列是平稳时间序列 。
表2 年份 2009 2010 2011 2012 1月 E1 E1 E1 E3 2月 E1 E1 E1 E3 3月 E1 E1 E2 E3 4月 E1 E1 E1 E3
Hale Waihona Puke Baidu
显著性水平下的临界值 1% 5% 10% - 3. 64 - 3. 65 - 2. 95 - 2. 96 - 2. 61 - 2. 62
= k1 , …, Xt - 1 = kt - 1 , X t = i} = P{ X t + 1 = j | X t = i } 对 状态转移概率, P i2 , …, P ij , …, P in 。 即 P i1 , 1, … 和每一序列 i, j, k0 , k1 , …, k t - 1 均成立, 假定某一个事件的发展过程有 n 个 可 能 的 状 于 t = 0, E2 , …, E n 。记为从状态 E i 转变为状态 E j 则此随机过程被称作具有马尔科夫属性, 具有马尔 态,即 E1 , 1, 2, … ) 被称为 科夫属性的随机过程{ X t } ( t = 0 , 马尔科夫链。 ( 二) 马尔可夫模型 1. 预测模型 Sk + 1 = S( k) ·P 式中, S( k) 是预测对象在 t = k 时刻的
将马尔科夫链用于 Web 网页的导航
[4 ]
预测中; 孙红丽等
应用马尔科夫模型对企业人力
[5 ]
资源供给进行了预测; 高阳和谭阳波
基于新维无
偏灰色马尔科夫预测模型预测了中长期能源消费; [6 ] 张传平等 根据马尔科夫链的性质, 进行了对原油
0730 收稿日期: 2012-
基金项目: 国家社会科学基金项目( 10BJY111 ) ; 郑州市创新型科技人才队伍建设工程项目( 102400420027 ) 作者简介: 谷秀娟( 1968 - ) , 女, 河南郑州人, 博士, 河南工业大学经济贸易学院院长 、 教授; 李 州人, 河南工业大学经济贸易学院硕士生 。 超( 1987 - ) , 男, 河南郑
( k + 1) 状态向量; P 为一步转移概率矩阵; S 是预测对象在 t = k + 1 时的状态向量, 也就是预测的结果。由于:
的状态转移概率 P ( E i →E j ) , 则矩阵: P11 P12 L P1n P = M M 称为状态转移概率 P n1 P n2 L P nn 矩阵。 三、 马尔科夫模型在北京市住房价格预测中的 应用分析 本文根据 2009 年 1 月到 2012 年 5 月北京市商 品住宅的价格指数环比数据, 通过马尔科夫预测模 型, 在误差允许范围内预测北京市 2012 年 6 - 12 月 的商品住宅价格变动趋势。 文中所用数据来自国家
保 留 两 位 小 数, 如表 3 能出 现 的 各 种 状 态 的 概 率, 所示。
表3 2012 年 6 - 12 月北京市房价各种状态发生的概率值 E1 状态概率 0. 20 0. 30 0. 44 0. 47 0. 49 0. 49 0. 50 E2 状态概率 0. 60 0. 42 0. 33 0. 30 0. 28 0. 27 0. 26 E3 状态概率 0. 20 0. 28 0. 23 0. 23 0. 23 0. 24 0. 24
表1 P 原序列 一阶差分 价格指数的 ADF 检验 ADF 检验值 - 2. 53 - 4. 77 p值 0. 73 0. 00
为预测对象的初始状态向量, 它是由状 它处于任一 态的初始概率组成的向量。对于马氏链, 时刻 t 的概率可由初始概率和一步转移概率所决定。 2. 适用条件 预测模 型 只 适 用 于 具 有 马 尔 可 夫 性 的 时 间 序 并且时间序列在要预测的时期内, 各时刻的状态 列, 转移概率保持稳定, 即每一时刻向下一时刻变化的 均为一步转移概率。 若时序 转移概率都是一样的, 不宜用此方法。 的状态转移概率随不同时刻在变化, 由于实际的客观事物很难长期保持同一状态转移概 率, 故此方法一般适用于短期预测。 ( 三) 状态转移概率及其矩阵 E2 , …, E n 共 n 种状态, 客观事物可能有 E1 , 其每 次只能处于一种状态, 则每一状态都具有 n 个转向 ( 包括转向自身) , E i → E2 , …, E i →E i ,…, 即: E i →E1 ,
P11 = S ( k) · M P n1
P12 P n2
L L
P1n M P nn
统计局网站。 ( 一) 对时间序列数据进行平稳性分析 如果直接对 鉴于大多数时间序列是非平稳的, , 则很可能造成“伪回归” 因此首先 其进行回归分析, 需要对经济变量的时间序列进行平稳性检验 ( 如表 1) 。
一、 引言 房地产 价 格 是 当 今 社 会 最 关 注 的 热 点 问 题 之 一。房地产市场的稳定关系到国计民生, 房价的高 还造成了一系列负 涨不但加重了居民的生活负担, 面社会效应。 为此, 自 2010 年起, 我国政府不断加 大房价调控力度, 连续出台相关政策。 随着日益趋 紧的调控政策的颁布, 房价过快上涨趋势得到一定 程度的遏制。 但受政策和市场预期等因素的影响, 未来房价走势仍存在很大的不确定性, 这使得房屋 投资者、 开发商等难以作出下一步决策。 因此, 结合 采用合适的经济模型, 对房价做出 当前的经济形势, 准确预测是我们亟待解决的问题 。 国内外多位学者应用马尔科夫模型进行了各种 Bauerle 和 Rieder[1] 在对股价和利率的 研究与预测, 最优组 合 研 究 中 改 进 了 马 尔 可 夫 方 法; Hassan 和 Nath[2]运用隐马尔可夫模型预测了航空公司的股票 价格; Jayalal
k→∞ k→∞ k→∞ k→∞
lim ( k) = P 终极状态概率应满足的条件: 0 ≤ i ≤1 ( i = 1 ,
月 份 2012 年 6 月 2012 年 7 月 2012 年 8 月 2012 年 9 月 2012 年 10 月 2012 年 11 月 2012 年 12 月
定义: 经过无穷多次状态转移后所得到的状态 即: 概率称为终极状态概率, lim 2 ( k ) , L, lim n ( k) ] = = [lim 1 ( k ) ,
进口价格的预测。另有学者将该模型应用到气候变 市场营销、 进出口贸易等领域, 并成功地做出了 化、 各种预测。本文利用数理统计方法计算得到北京市 2009 年 1 月至 2012 年 5 月商品住宅销售价格月度 对北京市 2012 年 指数的马尔科夫链状态转移概率, 6 - 12 月的房屋价格走势进行预测分析 。 二、 马尔科夫法 马尔可夫模型预测是利用概率建立一种随机型 通常称马尔可夫法。 马 时序模型进行预测的方法, 尔可夫法是以俄国数学家 Markov 名字命名的一种方 通过对事物 法。它将时间序列看作一个随机过程, 不同状态的初始概率和状态之间转移概率的研究, 确定状态变化趋势, 以预测事物的未来。 马尔可夫 法是一种随机时间序列分析法。 当一个随机过程在 给定现在状态及所有过去状态情况下, 其未来状态 的条件概率分布仅依赖于当前状态, 与过去状态 ( 即 该过程的历史路径) 是条件独立的, 那么此随机过程 即具有马尔可夫性质。 ( 一) 马尔科夫链的定义 马尔可夫链是数学中具有马尔可夫性质的离散 时间随机过程。 该过程中, 在给定当前知识或信息
北京市商品住宅价格变化状态 5月 E1 E1 E1 E2 6月 E1 E2 E2 7月 E1 E2 E2 8月 E1 E2 E2 9月 E1 E1 E2 10 月 E1 E1 E2 11 月 E1 E1 E3 12 月 E1 E1 E3
41
( 二) 基于马尔科夫模型对北京住房价格的预测 在预测中, 对预测对象状态的划分通常有两大 类: 一类是预测对象本身有明显的状态界限 , 则以其 界限划分; 另一类是根据实际情况人为划分。 本文 根据实际情况将北京市商品住宅价格月度变化分为 3 个状态, “上升 ” 、 “稳定” “下降” 。记 E1 为 “上 即 和 E2 为 “稳定” E3 为“下降 ” 升” 状态, 状态, 状态 ( 波动 在 0. 1 % 范围内视为稳定状态 ) 。 从表 2 中可以知 道, 在 25 个从 E1 出发 ( 转移出去 ) 的状态中: 有 22 个 是 从 E1 转 移 到 E1 的; 有 3 个 是 从 E1 转 移 到 E2 的。 P11 = P ( E1 →E1 ) = P ( E1 | E1 ) = P12 = P ( E1 →E2 ) = P ( E2 | E1 ) = P13 = 0 。 同理可得: P21 = 0. 200 ; P22 = 0. 600 ; P23 = 0. 200 。 P31 = 0 ; P32 = 0. 167 ; P33 = 0. 833 。 从而得出北京市商品住宅价格月度变化的状态 转移概率矩阵为: 0. 880 P = 0. 200 0 0. 120 0. 600 0. 167 0. 200 0. 833 0 ( 1) 22 = 0. 880 ; 25 3 = 0. 120 ; 25
40
的情况下, 过去 ( 即当期以前的历史状态 ) 对于预测 将来( 即当期以后的未来状态 ) 是无关的。如果随机 t ∈ T 具有如下特殊性质: X t = i, 即过程在 过程{ X t } , t i , t + 1 将处于状 时刻 处于状态 则其在下一时刻 j P , P { X = j | X X1 态 的概率是固定的 ij 即有 t +1 0 = K0 ,
S ( 1) = S ( 0) ·P S ( 2) = S ( 1) ·P = S ( 0) ·P2 ………… S ( k + 1 ) = S ( k) · P = S ( 0 ) · P k + 1 所以, 上式又可以写成: S ( k + 1) = S ( 0) ·P k + 1 S 式中,
( 0)
E i →E n , 将这种转移的可能性用概率描述, 就是状态转 移概率。状态转移概率中最基本的是一步转移概率 P ( E i ︱E j ) , 它表示由状态 E i 经过一步转移到状态 E i P( E i →E j ) = P( E i | E j ) = P ij 。 的概率, 也记作 P ij , 所以, 事物若有 n 种状态, 则从某一状态开始, 相应地有 n 个
2009 年 1 月至 2012 年 5 月商品住宅销售价格的月度统计数据, 进行时间序列的平稳化处理, 并利用数理统计方法计算得到其 马尔科夫链状态转移概 率, 由 此 对 北京市 2012 年 6 - 12 月 房 屋 价格 走 势 进行 预测 分析, 从 而对 居民 进行房 屋 消费 引 导, 并为 政府房价调控提供政策建议。 关键词: 马尔科夫链; 房屋价格指数; 状态转移概率; 价格预测 中图分类号: F201 ; F063. 2 文献标识码: A 文章编号: 1007 - 5682 ( 2012 ) 05 - 0040 - 03
2012 年 10 月 第 28 卷 第 5 期
消费经济 CONSUMER ECONOMICS
Oct. 2012 Vo1. 28 No. 5
基于马尔科夫链的房价预测研究
□ 谷秀娟 李 超
( 河南工业大学 经济贸易学院, 郑州 450001 ) 摘 要: 近年来中国房价持续高涨, 引起了社会各界的广泛 关 注。本文 视 房 屋 价格 动态 过程 为 马尔科夫链, 根 据北京市
在采用马尔科夫预测模型分析时, 首先要确保 时间序列是平稳的, 可以通过 d 次差分来实现序列 的平稳化。应用 Eviews6 进行单位根检验如表 1 所 示, 原序列 t 检验统计量大于在各个显著性水平下给 通过一阶差分后的序列 t 检验统计量小 出的临界值, 因此, 一阶差 于在各个显著性水平下给出的临界值, 分后的时间序列是平稳时间序列 。
表2 年份 2009 2010 2011 2012 1月 E1 E1 E1 E3 2月 E1 E1 E1 E3 3月 E1 E1 E2 E3 4月 E1 E1 E1 E3
Hale Waihona Puke Baidu
显著性水平下的临界值 1% 5% 10% - 3. 64 - 3. 65 - 2. 95 - 2. 96 - 2. 61 - 2. 62
= k1 , …, Xt - 1 = kt - 1 , X t = i} = P{ X t + 1 = j | X t = i } 对 状态转移概率, P i2 , …, P ij , …, P in 。 即 P i1 , 1, … 和每一序列 i, j, k0 , k1 , …, k t - 1 均成立, 假定某一个事件的发展过程有 n 个 可 能 的 状 于 t = 0, E2 , …, E n 。记为从状态 E i 转变为状态 E j 则此随机过程被称作具有马尔科夫属性, 具有马尔 态,即 E1 , 1, 2, … ) 被称为 科夫属性的随机过程{ X t } ( t = 0 , 马尔科夫链。 ( 二) 马尔可夫模型 1. 预测模型 Sk + 1 = S( k) ·P 式中, S( k) 是预测对象在 t = k 时刻的
将马尔科夫链用于 Web 网页的导航
[4 ]
预测中; 孙红丽等
应用马尔科夫模型对企业人力
[5 ]
资源供给进行了预测; 高阳和谭阳波
基于新维无
偏灰色马尔科夫预测模型预测了中长期能源消费; [6 ] 张传平等 根据马尔科夫链的性质, 进行了对原油
0730 收稿日期: 2012-
基金项目: 国家社会科学基金项目( 10BJY111 ) ; 郑州市创新型科技人才队伍建设工程项目( 102400420027 ) 作者简介: 谷秀娟( 1968 - ) , 女, 河南郑州人, 博士, 河南工业大学经济贸易学院院长 、 教授; 李 州人, 河南工业大学经济贸易学院硕士生 。 超( 1987 - ) , 男, 河南郑
( k + 1) 状态向量; P 为一步转移概率矩阵; S 是预测对象在 t = k + 1 时的状态向量, 也就是预测的结果。由于:
的状态转移概率 P ( E i →E j ) , 则矩阵: P11 P12 L P1n P = M M 称为状态转移概率 P n1 P n2 L P nn 矩阵。 三、 马尔科夫模型在北京市住房价格预测中的 应用分析 本文根据 2009 年 1 月到 2012 年 5 月北京市商 品住宅的价格指数环比数据, 通过马尔科夫预测模 型, 在误差允许范围内预测北京市 2012 年 6 - 12 月 的商品住宅价格变动趋势。 文中所用数据来自国家
保 留 两 位 小 数, 如表 3 能出 现 的 各 种 状 态 的 概 率, 所示。
表3 2012 年 6 - 12 月北京市房价各种状态发生的概率值 E1 状态概率 0. 20 0. 30 0. 44 0. 47 0. 49 0. 49 0. 50 E2 状态概率 0. 60 0. 42 0. 33 0. 30 0. 28 0. 27 0. 26 E3 状态概率 0. 20 0. 28 0. 23 0. 23 0. 23 0. 24 0. 24
表1 P 原序列 一阶差分 价格指数的 ADF 检验 ADF 检验值 - 2. 53 - 4. 77 p值 0. 73 0. 00
为预测对象的初始状态向量, 它是由状 它处于任一 态的初始概率组成的向量。对于马氏链, 时刻 t 的概率可由初始概率和一步转移概率所决定。 2. 适用条件 预测模 型 只 适 用 于 具 有 马 尔 可 夫 性 的 时 间 序 并且时间序列在要预测的时期内, 各时刻的状态 列, 转移概率保持稳定, 即每一时刻向下一时刻变化的 均为一步转移概率。 若时序 转移概率都是一样的, 不宜用此方法。 的状态转移概率随不同时刻在变化, 由于实际的客观事物很难长期保持同一状态转移概 率, 故此方法一般适用于短期预测。 ( 三) 状态转移概率及其矩阵 E2 , …, E n 共 n 种状态, 客观事物可能有 E1 , 其每 次只能处于一种状态, 则每一状态都具有 n 个转向 ( 包括转向自身) , E i → E2 , …, E i →E i ,…, 即: E i →E1 ,
P11 = S ( k) · M P n1
P12 P n2
L L
P1n M P nn
统计局网站。 ( 一) 对时间序列数据进行平稳性分析 如果直接对 鉴于大多数时间序列是非平稳的, , 则很可能造成“伪回归” 因此首先 其进行回归分析, 需要对经济变量的时间序列进行平稳性检验 ( 如表 1) 。
一、 引言 房地产 价 格 是 当 今 社 会 最 关 注 的 热 点 问 题 之 一。房地产市场的稳定关系到国计民生, 房价的高 还造成了一系列负 涨不但加重了居民的生活负担, 面社会效应。 为此, 自 2010 年起, 我国政府不断加 大房价调控力度, 连续出台相关政策。 随着日益趋 紧的调控政策的颁布, 房价过快上涨趋势得到一定 程度的遏制。 但受政策和市场预期等因素的影响, 未来房价走势仍存在很大的不确定性, 这使得房屋 投资者、 开发商等难以作出下一步决策。 因此, 结合 采用合适的经济模型, 对房价做出 当前的经济形势, 准确预测是我们亟待解决的问题 。 国内外多位学者应用马尔科夫模型进行了各种 Bauerle 和 Rieder[1] 在对股价和利率的 研究与预测, 最优组 合 研 究 中 改 进 了 马 尔 可 夫 方 法; Hassan 和 Nath[2]运用隐马尔可夫模型预测了航空公司的股票 价格; Jayalal
k→∞ k→∞ k→∞ k→∞
lim ( k) = P 终极状态概率应满足的条件: 0 ≤ i ≤1 ( i = 1 ,
月 份 2012 年 6 月 2012 年 7 月 2012 年 8 月 2012 年 9 月 2012 年 10 月 2012 年 11 月 2012 年 12 月
定义: 经过无穷多次状态转移后所得到的状态 即: 概率称为终极状态概率, lim 2 ( k ) , L, lim n ( k) ] = = [lim 1 ( k ) ,