基于多元线性回归的商品住宅价格预测模型_王骏飞
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
表 1 模型检测结果
年份
2008 年
Leabharlann Baidu
实际值(元) 5066.672
预测值(元) 5073.3
2009 年 5506.084
5777.1
2010 年 7004.315
6717.7
2011 年 7810.826
7918.6
2012 年 7993.4 7954.8
通过上表可以看出检验结果误差较小 , 最大误差值为 286.6150, 最小误差值为 6.6280,平均误差值为 142.1266。 所求得模型可以应用 于实际预测之中去。
[责任编辑:王静]
(上接第 192 页)3 结论
总体而言,包含关键字和术语的检测规则的自动化算法在临床记 录中的感染症状检测中的表现非常出色。症状检测算法的表现好坏取 决于临床记录中不确定性和否定性症状的比例。该系统能很好地协助 检测叙述性文档的各种临床症状以支持实时临床决策和公共健康活 动。今后的工作将是系统开发和以规则为基础的症状检测和描述确定
2
y=β0 +β1 x1 +β2 x2 +β3 x1
(4)
输入数据,利用 SPSS 计算出回归模型方程中的参数 β0 、β1 、β2 、β3
得出方程为:
-5 2
y=-1795.224-0.956x1 +0.607x2 +3.888×10 x1
(5)
3.3 模型检测与评估
根据已知武汉商品住宅数据对模型进行检测,检测结果如下表:
报道,避免雷同、空泛和公文化。 S
【参考文献】 [1]河南兰考一居民楼失火致 7 名孩童死亡[OL].新华网[引用日期 2013-01-4]. [2]兰考“1.4”火灾事故 6 名相关 责 任 人 被 停 职 检 查[OL].中 国 新 网.2013-01-08 [引用日期 2013-01-8]. [3]兰 考 火 灾 追 踪 :记 者 15 通 电 话 得 到 一 句 “领 导 不 在 ”[OL].新 家 园 网[引 用 日 期 2013-01-9]. [4]央 视 质 疑 河 南 兰 考 有 钱 招 待 记 者 无 钱 盖 福 利 院[OL].网 易 新 闻 (转 引 自 央 视)[引用日期 2013-01-13]. [5]民政部:改进突发事件新闻发布 与媒体良性互动[OL].中国新闻网新闻[引用 日期 2013-01-15].
算法的改进。 S
【参考文献】 [1]王 灿 辉 ,张 敏 ,马 少 平 .自 然 语 言 处 理 在 信 息 检 索 中 的 应 用 综 述 [J]. 中 文 信 息 学 报,2007,21(2):35-45. [2] 李 毅 ,保 鹏 飞 ,薛 万 国 .中 文 电 子 病 历 的 信 息 抽 取 研 究 [J].生 物 医 学 工 程 学 杂 志 , 2010,27(4):757-762.
素 对 因 变 量 产 生 了 影 响 [5]。
2.1 相关性判别
相关分析用于描述两个变量之间关系密切程度,它反映的是当控
制了其中一个变量的取值后,另一个变量的变异的程度。 根据所得数
据,本文应用 Pearson 相关系数来对数据见联系强度进行判断。
Pearson 相关系数计算公式为:
n
Σ(x-x軃 )(yi -y軃 )
下面开始建立模型。 根据已知数据,用 Matlab 分别做 出 GDP、市 民收入与商品住宅价格的关系拟合图,并求得拟合曲线方程。
2 多元线性回归算法
回 归 分 析(Regression)是 一 种 应 用 广 泛 的 统 计 分 析 方 法 ,在 金 融 、
经济、医学等领域都已成功应用。 他应用于分析数据间的统计关系,侧
科技视界
科技·探索·争鸣
人,承担新闻发布工作,对重大新闻、热点敏感问题,实施归口管理,统 一组织发布。 3.2 早说话,就是要争取第一时间,抢占舆论先机
兰考火灾是在 1 月 4 日早上发生的,直到 5 日下午,当地民政部 门才召开新闻发布会 。 这一天多时间 ,官方权威部门的集体失语 ,让各 种版本的小道消息、流言蜚语满天飞,造成非常恶劣的影响。
and Dynamics Evidence from the Los Angeles and San Francisco Metropolitan Areas[J].Real Estate Economic,2000. [5]刘 大 海 ,李 宁 ,晁 阳 .SPSS15.0 统 计 分 析 从 入 门 到 精 通 [M].清 华 大 学 出 版 社 , 2008:151-211.
之所以会出现这样的情况, 是由于当地民政部门不会说话造成
的。 面对难点热点,民政部门应做到事件快说 、原因慢说,顺应大势,快 速准确地抓住发言时机,主动介入,把握大局,积极引导舆论,做到宏 观真实,又要力求准确、追求真相,做到微观真实。 同时,要注意方式方 法,不打官腔、不说空话套话,用群众语言说话。 可读性是媒体的生命 之根、发展之源,直接影响和决定民政新闻宣传的效果 。 民政部门还应 突出对工作亮点、鲜活事例、生动人物和社会关注点的报道,增加深度
1 月 5 日,兰考民政部门就火灾情况召开新闻发布会,官方回应 只提监管不力,对于社会关注度比较高的“为何属于民政部门救助的 弃婴要由私人来承担? ”“明知袁厉害不具备收养资格,‘有关部门’采 取了哪些措施? ”“弃婴为何难享孤儿补助? ”等问题却只知不提,被媒 体指责避重就轻,甚至说新闻发布会成了当地民政部门的“表功会”。
4 小结
本文所得多元线性回归模型基本能够在误差要求范围内预测 3 年内商品住宅价格。 模型稳定性较好。 对房地产市场有影响的因子很 多,本文只寻找出两种相关性较高的因子,但房地产市场会受到一些 突发性事件影响世界经济危机、国家政策调控等,而次模型还不具备 对突发性影响的应对机制,这有待进一步研究。 S (下转第 203 页)
【关键词】商品住宅价格;多元线性回归;预测模型
1 建模流程
3 实际模型实验
第 一 步 ,利 用 SPSS 对 已 知 的 商 品 住 宅 价 格 、工 资 收 入 以 及 GDP 的十年数据进行相关性分析,得出数据间的相关系数,根据这些相关 系数的大小来判断数据间是否有强联系,为下面进行预测模型的建立 的合理性提供依据。
下水与黄河地表水及东平湖水有着密切的水力联系。地表水有侧向补 给,使得地下水径流条件好,富水性强,特别是在开采条件下,可获得 大量的激发补给。 因此,应将东平湖西部丰富的地下水资源作为战略
资源加以评估、开发和利用。 S
[责任编辑:曹明明]
(上接第 210 页)[1]张红,李文诞.北京商品住宅价格变动实证分析[J].中国房 地 产 金 融 ,2001(3). [2] 周 京 奎 .房 地 产 价 格 波 动 与 投 机 行 为 [J].当 代 经 济 科 学 ,2005(7). [3]Geoffrey Meen, Mark Andrew. Modeling Regional House Prices: A Review of the Literature by The Centre for Spatial and Real Estate Economics[D].Department of Economics, The University of Reading,1998. [4]Stuart A Gabriel, Joe P.Mattey'William L.Wascher.House Price Differentials
【参考文献】
作 者 简 介 :王 骏 飞 (1990— ), 男 ,瑶 族 ,湖 北 武 汉 人 ,武 汉 理 工 大 学 理 学 院 ,计 算 数 学 专 业 。
210 科技视界 Science & Technology Vision
探索与争鸣
Science & Technology Vision
关。
2.2 线性回归模型
回归算法的基本步骤:首先把与所要预测的因变量相关度最高的
自变量引入到线性方程中去, 再把相关性次高的自变量带入方程,在
带入次高变 量 后 ,如 果 模 型 中 的 变 量 的 F 检 验 小 于 0.10,则 后 带 入 的
变量将不会被模型所接纳。 如此不断带入自变量进行循环,不断排除
重观察变量之间的数量变化规律,并通过回归方程的形式描述和反映
这种关系。 回归分析一般解决以下问题:确定自变量与若干因变量之
间关系的定量表达式,即回归方程式,并且确定它们关系的密切程度;
运用控制可控变量的数值,借助于所求出的方程式来预测或控制自变
量的取值;运行因素分析,从影响变量变化的因变量中,寻找出哪些因
3.1 相关性分析 首先分析 GDP、市民收入与商品住宅价格之间的相关性。 目的是
观察 GDP、市民收入与商品住宅之间相关性强度。 通过相关性分析得出商品住宅价格与 GDP 以及市民收入的相关
系 数 分 别 为 03.976、0.996,皆 为 高 度 相 关 ,所 以 GDP 与 市 民 收 入 为 影 响商品住宅价格的主要影响因子。 3.2 模型建立
模型不需要的变量,直到所有变量都已经被筛选过,就得出最优回归
模型。 模型形式为:
y=β0 +β1 x1 +β2 x2 …+βn xn
(2)
其中,F 作为多元线性回归显著性检验统计量,其定义公式为:
n
Σ(y赞 i
-y軃
2
)
/
p
F= n i = 1
(3)
Σ(yi
-y赞
2
)
/
(n-p-1)
i=1
p 为多元线性回归方程中的解释变量的个数。F 服从(p,n-p-1)个
r=
i=1
(1)
n
姨Σ(xi
-x軃
2
)
(yi
-y軃
2
)
i=1
其中,n 为样本个数,xi 和 yi 为要分析相关性的两变量,r 即为两变
量的相关系数。 当 0≤|r|≤0.3 时两变量为弱相关,当 0.3<|r|≤0.5 时为
低度相关, 当 0.5<|r|≤0.8 时为显著相关, 当 0.8<|r|≤0.1 时为高度相
自由度的 F 分布。
图 1 GDP、市民收入与商品住宅价格的关系拟合图
经过以上曲线拟合我们得出: 商品住宅价格与 GDP 为二次函数
关系,与市民收入为一次函数关系。通过房价与 GDP、市民收入之间的
函数关系,我们开始建立多元回归模型方程如下。
设商品住宅价格 y 与 GDP 为 x1、市民收入 x2 满足如下关系:
科技·探索·争鸣
Science & Technology Vision
科技视界
探索与争鸣
基于多元线性回归的商品住宅价格预测模型
王骏飞 (武汉理工大学 理学院,湖北 武汉 430070)
【摘 要】随着我国住房制度的商品化改革,我国住宅产业蓬勃发展,逐渐成为影响国计民生的重要产业之一。 本文的主要目的是挖掘武汉 商品住宅价格变化数据、市民工资收入和 GDP 数据间的关系,对商品住宅价格的影响因子进行全面的剖析,运用相关性算法得出各 影 响 因 子 所占权重,通过多元线性回归模型来预测商品住宅价格走势。
[责任编辑:杨扬]
(上接第 200 页)化。 随着国民经济的飞速发展和 人 民 群 众 生 活 水 平 的日益提高,原有的水资源评价成果已经不能满足现状需要,因此迫 切需要再次进行全面的水资源评价,为流域治理和再建项目水资源论 证提供依据。 3.4 开发利用丰富的地下水资源
湖西区地下水储藏丰富,地下水埋深一般在 1-3 米。 东平湖西地
时效决定成效 ,速度赢得先机 。 传播学上有一个 “首发效应 ”,首发 信息对受众形成 “第一印象 ”,先入为主 ,以后很难改变 。 民政部门作为 政府的组成部门,具有强大的公信力,应对热点难点问题时,民政部门 越早发出声音,越能提高可信度,越能增强舆论的引导力,其它流言蜚 语也就不攻自破了。民政部门应建立突发公共事件新闻宣传报道应急 机制,设计应急预案,明确报道原则,加大组织协调,规范发布程序,加 强舆情研判,并强化纪律要求和责任追究。 3.3 会说话,就是要讲究宣传艺术,提高宣传实效
第二步,本文运用多元线性回归算法进行数据预估。 首先把与商 品住宅有强联系的数据类作为自变量, 把商品住宅价格作为因变量, 分别对强联系的数据类和商品住宅价格进行曲线多项式拟合,大致确 定商品住宅与其强联系数据类之间的影响关系,通过分析它们之间的 关系进行多元回归数学模型的建立。
第三步,通过历史数据对模型进行检验,并评价预测模型。