基于层次分析法和回归分析的房价分析与预测模型
房地产市场中的房价预测模型比较

房地产市场中的房价预测模型比较引言:随着经济的发展和城市人口的增加,房地产市场一直都是一个备受关注的领域。
了解和预测房价走势对于投资者、开发商和政府来说都至关重要。
然而,由于房地产市场的复杂性和不确定性,准确预测房价一直都是一个具有挑战性的任务。
因此,为了解决这个问题,许多研究人员和机构开发了各种不同的房价预测模型。
本文将比较几种常见的房价预测模型,分析它们的优缺点和适用场景。
一、回归模型回归模型是最常见和广泛使用的房价预测方法之一。
它使用历史数据和相应的影响因素来建立一个数学模型,通过对未来一段时间的数据进行回归分析来预测房价。
回归模型可以分为线性回归和非线性回归两种。
1.1 线性回归模型线性回归模型假设价格与影响房价的因素之间存在线性关系。
它使用各种因素(如房屋面积、房龄、地理位置等)来建立数学模型,通过回归分析来预测未来的房价。
线性回归模型的优点是简单易用,计算效率高;缺点是无法处理非线性关系。
1.2 非线性回归模型非线性回归模型进一步拓展了线性回归模型的概念,它允许因素之间存在非线性关系。
非线性回归模型使用更复杂的数学函数来建立模型,并根据历史数据进行参数估计。
非线性回归模型的优点是可以更好地拟合实际数据,处理较复杂的关系;缺点是模型复杂度较高,计算成本较高。
二、人工神经网络人工神经网络是一种模拟人类神经系统工作方式的数学模型。
它通过训练算法从历史数据中提取模式,并学习建立预测模型。
人工神经网络模型在房价预测中表现出色,尤其是处理复杂非线性关系方面。
2.1 多层感知器(MLP)多层感知器是最常用的人工神经网络结构之一。
它由输入层、隐藏层和输出层组成。
多层感知器通过训练算法学习输入和输出之间的复杂关系,并通过这种关系进行预测。
多层感知器的优点是能够处理复杂的非线性关系,但模型的训练过程需要大量数据和计算资源。
2.2 循环神经网络(RNN)循环神经网络是一种具有循环连接的神经网络结构,可以处理时间序列数据。
基于逐步回归分析的房屋售价预测模型研究

基于逐步回归分析的房屋售价预测模型研究一、引言在当今的社会生活中,房地产是一个非常重要的经济产业,其对于国家经济的发展与人民生活质量的提升都起到了很大的促进作用。
房地产开发商为了能够更好地进行房产销售管理,从而提高其竞争力,需要通过各种方法来预测房屋售价,以制定合适的价格策略。
因此,本文将基于逐步回归分析来研究房屋售价预测模型。
二、相关背景2.1 房屋售价预测模型的意义房地产业是重要的经济支柱之一,售价的波动与走势更是直接关系到房企的营业收入与经济利益。
因此,研究房屋售价预测模型,开发出有效的预测模型,具有非常重要的研究意义和现实应用价值。
2.2 逐步回归分析的理论背景逐步回归分析主要是在估计变量间关系时,通过逐个逐个加入依次调整参数。
其本质是模型变量选择,即在变量集中,选出对因变量解释效果最好的一些变量,以实现计算预测值与实际值差距最小化的目的。
三、逐步回归分析简述3.1 模型建立在建立房屋售价预测模型时,我们需要从多个方面来考虑决策变量与因变量之间的关系,如建筑面积、地理位置、装修情况、周边环境等因素。
在逐步回归分析中,首先需要确定一个房屋售价的初始模型,再逐步加入其他变量并分析这些变量对模型的影响。
3.2 模型优化在加入新变量后,要进行模型效果的观测与判断,比较各自的贡献程度,进而以均方误差等统计指标来评价模型的拟合程度,从而修正与优化模型。
四、实例应用4.1 数据预处理在模型实例的应用中,我们需要对数据进行处理,例如对数据进行筛选、去重、缺失值填充等,以确保得到的数据更完整、准确、可靠。
4.2 模型实施通过R软件、Python软件等进行逐步回归分析,可以得到包括各项参数的最终模型,同时也得到模型参数的系数与显著性检验,从而分析变量对实际值的贡献程度,并提供更加科学的参考依据。
五、总结本文主要介绍了基于逐步回归分析的房屋售价预测模型研究,通过数据处理、模型建立、优化与实例应用等环节的详细阐述,表明了该方法在房产销售中的重要作用与价值。
基于层次分析法的城市房地产价格分析

基于层次分析法的城市房地产价格分析一、问题的提出1.问题提出的背景1.1房地产在国家经济中的重要性。
房地产在国家经济中的有着重要的地位,是国家经济发展的重要驱动力。
在我们国家,房地产的蓬勃发展给国家的经济发展作出了巨大贡献,成为拉动国家和地区经济发展的支柱性行业。
同时,房地产关系到人们的日常生活,房地产行业的良好发展将极大的提高人们的生活质量,是国家关注的重要问题之一。
1.2房地产在国家经济中的高危险性。
房地产由于它的重要性,资金密集性和高回报性,也是一个容易出问题的行业,2008的金融危机主要是由于房地产的次贷抵押缺乏信誉而造成。
我们都知道金融危机给国家乃至整个世界的经济带来的危害都是空前的,常常会引来几年、十几年、甚至是几十年的经济倒退或停滞。
房地产是个交叉性行业,它的发展关系到材料、建筑、金融等好多个行业的发展,尤其是金融行业。
由于房地产是一个资金密集型行业,需要大量的资金,这些资金大部分都来源于金融。
金融行业由于其的高垄断性和对国家机器正常运转的高影响性,常常是影响国家经济发展的一个敏感性行业。
房地产出了问题,首先造成金融行业的混乱,如果金融行业的混乱不能得到有效制止,将直接影响到国家机器的运行。
房地产业的危险性有此可见一斑。
1.3房地产行业的高复杂性。
房地产行业关系到很多行业的发展,也关系到国家政治、经济、社会的很多方面。
房地产需要投资,首先对经济发展有影响;房地产的发展需要大量的资金,需要金融机构的支持,这就直接影响到国家的政治制度,这些制度又反过来作用于房地产业,影响房地产的发展;最后,房地产影响到国计民生,有着深刻社会性影响。
房地产高额的利润回报,常常成为社会一些大资本家投资的重点,这些资本家为了提高自己的话语权想尽千方百计,甚至于拉拢政府官员一起进行建设,不但会引起经济上的腐败,也会对政府在一些政策的制定上带来影响。
房地产行业的复杂性造成了房地产价格影响因素的错综复杂,使得房地产价格的分析成为了一个值得思考和研究的问题的问题。
基于回归分析的房价模型及预测

基于回归分析的房价模型及预测随着生活水平的提高和城市化进程的加速,房地产市场已经成为了国民经济的重要组成部分。
对于购房者而言,他们需要了解市场上的房价走势,以便更好地做出投资决策。
而对于开发商而言,他们需要明确自己产品的价值,以便正确定价并获得市场份额。
因此,基于回归分析的房价模型及预测在当前的经济背景下显得极其重要。
本文将介绍回归分析的相关知识,并利用Python语言建立基于多元线性回归的房价模型,并预测房价走势。
一、回归分析的知识介绍回归分析是一种通过对因变量与自变量之间的关系进行建模来对因变量进行预测的统计分析方法。
简单来说,回归分析就是用已知的自变量数据来预测未知的因变量数据。
在回归分析中,自变量与因变量之间的关系可以用一条直线或曲线来表示,这条直线或曲线称为回归线或回归曲线。
在回归分析中,自变量数量的不同可以分为简单线性回归和多元线性回归。
如果自变量只有一个,称为简单线性回归;如果自变量有多个,称为多元线性回归。
在建立回归模型之前,需要考虑一些问题,例如选择哪些自变量,如何评价模型的拟合程度等。
二、基于多元线性回归的房价模型建立在本文中,我们选择了三个自变量,分别是房屋面积、房间数量和街区位置。
我们使用Python语言来建立回归模型,其中使用了Pandas、NumPy、Scikit-learn和Matplotlib 等库。
具体代码如下所示:```pythonimport pandas as pdimport numpy as npfrom sklearn.linear_model import LinearRegressionimport matplotlib.pyplot as plt# 读取房屋数据data = pd.read_csv('house.csv')x = data.iloc[:, 1:4].valuesy = data.iloc[:, 0].values# 拟合回归模型model = LinearRegression()model.fit(x, y)R2 = model.score(x, y)print('R2 coefficient:', R2)# 显示散点图plt.scatter(data['Area'], data['Price'], color='blue')plt.xlabel('Area')plt.ylabel('Price')我们首先使用Pandas库读取房价数据,并将数据分为自变量和因变量。
房地产市场的价格预测模型与建模分析

房地产市场的价格预测模型与建模分析房地产市场是一个重要的产业,对于政府经济政策的制定和投资者的决策具有重要影响。
因此,对于该市场的价格预测模型与建模分析显得尤为重要。
本文将讨论房地产市场价格预测模型的建立与分析方法,以帮助投资者和政府决策者更好地理解市场趋势和未来走势。
一、房地产市场价格预测模型的建立方法房地产市场价格预测模型的建立可以采用多种方法,包括回归分析、时间序列分析和机器学习等。
下面将分别介绍这些方法的原理和应用。
1. 回归分析回归分析是一种常用的统计方法,用于探索变量之间的关系。
在房地产市场中,可以选择影响房价的相关变量,如地理位置、楼层、面积、楼龄等,作为自变量,房价作为因变量,建立回归模型进行预测。
通过分析各个自变量的系数和显著性水平,可以了解各因素对房价的影响程度和方向。
2. 时间序列分析时间序列分析是一种用于研究时间序列数据的方法,适用于预测具有一定规律性和趋势性的数据。
在房地产市场中,可以将历史的房价数据作为时间序列数据,通过分析趋势、周期性和季节性等特征,建立时间序列模型进行预测。
3. 机器学习机器学习是一种基于数据的自动化建模方法,可以利用大量的历史数据进行模型训练和预测。
在房地产市场中,可以使用机器学习算法,如决策树、随机森林、神经网络等,根据房产特征数据和历史价格数据进行训练,建立预测模型。
机器学习有着良好的拟合能力和预测性能,可以提供较为准确的房价预测结果。
二、房地产市场价格模型的分析方法建立价格预测模型之后,需要对模型进行分析以评估其准确性和稳定性,进而为投资者和政府决策者提供决策支持。
下面将介绍几种常见的模型分析方法。
1. 模型拟合度分析模型拟合度分析用于评估模型对观测数据的拟合程度,可以通过计算拟合优度指标(如R方值)来衡量模型的拟合效果。
拟合度分析可以帮助我们了解模型的预测能力和稳定性。
2. 模型参数显著性检验模型参数显著性检验可以用于评估各个自变量对因变量的影响是否显著。
基于回归的房价预测模型研究

产业经济基于回归的房价预测模型研究王景行(唐山市第二中学,河北唐山063000)摘要:本文关注房价的影响因素,从79个影响特征中选择重要的特征,并且使用特征处理方案来得到更优特征,用以训练多个回归模型,包括Lasso回归模型,以及XGBoost回归模型,最终使用Stacking模型融合方案来预测房价。
在测试数据集中的表现模型融合优于单模型结果,所以最终使用模型融合方案来对房价做预测。
通过#匕次房价预测,旨在发现房屋价格的影响因素以及得到房屋预测模型用以将来迁移学习其他地域的房屋价格预测。
关键词:模型融合;线性回归;房价预测;建模分析中图分类号:F299.23文献识别码:A文章编号:2096—3157(2020)19—0120—03—、研究背景随着大数据时代的到来,具备大数据思想至关重要,人工智能技术在各行各业的应用已是随处可见。
在生产制造业,人工智能技术可以极大地提高生产效率,节省劳动成本,提升产品质量;在服务业,可以优化行业现有产品和服务,提升其质量和劳动生产率;金融、医疗等领域,也因人工智能技术的加入而愈发繁荣,人们的生活也因为其更加便利。
房屋作为每个公民的必需品,在生活中的地位非常重要,买房已成为人们谈论较多的话题,如何在合适的时间买房卖房也成为了人们关注焦点,因此在这样的背景下,产生了本次的房价预测相关问题。
目前在房价预测领域主要体现在两个问题上:一是选择合适的数学模型来预测房价走向,用以评估房价的变化;二是寻找引起房价变化的原因,国家可借此来帮助市场协调房价变化,公民可以根据时事来判断入手时机。
本文主要分析第一个问题,即选择合适的数学模型来帮助预测房价。
本文将从波士顿的房价数据为着手点,以该市的房屋的相关属性来作为特征,筛选重要信息,并且将一些信息做适当处理,最终用以预测该市的其他房屋价格。
二、研究方法1.线性回归算法简介(1)算法思想在统计学中,线性回归曲(Linear Regression)是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析raM o这种函数是一个或多个称为回归系数的模型参数的线性组合。
基于回归分析和傅里叶级数分析的房价模型

基于回归分析和傅里叶级数分析的房价模型针对房地产价格问题,运用线性与非线性回归、主成分分析、傅里叶变换等方法,首先根据最近十年武汉分区数据得到了商品住宅价格与人均GDP、人均可支配收入、大宗商品价格指数的关系,然后对于2013年6月-12月的商品住宅价格变化趋势做出了预测。
标签:回归分析;傅里叶级数;主成分分析1模型的建立、求解与评价1.1模型介绍我们以行政区划作为划分,选择了武汉中心城区具有代表性的三个区(江岸区,江汉区,硚口区)进行建模分析。
根据武汉市统计局及武汉市统计年鉴中的数据,首先对于三个自变量两两之间进行了相关性分析,然后进行主成分分析,最后以贡献率最大的主成分为新的变量与商品住宅价格做回归拟合,得到各变量间的函数关系。
1.2模型建立根据武汉市统计局及权威网站查询、计算得出以最近10年各区以上四个变量数据(以江岸区为例)如下图1。
图1武汉市近十年分区商品住宅价格变化自变量之间相关性分析模型建立:r(Xi,Xj)=σ2(Xi,Xj)σ(Xi)*σ(Xj)(i,j=1,2,3)σ2(Xi,Xj)=2012n=2003(Xin-i)(Xjn-j)10通过主成分分析,将人均GDP、人均可支配收入及大宗商品价格指数三个相关性较大的变量重新组合成一组新的相互无关的综合指标来代替原来的指标。
由此定义主成分为:Gi=3t=1αitXt其中10i=1α2it=1(t=1,2,3)最后求出第i个主成分的贡献率,这个值越大,表明第i主成分综合信息能力越强。
主成分累积贡献率≥90%作为主成分个数的m的选择依据。
1.3模型的求解(1)主成分分析。
根据相关性结果,利用MATLAB软件进行主成分分析,结果如表1。
表1江岸区主成分分析结果特征值 2.87040.12770.0019贡献率0.95680.04260.0006累计贡献率0.95680.99941(2)回归拟合。
通过MATLAB中cftool对于图像进行拟合,比较各种函数之后发现三次多项式拟合效果较为理想,故选用三次多项式进行拟合。
基于层次分析法的购房决策分析

基于层次分析法的购房决策分析摘要:对于国人来说,住房肯定是人生最重要的事之一,那么购房当仁不让的成为了许多家庭深思熟虑的问题。
就现在的购房市场而言,可以将购买人群分为两类:工薪家庭和高薪家庭。
无论是哪一类家庭,他们在购房过程中都基本会考虑到房价、距市区的距离、周边环境、教育配套以及生活配套这五大因素。
本文在对层次分析法的发展现况以及该理论存在的问题综述的基础上,简述了AHP解决问题的基本步骤,并从数学原理角度对AHP中的重要概念——判断矩阵一致性做了较为简单的介绍;其次,利用层次分析法的理论对同一类住房进行排序,择优选出较理想的住房,旨在使得购买更加合理,获得较大价值的目的。
关键词:家庭购房;层次分析法;量化;决策Based on the analytic hierarchy process (AHP) a homebuyers decisionAbstract:For the people, house is certainly one of the most important things in life, then buyers an insight into the many families considered problem. The purchase of the crowd can be a buyers market, divided into two categories: the purchase of high-paying families, working families buyers. No matter what type of family, they are basically in the purchase process will be considered to the price, Away from the urban, the surrounding environment, education, as well as supporting the life supporting these five factors. On the basis of the current state of development of the analytic hierarchy process as well as the theoretical existence of review briefly the basic steps of AHP to solve the problem from the point of view of mathematical principles consistency of judgment matrix do important concept of AHP ——relatively simple introduction; Secondly, the use of the theory of the Analytic Hierarchy Process sort of the same type of housing, merit elect better housing, designed to make the purchase more reasonable for a larger value.Key words:home buyers; analytic hierarchy process; quantified; decision目录第一章引言 (1)1.1研究背景 (1)1.2层次分析法 (1)第二章应用层次分析法进行购房决策 (2)2.1工薪家庭购房分析 (3)2.1.1层次结构图 (3)2.1.2构建标度及两两比较矩阵 (4)2.1.3求各因素的权重 (4)2.1.4两两比较矩阵的一致性检验 (7)2.1.5选择最优方案 (8)2.2高薪家庭购房分析 (9)2.2.1层次结构图 (9)2.2.2构建标度及两两比较矩阵 (10)2.2.3求各因素的权重 (11)2.2.4两两比较矩阵的一致性检验 (12)2.2.5选择最优方案 (12)第三章综合评价及购房建议 (13)结束语 (13)致谢 (14)参考文献 (14)附录 (15)基于层次分析法的购房决策分析第一章引言1.1研究背景对于国人来说,住房肯定是人生最重要的事之一,那么购房当仁不让的成为了许多家庭深思熟虑的问题。
房价的影响因素分析及预测模型完整版

房价的影响因素分析及预测模型标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]房价的影响因素分析及预测模型——基于北京市相关数据的实证研究摘要房地产既是我国国民经济的支柱产业,也是关系重大的民生问题。
本文以北京市经济适用房销售价格、北京市生产总值等相关数据为例,分析房价的主要影响因素,建立房价与其影响因素的关系模型对北京市房价进行准确预测,并根据得出的预测结果对房地产发展提出合理性意见:问题一,建立影响房价的指标体系,利用软件将各指标数据进行折线图描述,将变化偶然性较大的货币供应量删除,建立主成分分析模型提取主成分,将各指标对各主成分的贡献率加权得到每个指标的总贡献率,比较得出影响北京市房价的六项主要指标依次为:X4居民家庭人均收入,X10房地产开发投资额,X2北京市生产总值,X1经济适用房销售价格,X6人均住宅建筑面积,X5新增保障性住房面积。
问题二,建立逐步回归模型,根据软件的运行结果显示,被剔除的前六个变量与问题一得出的六项主要指标一致,证明结论正确。
建立多元回归分析模型,由软件实现得到北京市房价与其主要影响因素的关系模型为:Y=4846.453+0.843X1+1.719X2+0.028X4−4.652X5−278.822X6−3.564X10。
问题三,建立曲线估计模型,通过软件拟合得到各指标变量随时间拟合的曲线方程(见表3·1),将预测房价与实际值进行比较,其平均误差仅为%,说明预测效果良好。
利用软件运行得到各指标及房价在2000至2015年的房价(见表3·6)稳中有升。
问题四,根据所得预测结果、北京房地产市场结构、政府相关政策,结合经济学知识,对北京市房地产发展提出合理建议。
最后,对所建模型进行了优缺点评价,在模型推广种介绍了这几个模型的广泛应用。
关键词:房价预测、影响因素、主成分、线性回归、曲线拟合一、问题重述1.1问题的背景及条件俗话说;“安居才能乐业!”在我国的传统观念中房子就家,不管住别墅还是住瓦房,每一个家庭都必须有自己的住房,因此住房问题本生就是关系国计民生的大问题。
基于线性回归的房价预测模型构建及应用研究

基于线性回归的房价预测模型构建及应用研究随着城市化进程的不断加快,房地产的发展已经成为当今经济发展的重要支柱。
因此,房价的预测模型也成为了一项非常重要的研究课题。
在这方面,基于线性回归的房价预测模型已被广泛应用,并取得了明显的效果。
本文将介绍如何构建基于线性回归的房价预测模型以及其应用研究。
一、线性回归模型简介线性回归模型是一种常用的统计学习方法,用于分析自变量与因变量之间的关系。
它通过建立一个关于自变量和因变量的线性方程,来对未知数据进行预测。
线性回归模型的基本形式为:y = β₀ + β₁x₁+ β₂x₂ + ⋯ + βₖxₖ其中,y 表示因变量,x₁~xₖ 表示自变量,β₀~βₖ 表示各自变量的系数。
线性回归模型假设自变量与因变量之间的关系是线性的,即自变量的每次单位变化都相应地以β₁, β₂, ⋯, βₖ 的速度影响因变量 y 的变化。
二、构建线性回归的房价预测模型在进行房价预测模型的构建之前,首先需要确定一组自变量,这些自变量通常包括房屋面积、位置、楼层数、周围环境等因素。
这些因素中,房屋面积往往是最为重要的因素,因为它直接影响着房屋的价值。
因此,在这里,我们以房屋面积作为自变量,以房价作为因变量,来构建一组简单的房价预测模型。
首先,我们需要先确定一组数据集,用于作为模型的训练数据。
这些数据包括若干组已知的房屋面积和对应的房价值。
假设我们已经确定了一组数据集,现在我们就可以使用Scikit-Learn库来进行线性回归模型的训练了。
在Scikit-Learn库中,线性回归模型的训练可以通过以下步骤完成:1. 导入必要的库```from sklearn.linear_model import LinearRegressionimport numpy as np```2. 准备训练数据```X_train = np.array([[1], [2], [3], [4], [5]]) #房屋面积数据集Y_train = np.array([[100], [200], [300], [400], [500]]) #房价数据集```3. 构建线性回归模型并进行训练```model = LinearRegression()model.fit(X_train, Y_train)```4. 输出模型参数```print("系数:", model.coef_) #输出自变量系数print("截距:", model.intercept_) #输出截距```通过以上步骤,我们就可以得到一个基于线性回归的房价预测模型。
基于ISM和层次分析对房价问题的系统分析

影响房价因素问题的系统分析摘要:在过去的几年中居民住房的价格一涨再涨,政府也不断出台新政,试图遏制房价持续增长的态势,但收效甚微,房价还是在一路飙升。
随着人们生活水平的不断提高,居民的可支配收入也有很大程度上的提高,这就使人们对住房的需求量变大,从而使房价大涨。
但这并不是房价疯狂上涨的主要原因,随着房价的上涨,买房难已成为社会普遍关注的因素。
本文希望通过建立ISM模型,分析影响房价的主要因素,并以此提出一些方案,应用AHP分析找出最优方案。
关键字:矩阵ISM模型 AHP模型分析程序:1.问题背景2.探寻目标3.建立ISM模型4.用AHP法进行决策分析5.综合方案6.系统综合分析评价一、问题背景随着人们生活水平的不断提高,居民的可支配收入也有很大程度上的提高,这就使人们对住房的需求量变大,从而使房价大涨。
但这并不是房价疯狂上涨的主要原因,随着房价的上涨,买房难已成为社会普遍关注的因素针对房价高这一问题,通过收集并分析了以下几个方面的影响因素:S1: 市场需求; S2: 居民收入;S3:消费水平; S4: 人口数量:S5:社会安定状况; S6:城市化程度;S7:放贷政策; S8: 心理因素;S9: 环境品质; S10:建筑品质。
然后利用所学系统工程的相关理论和方法对其进行讨论和分析。
二.探寻目标通过系统分析,找出影响房价高的主要因素以及对其影响程度,进而提出解决的方案,再通过方案评优找到最优方案。
三.建立ISM模型影响房价高的因素有很多,经查相关资料及反复研究,找到以下因素:S1: 市场需求;S2: 居民收入;S3:消费水平;S4: 人口数量;S5:社会安定状况;S6:城市化程度;S7:放贷政策;S8: 心理因素;S9: 环境品质;S10:建筑品质。
对上述因素进行讨论,确定它们的关系如下表所示:建立的邻接矩阵根据上文建立的邻接矩阵 ,利用分析的方法 ,建立可达矩阵缩减后的矩阵:具有层次结构的缩减矩阵:递阶结构模型解释结构模型结论:随着经济发展,城市化程度必定不断提高,房价在总体上还是会不断上涨的。
用回归分析预测房价走势

用回归分析预测房价走势随着房地产市场的不断发展,对于房价走势的预测也越来越受到关注。
而回归分析作为一种经典的预测方法,被广泛应用于房价预测中。
本文将从回归分析的基本原理、建模方法和预测结果等方面介绍如何用回归分析预测房价走势。
一、回归分析的基本原理回归分析是一种统计学方法,用来研究变量之间的关系。
在房价预测中,回归分析可以用来研究房价与其他变量之间的关系。
假设我们有n个样本数据,每个样本数据包含p个变量,其中一个变量是我们要预测的房价。
我们可以使用回归分析来找到其他变量与房价之间的关系,以此来预测未来房价的走势。
回归分析基于一个最基本的假设,即自变量和因变量之间存在某种确定性的关系,这个关系可以用一个数学函数来表示。
这个数学函数被称为回归方程,它描述了自变量与因变量之间的关系。
回归分析的目的就是通过样本数据找到一个最优的回归方程,以此来预测未知数据的结果。
二、回归分析的建模方法在房价预测中,常常使用多元线性回归分析。
多元线性回归分析可以用来研究多个自变量与因变量之间的关系,以此来预测房价走势。
下面我们将介绍一下多元线性回归建模的具体步骤。
1. 数据准备:收集房价相关的数据,包括自变量和因变量。
自变量可以是房屋面积、位置、年龄、学区等等。
因变量就是我们要预测的房价。
2. 数据分析:对收集到的数据进行探索性分析,查找变量之间的相关关系。
可以使用散点图、相关系数等方法来分析变量之间的关系。
3. 变量筛选:根据数据分析的结果,筛选出与因变量相关性较强的自变量。
可以使用正向选择、逆向选择、向前选择、向后选择等方法进行变量筛选。
4. 建立模型:选择最优的自变量组合,建立多元线性回归模型。
模型的形式为:Y=a+b1X1+b2X2+...+bpXp+ε,其中a为截距,b1~bp为自变量的回归系数,ε为误差项。
5. 模型评估:使用各种评估指标来评估模型的预测能力。
常用的评估指标包括均方误差、可决系数、F检验等。
三、预测房价走势经过以上步骤,我们已经建立了一个房价预测模型。
[参考]基于回归分析的房价模型及预测
![[参考]基于回归分析的房价模型及预测](https://img.taocdn.com/s3/m/64fb7bd3376baf1ffd4fad26.png)
城市竣工面积(万平方米)人口增长率(‰)工薪收入(元)城乡人均储蓄余额(元/人)造价(元/平方米)人均全年住房支出(元)城镇房地产开发投资(亿元)房价(元/平方米)北京13799 天津6886 石家庄19263.99 3263 上海12840 南京4983 杭州7826 福州19516.98 5427 武汉3532 长沙2680 成都3509 昆明2931 拉萨2452 西安3223 平均n j m i ma a a a ma a a ab mjj j ij mj j j ij ij 2,1;2,1012121==⎪⎪⎩⎪⎪⎨⎧+++<+++≥=城市编号 竣工面积人口增长率 工薪收入 储蓄余额造价 人均每年住房支出开发商投资 房价 1 0 0 1 1 1 1 1 1 2 0 0 1 1 1 1 0 1 3 0 1 0 0 0 0 1 0 4 0 0 1 1 1 1 1 1 5 1 0 0 0 1 1 1 0 6 1 0 1 1 1 1 1 1 7 0 0 0 0 0 0 0 0 8 0 1 0 0 0 0 0 0 9 0 0 0 0 0 0 1 0 10 0 0 0 0 0 0 0 0 11 0 1 0 0 0 1 0 0 12 0 1 0 0 0 0 0 0 13111()()8905.0139log 139134log 1349,4,2221=--==I s s I 房价=1 房价=0 竣工面积=1 1 1 竣工面积=038()121log 2121log 21,222111=--=s s I()8454.0118log 118113log 113,222212=--=s s I()()()8691.0,1311,132221221115=+=s s I s s I x E()()()0451.0,5215=-=x E s s I x Gain房价=1 房价=0 人口增长率=1 0 5 人口增长率=0 4 4 储蓄余额=1 4 0 储蓄余额=0 0 9 造价=1 4 1 造价=0 0 8 年人均住房支出=1 4 3 年人均住房支出=0 0 6 开发商投资=1 3 3 开发商投资=016()()()2850.0,6216=-=x E s s I x Gain ()()()6128.0,1211=-=x E s s I x Gain ()()()8905.0,2212=-=x E s s I x Gain()()()6128.0,3213=-=x E s s I x Gain ()()()3600.0,4214=-=x E s s I x Gain()()()1104.0,7217=-=x E s s I x Gain()()()()()())(5764312x Gain x Gain x Gain x Gain x Gain x Gain x Gain >>>>=>tx a x a x a x a Y ε++++=44332211ˆ 城 市 Y1x2x3x4x北 京 13799 天 津 6886 石家庄 3263 1 上 海 12840 南 京 4983 杭 州 7826 福 州 5427 武 汉 3532 长 沙 2680 9 成 都 3509 昆 明 2931 拉 萨 2452 西 安3223t x x a x x a x x a x x a Y Y ε+-+-+-+-=-)()()()(444333222111t x a x a x a x a Y ε+∆+∆+∆+∆=∆44332211Y∆1x ∆2x ∆3x ∆4x ∆北 京 79 天 津 石家庄 上 海 南 京 杭 州 147.8984福 州 武 汉244332211n1t n 1t 2t )( = )(t t t t t x a x a x a x a Y a S ∆-∆-∆-∆-∆=∑∑==ε0)(2)(14433221111=∆-∆-∆-∆-∆∆-=∂∂∑=nt t t t t t t x a x a x a x a Y x a a S 014413312211111=∆∆+∆∆+∆∆+∆∆+∆∆-∑=t t t t t t t t tnt x x a x x a x x a x x a xYaa ba ca da ab bb cb db ac bc cc dc ad bd cd dd μμμμμμμμμμμμμμμμ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡4321a a a a = ya yb yc yd μμμμ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦ 8103326.2⨯=aa μ 9101461.1⨯==ab ba μμ 7107483.1⨯==ac ca μμ 6108190.9⨯==ad da μμ9107575.6⨯=bb μ 8101038.1⨯==bc cb μμ 7108191.4⨯==bd db μμ6101654.3⨯=cc μ 6100633.1⨯==cd dc μμ 5103300.6⨯=dd μ 8109062.1⨯=ya μ 9100607.1⨯=yb μ 7106910.1⨯=yc μ 6104238.8⨯=yd μ1197.01=a 1281.02=a长 沙 成 都 昆 明 - 拉 萨 西 安0715.34=a)7.28495(1281.0)7.13611(01197.0[4.5642ˆ21-+---=x x Y t ε)]2.424(0715.3)9.1901(8191.043-+--x x城市序号残差 1 2 3 4 5 6 7 8 9 10 11 12 13 平均值城市 实际商品房平均销售价 计算商品房平均销售价 误差百分比 1 13799 13731 0.49% 2 6886 6655 3.35% 3 3263 3321 -1.78% 4 12840 13181 -2.66% 5 4983 5375 -7.87% 6 7826 7351 6.07% 7 5427 5024 7.43%年份工薪收入(元) 城乡人均储蓄余额(元/人)造价(元/平方米)人均全年住房支出(元)2005 10152.14 36356.46 1780.60 489.502006 11590.45 41007.03 1801.84 501.232007 13666.34 48619.64 2153.40 456.302008 16284.17 55064.01 2392.99 575.682009 56064.54 2175.572010 86561.06 2374.102011 83601.71 2219.07年份序号9 10 11 12 年份2012 2013 2014 2015 工薪收入(元) 24624 26438 28253 30068年份序号9 10 11 12 年份2012 2013 2014 2015 城乡人均储蓄余额117495 134660 153385 173670年份序号9 10 11 12年份 2012 2013 2014 2015 住房造价年份序号 9 10 11 12 年份 2012 2013 2014 2015 住房支出1x2x3x4x年份 工薪收入(元) 城乡人均储蓄余额(元/人) 住房造价(元) 住房支出(元) 2012 24624 117495 2013 26438 134660 2014 28253 153385 2015 30068 173670年份 预测房价(元)2012 18698 2013 21251 2014 24034 201527045。
合肥市二手房价多元线性回归预测模型

合肥市二手房价多元线性回归预测模型合肥市是中国安徽省的省会城市,也是一座具有深厚历史文化底蕴的城市。
随着城市的发展壮大,房地产市场也日益繁荣。
如今,合肥市的房地产市场已成为吸引投资者和购房者的热门领域,尤其是二手房市场更是备受关注。
对合肥市二手房价的预测和分析也成为了研究的热点之一。
为了更准确地预测合肥市二手房价的走势,我们可以采用多元线性回归模型进行预测。
多元线性回归是一种统计学方法,用于分析一个因变量与两个或两个以上自变量之间的关系。
在这种情况下,我们可以将二手房价格视为因变量,而相关影响因素(如房屋面积、楼层、地段等)则可以视为自变量。
通过建立多元线性回归模型,我们可以利用已知的数据对未来的房价变化进行预测,这对于购房者和投资者来说都具有重要的参考意义。
我们需要收集相关的数据。
合肥市的二手房市场数据可以通过房地产中介公司、政府部门或者专业机构来获取。
这些数据可能包括二手房的成交价格、面积、楼层、地段、交通状况等信息。
通过对这些数据的整理和筛选,我们可以建立起一个完整的数据集,作为我们进行多元线性回归分析的基础。
接下来,我们需要进行数据的清洗和处理。
在数据清洗过程中,我们需要对数据进行筛选、去除异常值,处理缺失值,以保证数据的准确性和完整性。
我们还需要对自变量进行标准化处理,以避免因为自变量尺度不同而造成的误差。
在数据清洗和处理完成之后,我们可以开始建立多元线性回归模型。
多元线性回归模型的建立需要考虑到自变量之间的相关性和多重共线性等因素。
在建立模型之前,我们需要进行自变量的相关性分析,通过相关系数矩阵或者散点图矩阵来观察自变量之间是否存在较强的相关性。
如果存在较强的相关性,我们需要进一步进行变量选择和剔除一些自变量,以避免多重共线性对模型结果的影响。
建立了多元线性回归模型之后,我们需要对模型进行拟合度和显著性检验。
拟合度检验可以通过判定系数(R方值)来进行评估,R方值越接近于1,说明模型对观测数据的拟合程度越高。
合肥市二手房价多元线性回归预测模型

合肥市二手房价多元线性回归预测模型随着城市化进程的不断推进,越来越多的人开始关注房价问题,特别是在一线城市和热门城市,房价已经成为了不少人关注的焦点。
作为中国的一个重要城市,合肥市的房价也受到了广泛的关注。
在合肥市,二手房价的变化受到了多种因素的影响,比如说经济发展水平、人口变化、政策调控等等。
因此,研究合肥市二手房价的变化规律,建立一个可以预测房价变化的模型,对购房者和房产从业者具有重要的实际意义。
本文将通过多元线性回归的方法,对合肥市二手房价进行预测,并分析房价变化的主要影响因素。
一、数据收集为了研究合肥市二手房价的变化规律,我们需要收集相关的数据。
本文采用了开源数据平台Kaggle上的数据集,数据时间跨度为2011年至2020年。
数据集中包括以下字段:- ID: 房源ID- Address: 房源地址- Region: 房源所在区域- Bedrooms: 卧室数量- Bathrooms: 浴室数量- Size(sq ft): 房源面积,单位为平方英尺- Price($): 房价,单位为美元- Latitude: 房源纬度- Longitude: 房源经度- Property Type: 房源类型- Date: 挂牌日期二、数据清洗收集到数据后,需要进行数据清洗,以去除数据中的错误和噪声,保证数据的准确性和可靠性。
本文的数据清洗工作主要包括以下几个方面:1. 数据去重数据中可能存在重复的记录,需要将其去重,以保证模型的正确性。
本文通过比对房源ID来判断记录是否重复,并删除重复记录。
2. 数据类型转换数据中的某些字段类型可能不符合我们的要求,需要进行转换。
比如说,Size(sq ft)字段的单位是平方英尺,为了方便数据处理,我们需要将其换算为平方米。
3. 数据筛选数据中可能存在无用的记录,需要对其进行筛选。
比如说,如果记录中房价的值为零或者负数,那么这个房屋的记录就是无用的。
经过数据清洗,我们得到了一份干净的数据集,可以开始进行建模。
合肥市二手房价多元线性回归预测模型

合肥市二手房价多元线性回归预测模型在当前房地产市场中,二手房市场一直扮演着重要的角色。
而随着经济的不断发展和城市化进程的不断推进,城市二手房的价格也在不断上升。
因此,二手房的价格预测具有重要的实际意义。
本文基于合肥市的房屋市场数据,建立了一个多元线性回归预测模型,以预测二手房价格。
以下是对该模型的详细介绍:一、数据分析在建立多元线性回归模型之前,首先需要对数据进行分析。
我们收集了合肥市12个房地产区域的二手房售价数据,总共有459条记录。
其中,每条记录包含11个特征变量和1个响应变量。
这些特征变量包括:区域、小区名称、房屋户型、所在楼层、建筑面积、朝向、装修情况、建筑类型、年代、产权年限和挂牌价格。
响应变量是二手房实际成交价格。
我们对数据进行了初步的统计分析,得出以下结论:1、该数据集中的房屋建筑面积分布范围较广,最小值为22.0平方米,最大值为1063.0平方米。
房屋产权年限最小值为20年,最大值为70年。
其中,建筑面积和产权年限与房屋价格有一定的相关性。
2、不同区域的房屋价格存在显著差异。
例如,合肥市瑶海区、庐阳区和蜀山区的房屋价格较高,而包河区、经开区和政务区的房屋价格相对较低。
3、房屋的楼层、朝向、装修和建筑类型等因素也会对房屋价格产生一定的影响。
例如,高层和南北朝向的房屋价格相对较高;豪华装修和别墅类型的房屋价格也较高。
基于以上分析,我们选择了建筑面积、产权年限、区域、楼层、朝向、装修和建筑类型等七个特征变量作为模型的输入变量,以这些变量作为自变量,实际成交价格作为因变量建立多元线性回归模型。
二、模型建立1、数据预处理在对数据进行建模之前,需要对特征变量进行处理。
首先,我们对特征变量进行了数值化处理,将区域、楼层、朝向、装修和建筑类型等因素转换为数值型变量。
其中,区域和装修情况采用0/1编码,楼层和朝向采用值域编码,建筑类型采用排序编码。
接下来,我们对数据进行了缺失值处理和异常值处理。
基于层次分析法和回归分析的房价分析与预测模型

题目:基于层次分析法和回归分析的房价分析与预测模型摘要随着我国住房制度的商品化改革,我国住宅产业蓬勃发展,逐渐成为影响国计民生的重要产业之一。
然而近年来国内大中型发达城市的商品住宅价格水平飞速增长,已经呈现出超过人民承受能力和经济发展水平的趋势。
为此,确定这些城市商品住宅价格水平合理性,并探究影响价格的相关因素,提出正确的对策措施成为稳定经济、改善人民生括的首要问题。
【1】为了反映不同因素对房价的影响,我们查阅各种资料利用互联网,收集到2010年5月以来的三个与房价联系紧密的数据,即人口数量、居民人均可支配收入和住房成本。
为了反映全国各类城市房价的情况,我们选取三类城市,即直辖市、沿海开放城市、一般省会城市,并兼顾地理位置分布,选取九个有代表性的城市:北京、上海、重庆、深圳、福州、大连、武汉、成都、西宁。
对于问题一,房价的合理性分析。
我们运用层次分析法。
以人口数量、居民人均可支配收入和住房成本为准则层,以房价的合理、基本合理和不合理为方案层,建立三层层次结构分析模型。
根据不同城市的特点,设置三个影响因素的权值,然后求出组合权向量,根据权向量中相应元素的数值大小,判断该城市房价的合理性。
对于问题二,房价未来走势的预测,我们运用回归分析法,将三个影响因素作为变量。
先分别讨论房价相对于各因素的变化情况,用EXCEL作出房价相对于各因素的变化图,利用移动平均法消除不规则因素的影响,求出房价与各因素的移动平均数,大致确定房价与影响因素之间的变化关系。
然后利用MATLAB软件对房价进行拟合,得出房价的函数表达式,对未来4个月房价的走势进行预测,并利用2011年5月的数据对模型进行检验,发现预测结果与实际结果比较吻合,有一定的通用性。
对于问题三,房价合理的具体措施,以及可能对经济发展产生的影响。
我们根据前两个问题所得的结果,针对不同城市出现的问题,和房价不合理的方面提出几点改善房价合理性的建议,并对房价在经济发展上的影响情况作简要分析。
基于统计回归分析的房价预测模型研究

基于统计回归分析的房价预测模型研究随着房地产市场的快速发展,房价预测成为了一个重要的研究领域。
基于统计回归分析的房价预测模型可以帮助房地产开发商、投资者和政府部门做出合理的决策。
本文将聚焦于基于统计回归分析的房价预测模型研究,分为以下几个方面展开讨论。
首先,我们将探讨统计回归分析在房价预测中的应用。
统计回归分析是一种用来研究两个或多个变量之间关系的统计方法。
在房价预测中,我们可以选择一系列与房价相关的变量作为解释变量,例如房屋面积、地理位置、楼层高度等。
通过回归分析,我们可以建立一个数学模型来描述这些解释变量与房价之间的关系,并用模型来预测未来的房价。
其次,我们将介绍常用的统计回归分析方法。
在房价预测中,常见的回归分析方法包括线性回归、多项式回归和逻辑回归等。
线性回归是最常见的一种回归分析方法,它假设解释变量与房价之间存在线性关系。
多项式回归则可以处理非线性关系,通过引入高次项,将解释变量与房价之间的关系拟合成一个多项式函数。
逻辑回归适用于二分类问题,可以用来预测房屋是否会上涨或下跌。
接着,我们将探讨回归模型的建立和评估。
在建立回归模型时,我们需要选择适当的解释变量,并使用统计方法来估计模型的参数。
常见的估计方法包括最小二乘法、最大似然估计和广义矩估计等。
在评估回归模型时,我们可以使用拟合优度指标(如R方和调整的R方)来评估模型的拟合程度。
此外,还可以使用残差分析来检验模型的假设。
最后,我们将讨论基于统计回归分析的房价预测模型的应用案例和局限性。
基于统计回归分析的房价预测模型已经在实际应用中取得了一定的成果。
例如,一些城市的房地产开发商可以利用这些模型来预测未来的房价走势,从而做出合理的开发计划。
然而,统计回归分析也存在一些局限性。
例如,它要求解释变量与房价之间存在线性或非线性关系,但实际情况可能更加复杂。
此外,模型的可解释性也是一个挑战,我们需要解释模型的结果并将其应用于实践。
综上所述,基于统计回归分析的房价预测模型研究在房地产领域具有重要的应用价值。
合肥市二手房价多元线性回归预测模型

合肥市二手房价多元线性回归预测模型随着经济的快速发展和城市的快速更新迭代,二手房市场已成为一个重要的市场。
二手房的价格变化对于房地产市场、经济发展和社会稳定都具有重要的影响。
因此,了解和预测二手房的价格变化越来越受到关注。
在这篇文章中,我们将提出一个多元线性回归预测模型,来预测合肥市二手房价。
I.数据收集和预处理我们收集了一份合肥市2582个二手房的数据,包括房价、面积、房间数量、楼层数、地理位置(经度和纬度)、建筑年份等属性。
首先,对于缺失值,我们采用平均值填充。
然后,我们将地理位置用经度和纬度来表示,并将数据集中的建筑年份转化为房龄。
最后,我们对数据集进行了标准化处理,使每个属性处于相同的尺度上。
II.特征选择由于我们的数据集中属性较多,我们需要进行特征选择,以避免过拟合和减少计算时间。
我们采用Pearson相关系数来衡量每个属性与房价之间的相关性,并选取相关系数绝对值大于0.2的属性作为我们的特征。
最终我们选取了4个属性作为特征,包括面积、房间数量、楼层数和房龄。
III.多元线性回归模型我们采用多元线性回归模型来预测二手房的价格。
回归模型的公式如下:Y=β0+β1*X1+β2*X2+β3*X3+β4*X4+ε其中,Y表示房价,X1表示面积,X2表示房间数量,X3表示楼层数,X4表示房龄,β表示对应属性的系数,β0表示截距,ε为误差项。
IV.模型训练和评估我们将数据集分为训练集和测试集,其中70%的数据用于训练模型,30%的数据用于测试模型。
我们采用最小二乘法来估计模型参数,即通过最小化误差项平方和来求解β系数。
我们采用R方和均方根误差(RMSE)作为评估模型的指标。
其中,R方衡量的是模型解释数据变异的程度,取值范围在0-1之间,值越大说明模型越好。
RMSE衡量的是模型的预测误差,取值越小说明预测结果越准确。
V.模型预测我们将模型应用于新数据上进行预测。
我们将一组新数据的面积、房间数量、楼层数和房龄输入模型,即可得到预测的房价。
基于回归分析的房价模型及预测

毕业论文题目基于回归分析的房价模型及预测学生姓名王赛学号0809014046所在院(系) 数学与计算机科学学院专业班级数学与应用数学(师范类)专业081班指导教师李晓康论文完成地点陕西理工学院2012年5月27日基于回归分析的房价模型及预测王赛(陕西理工学院数学与计算机科学学院数学与应用数学08级1班,陕西汉中 723000)指导老师:李晓康【摘要】选取全国几个代表性城市,确定影响房价的主要因素,建立房价的数学模型—多元线性回归模型.首先用信息增益法找出影响房价的主要因素,确定模型,利用最小二乘法求解模型中的参数,用回归分析确定模型精度及检验,从而得出一个完整的数学模型;接着利用往年数据建立拟合曲线,预测未来四年影响北京市房价的主要因素及房价走势,并进行定量分析;最后根据模型进行预测,分析模型的优缺点并提出改进方向,并给出抑制房价的建议.【关键词】房价问题;回归模型;拟合曲线;预测;经济发展1 引言房价问题事关国计民生,对国家经济发展和社会稳定有重大影响,一直是各国政府大力关注的问题.我国自从取消福利分房制度以来,随着房价的不断飙升,房价问题已经成为全民关注的焦点议题之一,从国家领导人、地方政府官员,到开发商、专家学者、普通百姓通过各种媒体表达各种观点,但对于房价是否合理、未来房价的走势等关键问题,至今尚未形成统一的认识.房地产行业作为中国经济的支柱产业,它的一举一动都影响着国民经济的发展以及吸引着媒体和大众的目光.近几年来房地产业已经成为一个社会关注度很高、情绪化影响很大、学术研究水平很低、政策手段很矛盾、调控效果很不确定的产业.而这几年,房价问题越来越受到人们的关注.所以,认清当今的房价现状,对我国相关政策法规的制定、企业发展规划以及普通家庭的置业理财等都大有裨益.影响房价的因素有很多,如人口增长率、工薪收入、城乡人均储蓄余额、房屋造价、人均全年住房支出、城镇房地产开发投资等.回归分析是确定变量间相关关系的有效方法.本文拟采用信息增益法确定影响房价的主要因素,采用回归分析法建立模型,对未来房价进行分析和预测.2 基本假设及定义符号说明2.1基本假设假设一所选的城市物价和其他情况相对比较稳定,全局内没有大起大落的现象;假设二未来几年不会发生特大自然灾害、战争动乱以及人为伤害;假设三房屋建造成本用竣工房屋造价来代替;假设四房屋价格通过商品房平均销售价(元/平方米)来表示;假设五房价购买能力用人均储蓄存款、人均可支配收入来表示,银行利率每年保持稳定;假设六忽略消费成本如交通费用、物业费用、停车费用等对房价的影响;假设七供需平衡指:供应量=需求量.2.2定义符号说明: 表示工薪收入(元);: 表示城乡人均储蓄余额(元/人); : 表示造价(元/平方米); : 人均全年住房支出(元); : 竣工面积; : 人口增长率;: 开发商投资;Y : 商品房平均销售价(元/平方米); : 为随机变量; :序列的方差; 分别表示序列的均值; 分别表示,即中心化序列; : 模型参数;: 为残差的平方和;: 统计城市数(样本数); : 年份序号;: 中心化序列的协方差.3 模型的建立下表为我国13个城市商品房平均销售价及其相关因素统计表.依照此表可以求得各因素对商品房平均售价的影响程度,采用信息增益计算法.表 3.1 13个城市商品房平均销售价及其相关因素统计表注:上表数据来源为《中华人民共和国国家统计局—年度数据》. 3.1 信息增益计算法信息增益基于信息论中熵的概念.熵是对事件的属性的不确定性的度量.一个属性的熵越大,它蕴含的不确定信息越大.因此,ID3总是选择具有最高信息增益的属性作为当前结点城市竣工面积(万平方米)人口增长率(‰) 工薪收入(元)城乡人均储蓄余额(元/人)造价(元/平方米) 人均全年住房支出(元) 城镇房地产开发投资(亿元) 房价(元/平方米) 北 京 5225.5 3.50 21105.61 83601.71 2219.07 551.99 2337.7 13799 天 津 2240.1 2.60 14389.10 39781.95 2642.37 450.48 735.2 6886 石家庄 7751.0 6.50 9830.5719263.991851.67 187.24 1520.0 3263 上 海 5719.9 2.70 23172.36 71355.13 2923.56 991.08 1462.1 12840 南 京 43307.5 2.56 13480.72 25994.34 2147.98 512.11 3338.5 4983 杭 州 40239.7 4.63 16701.04 34427.49 2049.83 652.20 2254.3 7826 福 州 7435.1 6.20 14211.49 19516.98 1509.06 469.24 1136.3 5427 武 汉 10280.7 3.48 10331.51 14271.78 1881.15 289.00 1200.4 3532 长 沙 10073.8 6.11 9854.09 12191.34 1667.34 315.10 1084.6 2680 成 都 11393.5 2.72 10132.43 14141.951403.38 314.46 1588.4 3509 昆 明 3771.2 6.08 9641.68 10213.56 1564.40 432.74 737.5 2931 拉 萨 177.5 10.24 13326.40 7805.05 999.54 105.27 15.7 2452 西 安 3128.2 4.00 10775.37 17878.611865.76 243.32 941.6 3223 平 均11595.74.713611.728495.71901.9424.21411.75642.4的测试属性.设S 是s 个数据样本的集合.假定类标号属性具有个不同的值,定义个不同的类i C .设是类i C 中的样本数.对于给定的样本分类所需要的期望信息由下式给出, 其中是任意样本属于i C 的概率,一般可以用来估计.设属性有v 个不同的值.可以用属性将S 划分为v 个自给,其中j S 包含S 中这样一些样本,他们在上具有值.设是子集j S 中类i C 的样本数.根据划分子集的熵由下式给出()()mj j j vj mjj j s s s I ss s s x E 211211,∑=+++-=.上式中ss s s mjj j +++ 21充当第个子集的权,并且等于子集(即值为)中的样本个数除以s 中的样本总数.根据上面给出的期望信息计算公式,对于给定的子集j S ,其期望信息由下式计算,其中是j S 中样本属于类i C 的概率.由期望信息和熵可以得到对应的信息增益.对于在上分支将获得的信息增益可以由下面的公式得到. 3.2 确定主要因素ID3计算每个属性的信息增益,并选取具有最高增益的属性作为测试属性.由上式可以看出,熵值越小时,其信息增益越大,表明相应的信息量越有效.在此采用ID3算法计算出每个属性关于房价的信息增益,而为了测试准确,选取半数以上信息增益较大的属性作为测试属性,即为影响的属性.利用下述公式将原始数据(见表 3.1数据)化为0,1两数值(计算结果见表3.2)n j m i ma a a a ma a a ab mjj j ij mj j j ij ij 2,1;2,1012121==⎪⎪⎩⎪⎪⎨⎧+++<+++≥=这样统计方便计算其影响房价的因子由房价划分时每个因子的熵,进而求出信息增益,判断出影响房价的主要因子.表 3.2城市编号 竣工面积人口增长率 工薪收入 储蓄余额造价 人均每年住房支出开发商投资 房价 1 0 0 1 1 1 1 1 1 2111113 0 1 0 0 0 0 1 04 0 0 1 1 1 1 1 15 1 0 0 0 1 1 1 06 1 0 1 1 1 1 1 17 0 0 0 0 0 0 0 08 0 1 0 0 0 0 0 09 0 0 0 0 0 0 1 010 0 0 0 0 0 0 0 011 0 1 0 0 0 1 0 012 0 1 0 0 0 0 0 013 0 1 1 0 0 1 0 0 最终是根据房价来求其他因子的信息增益,所以统计房价中0,1的样本数为:有4个样本,有9个样本.为了计算各因子的信息增益,先给定房价所需的信息期望接下来计算每个属性的的熵,从竣工面积开始.观察竣工面积的每个样本值的分布,对于竣工面积=1,有1个房价=1,1个房价=0;对于竣工面积=0,有3个房价=1,有8个房价=0(见表 3.3).所以.表 3.3房价=1 房价=0竣工面积=1 1 1竣工面积=0 3 8因此该属性对应的熵为信息增益为同理可得,各个属性等于1或等于0时,房价等于1和房价等于0时的样本数如表3.4所示表 3.4房价=1 房价=0人口增长率=1 0 5人口增长率=0 4 4储蓄余额=1 4 0储蓄余额=0 0 9造价=1 4 1造价=0 0 8年人均住房支出=1 4 3年人均住房支出=0 0 6开发商投资=1 3 3开发商投资=0 1 6同理,计算各个属性的信息增益为由以上数据比较可得因此,选择其半数以上的属性作为预测属性,即影响房价的因子为储蓄余额、工薪收入、造价以及年人均住房支出.3.3 主要因素和商品房平均销售价的关系图利用Matlab程序,依次做出主要因素和商品房平均销售价的关系图图3.1 图3.2图3.3 图3.4 由商品房平均销售价分别与工薪收入、城乡人均储蓄余额、造价、人均全年住房支出的关系图(图3.1-图3.4)可以看出,商品房平均销售价和工薪收入、城乡人均储蓄余额、造价、人均全年住房支出存在相依关系.一般地,当影响结果Y的因素不只是一个时,要通过作图来确定它们的关系是困难的,可以假设它们之间有线性相关关系,即得到回归模型.4 模型的求解模型为上式表示因变量Yˆ对自变量的相依性,其中,,,为未知参数.模型特点如下1、为一般变量,为随机变量;2、Yˆ为一般变量和随机变量的线形组合,Yˆ的值既取决于,又受制于.一般假定为白噪声,假定其服从均值为0,方差为的正态分布,如表 4.1所示表 4.1城市Y北京13799 21105.61 83601.71 2219.07 551.99天津6886 14389.10 39781.95 2642.37 450.48石家庄3263 9830.57 19263.99 1851.67 187.24上海12840 23172.36 71355.13 2923.56 991.08南京4983 13480.72 25994.34 2147.98 512.11杭州7826 16701.04 34427.49 2049.83 652.20福州5427 14211.49 19516.98 1509.06 469.24武汉3532 10331.51 14271.78 1881.15 289.00长沙2680 9854.09 12191.34 1667.34 315.10成都3509 10132.43 14141.95 1403.38 314.46昆明2931 9641.68 10213.56 1564.40 432.74拉萨2452 13326.40 7805.05 999.54 105.27西安3223 10775.37 17878.61 1865.76 243.32 将其中心化后得即t x a x a x a x a Y ε+∆+∆+∆+∆=∆44332211现在对模型的参数进行最小二乘法估计]3[.其中各序列(矩阵)的值见表4.2 表 4.2令=a (,,,),则的最小二乘估计应使残差平方和达到最小,其中称实际值与回归值的差为残差.由于是,,,的一个非负二次型,故其极小值必存在,根据微积分的理论可知,只要求分别对,,,的一阶偏导数0)(=∂∂aa S ,先对求一阶偏导即可得到化简上式可得用表示序列和的协方差,表示序列的协方差,表示序列和的协方差,表示序列和的协方差,表示序列和的协方差,则上式可写成(1)同理,由0)(2=∂∂a a S 推出(2)同理,由推出(3)同理,由推出(4)将(1)、(2)、(3)、(4)写成矩阵相乘的形式北 京 8156.6154 7493.889 55106.03 317.1379 127.8185 天 津 1243.6154 777.3792 11286.27 740.4361 26.30846 石家庄 -2379.385 -3781.15 -9231.7 -50.2633 -236.932 上 海 7197.6154 9560.639 42859.44 1021.631 566.9085 南 京 -659.3846 -131.001 -2501.34 246.0455 87.93846 杭 州 2183.6154 3089.319 5931.806 147.8984 228.0285福 州 -215.3846 599.7692 -8978.7 -392.874 45.06846 武 汉 -2110.385 -3280.21 -14223.9 -20.7817 -135.172 长 沙 -2962.385 -3757.63 -16304.3 -234.587 -109.072 成 都 -2133.385 -3479.29 -14353.7 -498.555 -109.712 昆 明 -2711.385 -3970.04 -18282.1 -337.528 8.568462 拉 萨 -3190.385 -285.321 -20690.6 -902.393 -318.902 西 安 -2419.385 -2836.35 -10617.1 -36.1672 -180.852则求解出参数的公式(5)运用往年的统计数据对模型中各个参数的求解,经计算得各个协方差的值为通过矩阵运算得到,,,的值为将,,,代回原模型得t x x ε+-+--)2.424(0715.3)9.1901(8191.043利用表3.1中的商品房平均销售价、工薪收入、城乡人均储蓄余额、造价、人均全年住房支出反推的值,即得到的13个值为表 4.3 残差数据 城市序号残差 1 56.7861 2 230.5766 3 -57.5374 4 -341.4342 5 -391.7489 6 474.8112 7 402.8636 8 502.5934 9 -281.0530 10 50.5127 11 -196.9233 12-265.306913 -193.8714 平均值-0.74858 根据表4.3做出残差曲线,见图4.1图 4.1因为的平均值为,相对于Y 值来说非常小,可以把近似看成是,予以忽略不计. 则模型变为4.5642)2.424(0715.3)9.1901(8191.043+-+--x x 上述模型从理论上来说可以由一个城市的工薪收入、城乡人均储蓄余额、造价、人均全年住房支出等方面的信息来推求这个城市的商品房平均销售价.利用表3.1中的各个城市的工薪收入、城乡人均储蓄余额、造价、人均全年住房支出,来反推各个城市的商品房平均销售价,并和已知的商品房平均销售价作对比,来评价该模型的实用性.模型计算值.将上式右侧参数及矩阵数据带入可得模型计算值Yˆ,结果见表 4.4 表 4.4 实际值均衡价格与计算值均衡价格对比分析根据表4.4做出实际值均衡价格与计算值均衡价格对比,见图4.2城市 实际商品房平均销售价 计算商品房平均销售价 误差百分比 1 13799 13731 0.49% 2 6886 6655 3.35% 3 3263 3321 -1.78% 4 12840 13181 -2.66% 5 4983 5375 -7.87% 6 7826 7351 6.07% 7 5427 5024 7.43% 8 3532 3029 14.24% 9 2680 2961 -10.49% 10 3509 3458 1.45% 11 2931 3128 -6.72% 12 2452 2717 -10.81% 1332233417 -6.02%图 4.2由以上回归分析数据与实际数据对比可以看出,此模型基本上能满足精度要求,但还是存在许多不足之处,如实际数据不足,忽略了一些相关因素,而且在以上讨论的不同因素之间还存在共线性问题等,所以模型有待进一步改进优化.5 模型应用5.1 影响房价的各个变量的预测选取北京为例,收集了北京从2005年到2011年与房价最相关的四个因素,见表5.1.然后对四个因素分别做出其与年份的拟合曲线,其中用1代替起始年份2005年,2代替2006年,……,7代替2011年;再通过所求出的拟合曲线,对四个因素未来四年走势进行定量分析.表5.1年份工薪收入(元) 城乡人均储蓄余额(元/人)造价(元/平方米)人均全年住房支出(元)2005 10152.14 36356.46 1780.60 489.502006 11590.45 41007.03 1801.84 501.232007 13666.34 48619.64 2153.40 456.302008 16284.17 55064.01 2392.99 575.682009 17318.72 56064.54 2175.57 605.892010 18738.96 86561.06 2374.10 552.312011 21105.61 83601.71 2219.07 551.995.1.1 工薪收入与年份拟合曲线参照表 5.1的数据,运用MATLAB建立拟合曲线.通过实验发现,采用一次多项式逼近最为合理.工薪收入与年份拟合曲线(见图5.1)图 5.1下面运用拟合曲线,预测未来四年工薪收入,见下表表 5.2年份序号9 10 11 12年份2012 2013 2014 2015 工薪收入(元) 24624 26438 28253 300685.1.2 城乡人均储蓄余额与年份拟合曲线运用MATLAB建立拟合曲线.通过实验发现,采用二次多项式进行逼近最为合理.城乡人均储蓄余额与年份拟合曲线(见图 5.2)图 5.2下面运用拟合曲线, 预测未来四年城乡人均储蓄余额,见下表表 5.3年份序号9 10 11 12 年份2012 2013 2014 2015 城乡人均储蓄余额117495 134660 153385 173670 5.1.3 造价与年份拟合曲线运用MATLAB建立拟合曲线.通过实验发现,采用二次多项式进行逼近最为合理.造价与年份拟合曲线(见图5.3)图 5.3下面运用拟合曲线, 预测未来四年住房造价,见下表表 5.4年份序号9 10 11 12 年份2012 2013 2014 2015 住房造价1929.8 1682.8 1374.8 1005.8 5.1.4 住房支出与年份拟合曲线运用MATLAB建立拟合曲线.通过实验发现,采用二次多项式进行逼近最为合理.住房支出与年份拟合曲线(见图 5.4)图 5.4下面运用拟合曲线, 预测未来四年住房支出,见下表表 5.5年份序号9 10 11 12 年份2012 2013 2014 2015 住房支出541.2464 520.0259 492.095 457.4537 5.2 房价预测运用模型其中, ,的数据参见表 5.6表 5.6年份工薪收入(元)城乡人均储蓄余额(元/人)住房造价(元)住房支出(元)2012 24624 117495 1929.8 541.24642013 26438 134660 1682.8 520.02592014 28253 153385 1374.8 492.0952015 30068 173670 1005.8 457.4537 代入数据求解得到2012年—2015年的房价,见表 5.7表 5.7年份预测房价(元)2012 186982013 212512014 240342015 27045参照2005年—2011年的实际房价与2012—2015年的预测房价数据,运用MATLAB建立拟合曲线.通过实验发现,采用二次多项式进行逼近最为合理.房价与年份拟合曲线,见图5.5图 5.5从预测的结果可以看出,房价的发展依然处于较强的增长状态,没有减弱的趋势.针对房价增长的趋势,北京市政府应积极响应国家的宏观调控,实施国家的各项政策,坚决打击各种投机,抑制房价增长过快的问题.6 模型的优化与政策建议6.1模型的优化本模型采用统计规律建立起了表示房价的多元线形回归模型.模型基于信息增益法判定影响房价的主要因素.模型建立之后进行了修正,得到的结果比较符合实际.方案简洁明了,易于操作.并且建立过程中运用了数据拟合法进行评估及预测,使结果精度更高.该模型仍然存在着很多问题,比如影响房地产价格的因素有很多,而在建立模型时忽略掉了一些被认为不是很重要的因素.除了模型中考虑到的影响房屋价格的因素之外,还有一系列其他因素的影响:(1)房屋的结构、质量、功能、新旧程度是影响房屋价格的重要因素.其次房屋的层数、层次和朝向不同,也会造成一定的价格差异.(2)环境因素.房屋所处位置是在城区还是在郊区,交通便利的繁华地段还是背街小巷,交通、文化教育和社区服务都对房价产生很大的影响.(3)国家政策.房价受政策因素的影响很大,在某种情况下,政策因素往往成为房屋价格的决定因素.例如:加快工租房的建设,抑制投机需求,全面叫停第三套住房公积金贷款等.以上几个因素对房价都有一定的影响,但由于时间仓促和能力有限,不能对诸多因素进行一一考虑,仅考虑了影响比较大的因素.由此采用的是“把握主要矛盾,忽略次要矛盾”的方法,因此该模型仍然具有一种普遍性和代表性,在此基础上在考虑其他因素时,此方法仍然是适用的.其次,确定模型参数的样本序列仅有13组数据,在应用统计规律中,因为统计规律本来只是适用于一些大样本甚至是无穷大序列,如果在样本很小的情况下应用,结果误差可能会很大.而在提出该模型时也确实参考很多的数据,才将之间的个各因素确定为线性的.在计算时为了节省时间又能够说明问题,所以只选用了几组数据.针对模型中存在的问题,提出如下改进建议:(1)本模型选取了13个代表性城市的数据进行分析,如果对更多的城市的统计数据(样本)进行模型运算,可以使精度更高.(2)本模型建立过程中忽略了众多因素对房价的影响,如考虑建成面积、流动人口、国家调控等因素等,应综合考虑各方面因素,以减小误差.(3)本模型建立过程中考虑各个因素与房价呈线性关系,但实际上线性不一定是最好的选择,还可以考虑2次、多次等回归关系,所建立的模型会误差更小.6.2抑制房价的政策建议要解决目前房价过高的问题,应从开发成本和供求关系两方面综合考虑.要把高的开发成本降下来,同时适当扩大开发量,调整供给结构,增加有效供给,培养和释放有效需求.影响商品房开发经营成本的主体主体有两个,一个是政府,一个是企业自身.两者必须同时努力才能达到降低成本的目的.由模型分析可知,房屋成本主要由土地开发费用、生产资料消耗和人工费用三部分组成.土地开发费用可以通过政府的宏观调空加以控制,进行最优化规划和预算将其达到最低.在生产资料方面,建筑材料的价格是一个很重要的因素,尤其是对钢材、混凝土等材料的价格进行有效的控制,使建筑材料的价格控制在一定范围之内;在人工费用方面,要提高一切相关人员的工作效率,实施严格的管理制度,以减少不必要的人力财力资源的浪费.仅采取降低成本的单向措施达不到降低住房价格的目的,因为房价总的来看是由供求决定的.在调整供求结构方面,需要政府和企业共同努力,政府实现宏观调控,改善人民生活水平;企业面对激烈竞争,必须要立足长远,居安思危.当务之急是从需求引导和宏观控制两方面入手,采取措施消除非正常因素.政府在政策引导上应采取措施,调整和引导供给与需求,缓解需求的压力;实行租售并举,缓解市场压力.如果以上建议都可以实现的话,成本就可以避免增加甚至可以降低,通过对供求关系调整,由其引起的价格上涨也可以得到控制,这样就可以有效的控制房地产价格的上扬.参考文献[1]《中华人民共和国国家统计局—年度数据》,/tjsj/ndsj/,2011.5[2] 毛国君等编著.数据挖掘原理与算法(第二版)[M].北京:清华大学出版社,2007.123.[3] 魏宗舒等编著.概率论与数理统计[M].北京:高等教育出版社,2008.4.[4] 徐萃薇,孙绳武编著.计算方法引论[M].北京:高等教育出版社,2007.4.47-52,54-58.[5] 徐滇庆.房价与泡沫经济[M].北京:机械工业出版社,2006.8.33,181-198,369-371.[6] 金勇进主编.数字中国[M].北京:人民出版社,2008.11.299.[7] 郝益东.中国住房观察与国际比较(第二版)[ M].北京:中国建筑工业出版社,2010.24,60,125-134.[8] 赵媛媛.河北省商品住宅价格影响因素分析[J].河北农业大学,2008.[9] Poterba J.M. House Price Dynamics:The Role of Tax Policy and Demograpy [J].Brookings Papers on Ecomomic Activity,1991,143-148.[10] Peter Fortura,Joseph Kushner.Canadian lnter-City House Price Differentials [J].ARELTEAJournal,2006,213-216.Model of House Price Based on Regression Analysisand PredictionWang Sai(Grade 08,Class 1, Major Mathematics and applied mathematics, Mathematics and Computer Science Dept., Shaanxi University of Technology, Hanzhong 723000, Shaanxi)Tutor: Li XiaokangAbstract:Collect several representative national cities and the main factors which affects house price, build a mathematical model of house price--multiple linear regression model. Firstly, use the information gain method to find out the main factors of influencing house price, to determine the model, using the least square method to determine the parameters of the model, with regression analysis to identify the model precision and inspection, so as to get a full mathematical model. Then, use the datas to set up the fitted curve, predict the future four years which influences Beijing house price most and the housing price movements, and make quantitative analysis; lastly, according to the model and suggestions make reasonable forecast, analyzes the advantages and disadvantages of model and puts forward improving directions, and give suggestions of preventing house price’s increasing.Key words:House price problem; Regression model; Fitting curve; Predictions; Economic development参考:毕业论文(设计)工作记录及成绩评定册题目:学生姓名:学号:专业:班级:指导教师:职称:助理指导教师:职称:年月日实验中心制使用说明一、此册中各项内容为对学生毕业论文(设计)的工作和成绩评定记录,请各环节记录人用黑色或蓝色钢笔(签字笔)认真填写(建议填写前先写出相应草稿,以避免填错),并妥善保存。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
题目:基于层次分析法和回归分析的房价分析与预测模型摘要随着我国住房制度的商品化改革,我国住宅产业蓬勃发展,逐渐成为影响国计民生的重要产业之一。
然而近年来国内大中型发达城市的商品住宅价格水平飞速增长,已经呈现出超过人民承受能力和经济发展水平的趋势。
为此,确定这些城市商品住宅价格水平合理性,并探究影响价格的相关因素,提出正确的对策措施成为稳定经济、改善人民生括的首要问题。
【1】为了反映不同因素对房价的影响,我们查阅各种资料利用互联网,收集到2010年5月以来的三个与房价联系紧密的数据,即人口数量、居民人均可支配收入和住房成本。
为了反映全国各类城市房价的情况,我们选取三类城市,即直辖市、沿海开放城市、一般省会城市,并兼顾地理位置分布,选取九个有代表性的城市:北京、上海、重庆、深圳、福州、大连、武汉、成都、西宁。
对于问题一,房价的合理性分析。
我们运用层次分析法。
以人口数量、居民人均可支配收入和住房成本为准则层,以房价的合理、基本合理和不合理为方案层,建立三层层次结构分析模型。
根据不同城市的特点,设置三个影响因素的权值,然后求出组合权向量,根据权向量中相应元素的数值大小,判断该城市房价的合理性。
对于问题二,房价未来走势的预测,我们运用回归分析法,将三个影响因素作为变量。
先分别讨论房价相对于各因素的变化情况,用EXCEL作出房价相对于各因素的变化图,利用移动平均法消除不规则因素的影响,求出房价与各因素的移动平均数,大致确定房价与影响因素之间的变化关系。
然后利用MATLAB软件对房价进行拟合,得出房价的函数表达式,对未来4个月房价的走势进行预测,并利用2011年5月的数据对模型进行检验,发现预测结果与实际结果比较吻合,有一定的通用性。
对于问题三,房价合理的具体措施,以及可能对经济发展产生的影响。
我们根据前两个问题所得的结果,针对不同城市出现的问题,和房价不合理的方面提出几点改善房价合理性的建议,并对房价在经济发展上的影响情况作简要分析。
关键词:层次分析法房价合理性移动平均法层次分析法房价预测一.问题重述房价问题事关国计民生,对国家经济发展和社会稳定有重大影响,一直是各国政府大力关注的问题。
我国自从取消福利分房制度以来,随着房价的不断飙升,房价问题已经成为全民关注的焦点议题之一,从国家领导人、地方政府官员,到开发商、专家学者、普通百姓通过各种媒体表达各种观点,但对于房价是否合理、未来房价的走势等关键问题,至今尚未形成统一的认识。
请根据中国国情,收集建筑成本、居民收入等与房价密切相关的数据,选取我国具有代表性的几类城市对房价的合理性及房价的未来走势等问题进行定量分析;根据分析结果,进一步探讨使得房价合理的具体措施,以及可能对经济发展产生的影响,并进行定量分析。
二.问题分析对题目进行分析,我们发现可以将问题分为三个,即房价的合理性分析为综合评价类问题,房价的未来走势分析为预测类问题,而房价合理的措施及对经济发展的影响是跟据前两个问题的结果综合分析得出结论。
首先,对于问题一:房价的合理性分析,由于2010年4月北京出台了“限购令”,全国各大城市纷纷效仿,这一政策对房价影响较大,因此我们收集了从2010年5月开始四个与房价联系紧密的数据,即住房成本、居民人均可支配收入、人口数量和通货膨胀率,考虑到住房成本内容繁杂,找不到十分合适的数据,为简化处理在这里用土地价格代替住房成本。
然后按城市类型,选取三类城市:直辖市、沿海开放城市、一般省会城市,并兼顾地理位置分布,选取九个有代表性的城市:北京、上海、重庆、深圳、福州、大连、武汉、成都、西宁。
然后运用层次分析法,结合收集的数据将每个城市的房价评价为合理、基本合理、不合理。
其次,对于问题二:房价未来走势的预测,属于预测类问题,我们运用回归分析法,将三个影响因素作为变量。
先分别讨论房价相对于各因素的变化情况,用EXCEL作出房价相对于各因素的变化图,利用移动平均法消除不规则因素的影响,求出房价与各因素的移动平均数,大致确定房价与影响因素之间的变化关系。
然后利用MATLAB软件对房价进行拟合,得出房价的函数表达式,对未来4个月房价的走势进行预测,并利用2011年5月的数据对模型进行检验,发现预测结果与实际结果比较吻合,有一定的通用性。
最后,对于问题三:房价合理的具体措施,以及可能对经济发展产生的影响。
我们根据前两个问题所得的结果,针对不同城市出现的问题,和房价不合理的方面提出几点改善房价合理性的建议,并对房价在经济发展上的影响情况作简要分析。
三.模型假设1.所收集到的大部分数据真实可靠。
2.国内外经济发展稳定,短期内通货膨胀没有明显变化,即通货膨胀率不变。
3.短期内城市居民生活状态趋于稳定,没有重大的自然灾害、战争和社会动乱等不稳定因素的影响。
4.今年各月供求关系、经济形势、政府政策等宏观因素与往年相应月份相同保持稳定。
5.在影响房价的因素中,各因素如住房成本和居民生活水平相互独立。
四.符号说明五.模型的建立与求解5.1数据的整合:确定了所需要的数据后,我们查询了国家统计局网站【2】、搜房网【3】、中国城市地价网【4】、各城市政府网站等官方网站,收集了大量真实可靠的数据。
由于数据种类较多,且数据量较大,不易于分析处理,我们将数据整合,并导入EXCEL表格中,制成各城市月房价表、月居民人均可支配收入表、月土地价格表(见附录一),然后作出各城市地价与房价,居民人均可支配收入与房价的关系曲线。
为了消除政策调整,房产炒作,自然灾害等偶然因素的影响,而体现出价格变化趋势,运用移动平均法,重新制成各城市月房价移动平均值表、月居民人均可支配收入移动平均值表、月土地价格移动平均值表(见附录),然后分别作出地价移动平均值与房价移动平均值,居民人均可支配收入移动平均值与房价移动平均值的关系曲线。
5.2层次分析法(解决问题一:房价的合理性分析)5.2.1模型分析与建立要分析各城市房价是否合理,就需要对各城市房价的合理性进行评价,因此我们运用层次分析法。
【5】对于准则层的确定,通过查阅相关资料,我们了解到,房价的影响因素有人口数量、居民人均可支配收入、通胀水平、住房成本等,由于假设通胀水平在短期内不发生变化,所以以人口数量、居民人均可支配收入和住房成本为准则层,以房价的合理、基本合理和不合理为方案层,建立层次结构分析模型,模型结构如图5.2.1所示:图5.2.15.2.2模型求解利用层次分析法分析某个城市房价是否合理,首先要根据所收集到的数据,分析各影响因素对房价影响程度的大小;然后,根据分析的结果,设定各个影响因素的权值;最后,通过计算得到组合权向量。
根据组合权向量中对应的值来评价该城市的房价是否合理。
由于我们选取了九个城市,计算过程繁复芜杂,计算量大,此处以武汉市为例,对模型求解过程表述如下:房价的确定,主要应该考虑当地城镇居民的可支配收入水平,收入水平高房地产商自然会将房价抬高,因此把居民人均可支配收入的权重设为最大;而住房成本直接关系到房屋的售价,但是住房的成本包括很多方面,如土地,建材,人工,管理等,为了分析方便,这里做一下简化处理,用土地价格代替住房成本,通过对大量数据分析同时查阅了相关资料后,我们发现土地价格对房价有一定的影响,但影响不及居民人均可支配收入的大;人口决定了住房需求,因此人口多少也会在一定程度上影响房价,但是一个城市的人口在短时间内变化并不明显,而且买房人一般是有一定经济基础的,这些人在城市人口中只占有少数比例。
以武汉市为例,准则层B 的三个因素(B 1,B 2,B 3)的两两判断矩阵设定如表5.2.2.1所示。
1.成对比较矩阵A 的计算:从而得到其相对应的成对比较矩阵如下所示:⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=131331515111A通过MATLAB 软件求得矩阵A 的最大特征值0385.3max =λ,该最大特征值对应的特征向量为:U=(0.1506 0.9161 0.3715)T然后将其单位化后得到权向量:U=(0.1047 0.6370 0.2583)T2.对矩阵A 进行一致性检验: (1)矩阵一致性指标I C .的计算: 1.1max 1--=n nI C λ 公式1代入n=3,0385.31max =λ 求得 013.0.1=I C (2)矩阵一致比较率1.R C 计算: 查找n=3的平均一致性指标52.0.1=I R IR IC R C ...=公式2 得1.0025.0.1<=R C 可以判断矩阵A 满足一致性。
3.构造C B -层对比矩阵:⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=13/27/42/315/64/76/5111B ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=17/32/13/713/424/3112B ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=17/33/23/712/32/33/2113B通过计算C B -层两两判断矩阵的特征值、特征向量、一致性指标及一致性比较率,得出层次分析法的参数表如表5.2.2.2所示。
表5.2.2.2如表5.2.2.2所示,一致性比率均小于0.1,则矩阵均满足一致性条件。
总排序: []U B B B w 3217= 公式3求得[]Tw 1972.04552.03476.07=对于其他八个城市,我们根据收集到的数据和各个城市的具体情况,对各城市的特点分析如下:对于北京和上海市,考虑到其人口较多,且地理位置优越,人均收入水平较高;对于重庆市,虽然人口较多,但经济发展水平远不及北京和上海,且处于西南内陆,属丘陵地貌,地理条件较差,受炒作因素的影响较小;对于深圳、福州和大连这类沿海开放城市,其经济发达,气候条件优越,适宜居住,因此地价较高;对于武汉、成都和西宁这类处于中西部的普通省会城市,正处于稳定发展中,经济相对落后,人口较多,住房成本相对稳定,因此其房价主要受人口和居民人均可支配收入的影响较大。
同理可求得其它城市的总排序1w (北京)、2w (上海)、3w (重庆)、4w (深圳)、5w (福州)、6w (大连)、8w (成都)、9w (西宁)分别为:[]Tw 3871.04051.02078.01= []Tw 3974.04162.01864.02=[]Tw 1732.04812.03356.03= []Tw 2061.04757.03182.04=[]T w 1374.04553.04073.05= []Tw 1395.04253.04052.06= []T w 1368.04255.04377.08= []Tw 1751.04034.04215.09=5.3回归分析法(解决问题二:房价的未来走势分析)5.3.1模型分析与建立对于房价未来走势的分析,属于预测问题。
我们收集到了与房价有关的数据,这些数据与房价之间存在着一定的数学关系,利用回归分析法对数据进行拟合,求得房价关于各影响的函数表达式,就能利用此表达式对房价的未来走势作出预测。