数据挖掘技术在房地产预警系统中的应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
济 中与房地 产相关性较 强的经济统计 指标 的数 据仓库入手 ,
中最为重要的一层, 对应于一个或 多个 用户界面, 是整个系统的
资源层 由几个 相关信息数 据仓库 、 房地产 市场信 充 分利用房地产预警理论和方法的研究成果, 建立各种预测 、 预 价值的体现 ; 息知识库和模型库组成, 一般存放于服务器上。表示层主要是 警模型 , 引入基于粗糙集 数据 预处 理的支持向量机预警模型 并
基于 数据仓库 的房地产 预警 系统 以数据仓库技术 为核心 ,
以联机 分析技术和数据 挖掘技术 为基 础 , 原始 数据系统 开发 把
房地 的主要 内容是 : 汇集和整理 成不同的数据库群体 , 过合理 、 通 全 求不 断走高及 商品房综合 品质提升等 因素影响下, 产市场 呈现 出了房 价开始 逐渐走高 , 商品房投资 额增幅加 大 , 内部结 面 的数据管 理 , 利用粗 糙集对 选定 的指标进 行数据 预处理 再 和指标 约简 , 最终 用户可对 获得数 据作直 接处理 , 使 用以进行 构不平衡等发展偏热 的迹象 。
(c olo te ai n o p trS i c,Nn xa U we i ,Ynh a ,Ni xa 7 02 ,C ia Sho fMahm tsa d C m ue c ne ig i n  ̄t ic u n n i 50 1 hn ) c e y g
Ab ta t We n lz v rol r a e tt a piain , a d nt du e aa sr c : a ay e aii s e l sae p l to s n i r c d t miig e h ol y no h d sg o e l sae al c o nn tc n og it te ein f ra e tt e ry wann yse ;c mbiig d t wae o s n e iin u p r y tm, etbih t e al wanig r ig s tm o nn aa rh u e a d d cso s p ot s se sa l e r s h y r n mo e b sd n u p  ̄ v co d l a e o s p o e tr ma hn aa p ep o e sn wi ru h es s 3 wann l t o to pi cp e t d tr n e c tt rn e n d iie h m c ie d t r・ rc sig t o g st,u e o h r ig i c nr l rn il o eemie a h sae a g a dvd te mi it dfee t aam lv l,a d p t o wad a o no i r n lr e es n u fr r c mplt slto r ra ett m ak t al wanig s se ee ou in f a e l s e o a r e ery r n y tm; f l ,a c r ig o i l na y c odn t te cu l i  ̄in i n h a ct,b l e idc tr s se o n h a iy ra ett e l ri g yse . h a ta st o n Yic u n i u y ui t n iao y tm fYic u n ct l sae a y wan n s tm dh e r
Ke r s: r a e t t d t n n y wo d e l s e; aa mi i g; r u h s t t o y; s p o t ve t r m a h n a o g e he r u p r c o c i e
的, 组成模型库管理 系统 。同时 , 结合银川市 的实 际情况 , 采集 银川市不 同时期的历史数据 , 存贮 非量化预警信 息和相关 建立 近几 年来, 计算机技 术的飞速发 展, 为房地 产预警 与计算 并运 机 技术 的结 合提供 了前 所未有 的发展机遇 和技术支持 。数据 知识的辅助信息 库作为补充 , 用 3 警界控制原理 对各状 态 的区间进行确定 , 出不 同的警度。最 后根据警限值将预 划分 仓库 、 数据挖掘技术 以其强 大的决 策支持 功能和 良好的发展前 景而受到越来越多的关注 。进入 2 世纪 , 我国经济体制改 测值转化为 警度并进 行预报 。用户可交互地 为预警 系统 的定 l 随着 革 和商 品经济 的发 展, 地产业 正在迅速 崛起 。为 了全 面 、 房 及 量分析补充定性分析的信息 。
定量分析 , 而预报警度则是预警 的 目标 。
图 l 系统总体设计
22 数 据仓 库 整 体 设 计 _
图2 房地产预警的一般流程
3 银 川 市房 地产 预警 实证 分析
伴随着西部大开发政策 的逐步实施, 银川作为最适宜居住
的城 市之一, 市环境 、 在城 市政配 套的不断 完善 、 房地 产市 场需
Ap l a i n o a a mi i g t c n l g n r a sa e e ry wa n n y t m p i to f d t n n e h o o y i e l e t t a l r i g s s e c
Wa g F i n e ,W a g Xu m i g n e n ,W a g Xi y n ni
为 了建立 一个质 量过关 的数据 仓库需 要做好 以下几 个工 间为正常 区间 。 ()粗糙集理论与 支持 向量机模型 。粗糙集理论是 由波兰 2 作 。( 数据仓 库设 计 。主要 任务是 数据 仓库环 境的定义 和设 1 )
. l a 92 置 ; ) 据抽取 。从外部 数据 源定期提 取数据 并变换 数据 , (数 2 对 科学家 ZPw ̄ 自18 年研究信 息系统逻辑特 性时发展起来 的理论 。粗集理 论是一种处理模糊 与不 确定知识的数学算法 , 所 获得 的源数据进 行一些必要 的加工 处理, 其符合数据 仓库 使 不一致和 不完整 的信 息 。 中数据 库可 以有组 织和存储 管理 的数据格 式和语 义规范 。( 它能有效 地分析 和处理 各种不精 确 、 3 ) 并从 中发现 隐含的知识 , 揭示 潜在的规律 VM算法 的实质 。S 数 据管理 。数据 的维护和分 配, 数据处理 和应用 。各种数 支持 因 据 的存 储分发 及分 布到多个 不 同的数据库服 务器 。数据 的转 是采用智能算 法求 解一个具有线性 约束 的二次 凸规划问题 ,
所示 。整个 系统 从硬件 的角度来看, 应用程 序 由客 每个 数 据预处理和指标约简 , 终确定影响房地产行业发展 的重要 如图 l 最 户端和服 务器通过 因特 网或局域 网连接来实现 其功能 。从软 指标并 建立房地产预警指标体系 。分布式系统 、 数据仓库技术 件设计的角度看 , 整个系统采用分 布式 的表示层 、 功能层 、 资源 和数据挖掘技术 的发展给 以上问题 的解决带来 了新 的契机 。 3 功能 层是整个 应用程序 我 们从建立 房地产经济的各类经济统计指标 , 以及宏观经 层的三层结 构 。表示 层位于客 户端 ;
收稿 日期 :0 卜1一 O 21 O2
作者 简介: 王飞(9 2 ) 男, 18 一 , 河北邢 台人 , 主要研究方向: 数据库 技术与知识工程 。
计算机 时代 2 1 年 第 1 02 期
・2 5・
及时 响应用 户发来 的请求 , 每个用 户请求 的权 限, 将所 警系统运 行流程 的实施步 骤大致可 归纳为 : ) 房地产预 验证 , 并 (确定 1 请求的最终数据返传给客 户端 。 警监测的对象 ; ) (寻找警情产生 的根源 ; ) 警兆指标 ; ) 2 (选定 3 (确 4 定警限 ; ) ( 核算综合预警指数 ; ) 5 (划分警级 ; ) 6 (预报警度 。其 中 7 明确警情是预警的前提 , 也是房地产预警研究的基础; 寻找警 源, 分析警 兆 , 确定警 限是对 引起 警情 的各类因素作 出定性和
・
2 ・ 4
Co utr Er o 1 01 mp e a N . 2 2
数 据挖掘 技术在房 地产 预警 系统 中的应用
王 飞 ,王学 明 。王新 一
( 宁夏大学数 学计算机学院, 宁夏 银川 702) 50 1
摘 要 :分析 了各种房地产应 用软件 , 将数据挖掘技 术 引入房地 产预 警 系统设计 中; 结合数据 仓库和决策 支持 系统 , 建 立 了基 于粗糙 集数据预处理的 支持 向量机预 警模 型 , 用3 警ห้องสมุดไป่ตู้控 制原理 确定各状态 区间, 运 a 划分 出不 同的警度 , 并提 出
了房地产市场预 警预报 系统的完整解决方案 ; 最后 , 结合银 川市的实际情 况, 构建 了银 川市房地产预警 系统指标体 系。
关键词 :房地产 ;数据挖掘 ;粗糙集理论 ;支持向量机 中图分 类号 :P 9 T 32 文献标志码 : A 文章编号 :0 6 8 2 ( 0 2 0 — 4 0 1 0 — 2 8 2 1 )1 2 — 3
房地产预 警系统 简单地说 , , 就是能够事先发出房地产警 告信号的系统。房地产预警预报在本质上是以管理信息系统 为基础 , 兼有决 策支持系统 功能的计算机 预警预报信 息系统 。 房地产预警系统是构建在分布式系统构建之上 , 随着数据的挖
1研 究 思路
其数据的传递都是 由系统的多方 本 文先采用 定性与定 量相结 合的分析方 法选取两 个在房 掘和时间变化而调整信息的 , 用户即各房地产相关部门 、 策者等交互完成。系统总体结构 决 地产行 业最 具代表性的指标 , 利用粗糙集对选定的指标进行 再
. 数据分 析 。预警预 报所需 数据要 能反映 基本数 据所体现 的整 31 方 法 论 ( 评价无非就是 对指标 运行处于正常 、 1 ) 基本正常 、 异常等 体 趋 向或随时间变化而 表现 出来 的变化 趋势 , 因此必须对基本
数据进行 分类 、 取 、 析 归纳 、 等处理才能得到 这些数据 。这 何种 状态 等作 出判 断 。这种 判断应 该基于成熟 的定量分 析工 加工 些数据 构成数 据仓 库的数 据源 , 建立提取 器 , 通过 将来 自数据 具 同经验分析 的结 合 。本文 用警界控 制原理对 各状态 的区间 采用两倍标 准差作为房地产预警 系统指标 是否异常 源的 、 影响数据仓 库的数据定期 的转 化为数据仓 库模 式 。当数 进行确定 , ( 热或过冷 ) 过 的依据 。同时 , 选择偏离均值一倍到两倍 的区间 据源 中数据发 生变化时 , 集成对数据 进行过滤 、 转化和综 合 , 并 作为预警指标 偏热 与偏冷 区间 , 在均值正负一倍标准 差内的区 和其他数据合并 , 把新的数据集成到数据仓库 中。
O 引言
时、 准确地掌握房地产市场运行状况 , 加强对房地产市场 的监测 2房地产预警预报系统设计 和 调控, 免房地产 市场非常 态波动 的出现, 避 必须尽快 建立房
21系统 总体设计 .
地产 预警系统 , 现对房地 产市场 的预 警和对房地 产投资 、 实 消 费 的 引导 , 为政府制 定房地 产政策 , 保证房地 产经济健 康 、 持 续、 稳定的发展 提供 重要 的手段和决策依据 。