软件工程 数据挖掘 硕士学位论文开题报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
攻读硕士学位研究生
硕士学位论文开题报告
题目:电子化加油数据仓库的建立及其数据挖掘的研究
姓名:
学号:
院系:软件学院
专业:软件工程
研究方向:数据挖掘
指导教师:
一、开题报告情况
报告要求:须就论文选题意义、文献资料掌握情况、论文研究方法、论文总体设计等方面进行详细的公开及书面报告,提请指导小组予以审查
开题报告审查记录
论文题目:电子化加油数据仓库的建立及其数据挖掘的研究
时间:地点:
(一)论文选题意义及创新点
油是汽车源动力,加油站则是车开启的一把钥匙,目前较多加油站还
是现金方式交易,随着电脑信息化在各行各业的不断推进,加油站也开始采用
电子化的付款方式。大量的消费数据开始向数据中心进行集中,现行系统只是
简单记录汽车加油消费的情况,并通过银行集中进行代发代扣,大量的消费数
据只是做为简单报表的数据源,其中真正的价值并未体现。数据仓库和数据挖
掘作为决策支持新技术在近些年来得到了迅速的发展。本课题主要是为满足对
加油消费过程中的数据分析决策需要,通过对消费的油量油费油种类的历史数
据抽取、转换、装载到数据仓库,从时间、油类、消费单位、加油商户多个维
度进行数据立方体的建立,通过切片、切块、钻取和旋转的方法来对数据进行
分析。对于数据仓库中的消费信息,采用数据挖掘的聚类方法,分析其分布规
律,可以找出异常的数据并对其复查,分析其中的问题。对不同商户的消费记
录进行数据挖掘,分析出是否应该在附件新建加油站来缓解加油滞泻,同时可
以缓解交通路况,另外可以分析出某些零星加油次数加油站存在的不必要性,
建议拆除。分析不同种类油的消费情况,帮助宏观油量调度供应。
(二)国内、外相关文献掌握程度和研究方法的可靠性
[1] 林宇. 数据仓库原理与实践. 人民邮电出版社,2003
[2] W.HInmon. 数据仓库(原书第三版). 王志海,林友芳等译. 机械工业出
版社,2003
[3] 赵晓东. 数据挖掘技术在石化企业加油IC卡CRM中的应用研究. 硕士学
位论文,2009
[4] Bud Endress. Implementing the OLAP Option to the Oracle9i Database. Oracle Corporation,2002
[5] Paulraj Ponniah. Data Warehousing Fundamentals. Wiley Publishing,Inc,2004.
[6] S.chaudhuri, U.Dayal. An Overview of Data Warehousing and OLAP Technology. ACM SSGMOD Record,1997,26(1)
[7] 魏云巍,裴军杰,申红茹. 加油站库存信息化建设的思考. 物流科技,2007
[8] Pang-Ning Tan, Michael Steinbach, Vipin Kumar. 数据挖掘导论. 范明范宏
建等译. 人民邮电出版社,2006
数据仓库和数据挖掘现有的研究资料十分丰富,但收集整理适用于本论文研究
方向的文献还需要一段时间。通过对现有业务数据建立数据仓库和数据挖掘的
成功案例很多,有充足的案例供参考。
1
(三)论文总体设计的科学性
论文计划设计成以下框架:
1)引言,包括本文的研究背景,数据仓库和数据挖掘技术的国内外研究动态,课题的主要研究内容。
2)基本理论概述,介绍与本文研究相关的数据仓库和数据挖掘技术。
3)基于电子化加油消费数据的数据分析,包括主题域的提取及相应数据仓库的建立。初步确定使用Oracle的Analytic Workspace Manager来建立数据立方体,并用来做分析。
4)数据仓库上的数据挖掘。对数据立方体切片、钻取,提取感兴趣维度上的数据进行数据挖掘,并提炼出有价值的知识。
5)结论与展望
(四)存在的主要不足
1)本论文研究的源数据是来各大单位所属个人的加油消费数据库,数据中存在单位用户等信息,由于数据涉及个人信息,故需对个人基本信息进行过滤处理。数据来源于历史数据,与现行情况存在一定的差别,分析结果反应历史特性。
2)建立数据仓库后的数据分析和数据挖掘暂时未定使用的软件,可能利用Oracle的Analytic Workspace Manager现有的分析工具完成,也可能利用Weka或者matlab连接到数据做分析,存在一点技术应用风险,但估计通过查找相关的开发资料可以解决。
3)现掌握和阅读的相关文献未够充分,但通过互联网和图书馆的资源不断补充完善。
记录人签名:
年月日2
二、考核意见
导
师
意
见
签名:
年月日指
导
小
组
意见签名:
年月日
审查建议1.合格,同意正式进入论文阶段2.不合格,建议重新开题
指导小组
组成姓名职称所在单位签字
组长
成员
院(系、所、中心)审核意见:
负责人签名:年月日
3
三、书面开题报告及文献名录(可另附页)
硕士学位论文开题报告
一论文题目
《电子化加油数据仓库的建立及其数据挖掘的研究》
二选题的意义
加油站作为各机动车,非机动车延续动力之源的手段,在交通运输物流行业中显得极为重要。传统加油站收费以现金为主,随着电脑技术的出现,各行各业信息化进度的不断深入,加油站收费逐渐传为电子化的收费方式。加油用户可在网内加油站进行刷卡,刷卡分为预存与信用。预存指卡需有余额才可以进行刷卡消费,信用方式则为可以预支刷卡,在指定期限内进行还款的方式。系统除了联网刷卡加油外,系统还维护单位,商户信息,对消费流水进行代扣,同时还可以进行单位金额代发。随着越来越多的单位及加油商户加入应系统,随着每天加油流水的不断增加,系统保存了越来越多的用户,商户,消费记录。系统对这些数据只是做一些查询,一些对帐单,一些简易报表。这些数据的价值仅仅不限此,对这些数据进行数据挖掘,可对其进行宠观上的决策分析。对加油过程的信息化无法对个人,单位,商户正真意义上的改进,只有对消费流水信息提炼出有价值,才可以对企业,个人,商户实现三盈。
近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,包括商务管理,生产控制,市场分析,工程设计和科学探索等。数据挖掘和数据仓库的协同工作,一方面,可以迎合和简化数据挖掘过程中的重要步骤,提高数据挖掘的效率和能力,确保数据挖掘中数据来源的广泛性和完整性。另一方面,数据挖掘技术已经成为数据仓库应用中极为重要和相对独立的方面和工具。
数据挖掘和数据仓库是融合与互动发展的,其学术研究价值和应用研究前景将是令人振奋的。它是数据挖掘专家、数据仓库技术人员和行业专家共同努力的成果,更是广大渴望从数据库“奴隶”到数据库“主人”转变的企业最终用户的通途。
本课题主要是为满足工作中的数据分析决策需要,对数据库中部分值得研究的加油量和加油拥挤程序进行提取,建立与加油单位及商户业务相适应的数据仓库,并通过对数据仓库中的信息的分析和数据挖掘,提取有价值或者过往没有发现的信息,为企业决策提供指导。
三国内外研究现状
1) 数据仓库技术
数据仓库技术是基于信息系统业务发展的需要,基于数据库系统技术发展而来,并逐步独4