立项建议书,范文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
篇一:立项建议书
数学与统计学院08级统计2班20082464 张丹丹
数据挖掘软件立项建议书
0. 文档介绍
0. 1 文档目的
本文档的目的是介绍一种数据挖掘软件的立项,包括即将开发的产品的介绍、市场的情况及对客户需求的描述、该产品开发过程所需要的人力资源等。
0. 2 文档范围
? 项目开发计划
?
?
?
?
?
?
?
?
?
? 需求规格说明书概要设计说明书详细设计说明书数据库设计说明书用户手册操作手册测试计划测试总结报告开发进度周(月)报项目开发总结报告
0. 3 读者对象
软件开发人员;软件维护人员;软件开发的管理人员;银行、保险、电信等大企业的需要该产品功能的用户
0.4 参考文档
【1】数据挖掘软件发展分析朱杨勇
【2】海量数据与数据挖掘技术李燕
0. 5 术语与缩写解释
db—数据挖掘
sas enterprise miner—提供全面的数据挖掘算法
spss clementine—企业级数据挖掘平台
1.产品介绍
a) 1 产品定义
数据挖掘(db)--从大量数据中寻找其规律的技术,是统计学、数据库技术和人工智能技术的综合。
数据挖掘软件是从大量的数据中抽取出潜在的、有价值的知识或规则,自动分析海量数据,获取有用知识,通过分析大量的数据,了解已经发生了什么,分析发生的原因并预测将来会发生什么。
1.2 产品开发背景
本产品开发的内因:已经开发出的各种软件都有一定的缺陷,例如:第一代数据挖掘软件cba 面对足够大且频繁变化的数据,难以与数据库或数据仓库建立接口来进行管理;第二代数据挖掘软件dbminer、sas enterprise miner 只注重模型的生成,没有与预言模型系统集成,难以预测将来会发生什么;第三代数据挖掘软件spss clementine不能支持移动环境。所以为了实现在移动环境下进行数据分析,为了更好的让人机结合,迫切需要开发出一种更好的软件。
本产品开发的外因:随着信息时代的到来,信息量增大,数据变得越来越多,决策者们淹没在数据中,不能制定出合适的决策。随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多。激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更高层次的分析,以便更好地利用这些数据。目前的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。缺乏挖掘数据背后隐藏的知识的手段,导致了“数据爆炸但知识贫乏”的现象。只有通过数据挖掘,借助于数据挖掘技术来分析海量的数据,这就需要开发一种能够自动进行数据分析和人机互动的软件。
1.3 产品主要功能和特色
本产品主要进行数据的分析,通过数据挖掘和移动计算相结合为决策者制定出较好的决策提供一种工具。
本产品的特色是能够挖掘嵌入式系统、移动系统、和普遍存在(ubiquitous)计算设备产生的各种类型的数据。
1.4 产品范围
本产品可以在银行、电信(欺诈甄别、客户流失)、零售、保险、各行业的电子商务网站、制药、生物信息、科学研究等领域使用,结合实际,解决现实问题。本产品应当包含分析数据的各种算法(神经网络、时序模型、关联规则等)、业务建模、预测模型等。
2.市场概述
2. 1 客户需求描述
不同的客户有不同的需求。
在市场营销中的客户,需要通过收集、加工和处理涉及消费者消费行为的大量信息,确定特定消费群体或个体的兴趣、消费习惯等,进而推断出相应消费群体或个体下一步的消费行为然后以此为基础,对所识别出来的消费群体进行特定内容的定向营销。
对商业银行客户来说,他们要求能够进行对大量数据的处理和分析,发现其数据模式及特征,然后发现某个客户消费群体或组织的金融和商业兴趣,并观察金融市场的变化趋势。电子商务:网上商品推荐;个性化网页;自适应网站?
生物制药、基因研究:dna序列查询和匹配;识别基因序列的共发生性…
电信:欺诈甄别
银行
美国银行家协会(aba)预测数据仓库和数据挖掘技术在美国商业银行的应用增长率是14.9%。分析客户使用分销渠道的情况和分销渠道的容量;建立利润评测模型;客户关系优化;风险控制等
2.2 市场规模与发展趋势
经过几代产品的开发与使用,该项技术与产品正在趋于成熟化。
第三、四代系统强调预言模型的使用和在操作型环境的部署
第二代系统提供数据管理系统和数据挖掘系统之间的有效接口
第三代系统另外还提供数据挖掘系统和预言模型系统之间的有效的接口
第一代系统与第二代相比因为不具有和数据管理系统之间有效的接口,所以在数据预处理方面有一定缺陷
目前,随着新的挖掘算法的研究和开发,第一代数据挖掘系统仍然会出现,第二代系统是商业软件的主流,部分第二代系统开发商开始研制相应的第三代数据挖掘系统,比如 ibm intelligent score service。第四代数据挖掘原型或商业系统尚未见报导。
未来的发展
? 与数据库数据仓库系统集成
? 与预言模型系统集成
? 挖掘各种复杂类型的数据
? 与应用相结合
? 研制和开发数据挖掘标准
? 支持移动环境
中国数以千万中小企业也将是本产品的巨大的市场所在,不过,由于这些对于对数据的重要性认识还不是很充足,加之难以负担费用,因此近两年不会成为数据仓库的重点客户,将主要围绕电信、银行、金融保险等信息处理量大的大型企业。
3.产品发展目标
短期目标:能够开发出比较使用的产品。
长期目标:能够适用于更多的领域。
4. 产品技术方案
4.1 产品体系结构
4.2 关键技术
本产品关键利用数据挖掘技术,包括各种算法,该技术要求开发人员有一定的专业知识,懂得一些算法的实现。
5.make-or-buy分析
作为公司内部的一个部门,或者成立一个全资子公司来负责,不外包。有一定的的风险,因为在国内市场占的份额不大。
6.项目开发计划
7.市场营销计划
7.1 产品营利模式和销售目标
license营利模式,向用户出售安装“许可证”,授权用户安装和拥有本产品,在该模式下用户可以完全拥有本软件产品,安全性较高,相对的价格也高,但为大型企业提供便利。7.2 促销和渗透方式]
建立网站,用户可以下载产品试用版和一些资料
将产品试用版和资料赠送给老客户和潜在客户
参加专业性的会展、研讨会,宣传产品
借助代理人、新华书店、培训机构的渠道优势或品牌优势,如发挥代理人在当地的人脉优势、与新华书店的音像部合作软件产品
7.3 销售方式和渠道
直销:本公司有关人员和客户直接联系,销售产品;
代理商或办事处:垂直式的管理型,总公司下设分公司、子公司,然后在区域空缺的it发达的大城市寻找代理商,当公司业务在该地区达一定规模后,设立办事处。在合作伙伴上选择oem方式。
捆绑软件销售将软件产品与公司其他产品的软件销售捆绑起来,如图书馆管理软件或数字图书馆与纸质图书捆绑软件销售、数字资源管理系统与资源网捆绑软件销售,利用其他产品的软件销售契机,打开软件产品的软件销售门路,形成协同软件销售。
会议营销运用软件产品演示会、推介会、培训会等,将意向客户和潜在客户邀请出来,通过软件的现场演示、现场体验,增强客户对产品的了解和认同,提高产品的认知度,促使现场购买和后续购买。
8.总结目前,国内的银行、电信、石油、保险、证券、零售、医药、教育等行业逐步将数据挖掘技术的应用作为信息化建设的主要工作。不能让国外的软件统领我们国内的行业,我们要致力于数据挖掘软件的开发,掌握数据资源开发利用的技术。希望开发的本产品能够更加