数据挖掘技术的软件工程论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据挖掘技术的软件工程论文
1数据挖掘技术
常见数据挖掘技术包括:分类树技术、关联发现技术、聚类技术、人
工神经网络、最优集合规约技术以及可视数据挖掘技术等。
软件度量
数据往往具有多维度、高耦合性,软件工程数据挖掘中会采用一些特
殊处理技术,包括统计分析、回归建模、分类树以及神经网络等。
在
具体软件工程实践中,选择何种挖掘技术,其决定性因素为想要达成
的目标。
2数据挖掘实现过程
通常,数据挖掘过程包括4个步骤,即选择数据、预处理、实施挖掘
以及吸收数据。
数据挖掘整个过程具有交互性,有时数据需要重新选择,有时也要对数据预处理实行改进,也可能出现算法反复被调整现象,基于这种特征,数据挖掘时要设置反馈环。
挖掘数据第1步是将
管理和目标反映到1个(或多个)挖掘任务中,整个过程可主要划分
成为六种:1)评估、预测。
评估包括对软件产品、过程以及资源的属
性实行相对应检查就是整个评估过程,同时也需要根据这些属性,赋
值给未知属性,当然这些未知属性需要实行量化。
评估工作完成后,
要对属性值实行预测。
2)分类。
检查1个特定实体属性,根据结果将
其划分到另1个类别或范畴(事先定义好)中。
3)关联发现。
关联发
现能够识别出特定内容中互相存相关联某些属性。
如,可将找出在软
件开发属性和产品属性相互关联的内容找出来。
4)聚类。
将1个结构
不相同的群体划分到另1个具有相同结构的子群集合中,这个过程叫
做聚类,它的划分依据是成员之间具有高度相似性。
5)数据可视化。
数据可视化是利用可视化描述方法来定义复杂信息。
6)可视数据探察。
可视化数据探察是对描述工作的相对应拓展,可利用数据可视化交互
控制来分析和检视海量数据3。
它应用具有可视化功能和数据挖掘技术来对数据实行处理。
3挖掘技术在软件工程中应用
上文提及到软件工水准量,部分可利用信息已在海量数据中被提取出来,但普遍认为更为有效且数量众多的数据依然在软件工程相关数据
库中隐藏,而没有被发现。
实际上,数据挖掘就是1种被公认为提升
软件工水准量的技术。
图1为数据挖掘在软件工程中的应用。
3.1数据挖掘繁荣原因1)计算机硬件系统和软件系统的基础设施建
立具备发现驱动、分析数据等功能;2)每种技术都在实际应用中持续
得到改进,其使用水平持续提升。
如,模式识别、神经网络等有明显
进步趋势;3)数据存储、贮藏、集成成本不高,海量数据可轻松获得。
数据挖掘技术被人们理解,并在实践中逐渐被重视,同时也给研究和
进一步提升数据挖掘技术提供了便利条件。
3.2面临挑战软件工程自身存有很多数据上的特殊性,给数据挖掘领
域研究工作带来制约和影响,主要表现在以下三个方面:1)数据复杂。
软件工程数据主要分为两个组成部分,即结构化数据、非结构化数据。
结构化数据主要包括缺陷报告、版本信息等内容,而非结构化数据则
包含数据代码、相对应注释以及文档等内容。
结构化数据、非结构化
数据并不能同时适用一种算法,而且两种数据间还存有对应联系。
如,1个缺陷报告中往往包括缺陷代码段。
而结构化数据里常常涵盖部分非结构化信息,非结构化数据中亦是如此,这也是今后工作中需要重点
解决的问题之一。
2)非传统分析存有局限。
数据挖掘最终想实现的目
标就是将转化而来的信息传达给用户,实现信息共享。
传统数据挖掘
技术在使用过程中,信息手段比较单一,如文字、图表等表达形式。
其实,软件开发商对信息的要求很高,1个统计结果根本不能满足其工作需求。
为促动软件开发持续向上发展,开发人员需要相关信息作为
参考依据,包括开发实际案例、编程所需模板、系统缺陷定位以及软
件结构设计等。
研究数据挖掘技术,提升其实际使用功能,需要持续
提交新信息、新知识,并改进相对应手方法。
3)挖掘结果评价标准不
够具体。
软件工程数据挖掘尚未形成完善的结果表示体系,其评价体
系也有待增强。
人员在软件开发过程中需要大量信心,这些信息非常
具体且复杂,表示方法不尽相同,互相之间难以做出对比,也很难用
定量方法去分析挖掘结果。
4结束语
“数据挖掘”是在发展过程中被人们定义的,但软件工程中对此类数
据的研究早就存有。
数据挖掘技术能够为研究软件工程数据提供方便,具有重要应用价值。
所以,作者认为将两者充分结合是计算机信息技
术发展的必然趋势。
若以过程角度来看,软件工程涉及到数据挖掘各
个周期、阶段,甚至是具体实施步骤;以技术角度看,数据挖掘在软
件工程中应用广泛。
数据挖掘技术虽然在实践中取得一定应用效果,
但还有更广阔的空间没有内充分挖掘出来,为广大从业人员提供创新
空间。
数据挖掘技术的软件工程论文。