数据仓库实验报告

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

四.实验总结
通过本次实验,对数据仓库中关联规则的应用以及如何发现关联规则有了简单的了解,通过使用Analysis Services服务进行关联规则模型的建立和处理,以可视化的方式查看模型结果对关联规则有了根本的了解。

关联规则可以反映一个事物与其他事物之间的相互依存性和关联性,如果两个或多个事物之间存在一定的关联关系,其中一个事物就能通过其他事物预测到。

处理进度完成之后,单击“关闭”按钮,建模完成。

7.查看挖掘结果
再次选择“挖掘模型查看器”选项卡,由vTargetMail数据集生成的决策树。

四实验总结
本次实验使用SQL Server2005中的决策树方法,进一步的了解数据库Analysis Services的功能,对它的使用方法有了更深入的了解,能做一些基本的操作。

通过应用数据库Analysis Services的一些功能,能够分析一些数据之间的联系,有利于做出判断与决策。

四实验总结
本次实验使用SQL Server 2005中的Analysis Service服务进行k-means算法模型的建立和处理并且可视化的方式查看结果,本次实验使我对k-means的算法加深了认识与了解。

能做到简单的应用。

k-means聚类算法是将各个聚类子集内的所有数样本的均值作为该聚类的代表点,算法的主要思想是通过迭代过程把数据集划分为不同的类别,使得评价聚类的性能的准则函数达到最优从而使生成的每个聚类内紧凑。

实验名称实验五SQLServer 2005中贝叶斯网络应用
四实验总结
通过本次实验对贝叶斯网络有了更深入的了解,贝叶斯网络是一个白匣子,各个结点之间的影响程度和条件概率关系都可以显示地看到,并且意义明确,因此其更适合那些影响因素少而且关系明确的情况,但贝叶斯网络使用者更多地了解领域,以增加网络的可理解性和预测、诊断的准确性。

通过使用SQLService2005的朴素贝叶斯网络功能使用能够做预测、诊断然后查看各个变量对被预测和被诊断的各个值得影响力。

四实验总结
本次实验利用SQL Service2005中的DataAnalysis的数据挖掘功能进行神将网络的训练和测试,熟悉了神经网络的原理,掌握了对它的应用。

神经网络有大量的应用,它可以学习高度非线性的系统,并且用学习得到的参数和系统进行系统的输入到输出的预测,缺点是需要很长的学习时间,才能训练出网络中的参数,一次有限制了它的应用,至此它仅适用于时间允许的应用场合。

相关文档
最新文档