大数据挖掘大作业结果分析报告报告材料报告材料
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据仓库期末作业- 数据挖掘分析报告某药店常用药品信息数据挖掘解决方案
作者刘金龙
学院计算机信息管理学院
专业计算机科学与技术
年级2011
学号112103209
某药房常用药品价格、产地的数据挖
掘解决方案
一、提出问题
1、单位基本情况及相关业务流程介绍;
对于药店,储存大量的常用药品是必不可少的工作,随之而来的对药品的数据信息管理和储存成为了令人头疼的问题,在接到货源后,工作人员需要统计药品产地和价格的信息,为以后的货源供给地,用合理的价格出售药物,是至关重要的工作。
2、单位存在的问题。
由于货物种类、名称众多,在短时间内分析好相关数据几乎不可能,大量的数据,依靠人力或是非数据统计软件进行统计工作,事倍功半。严重影响药店的正常进货,出售药品的工作。
二、分析问题
1、对该单位存在的问题进行分析;
由以上问题可见,利用数据挖掘进行相关数据的统计和整理工作,简单、省时、有效。
2、解决问题的可能途径和方法。
利用SQL SEVER 导入数据,再提取统计分析结果,很快会得到想要的数据分析结果。
三、利用数据挖掘技术解决问题
1、设计数据挖掘算法;
决策树;
数据关联;
神经元算法;
2、对挖掘结果进行深入解释和分析
由此图可以看见在不不同的产地,由于地理因素和特产药品的原因,在药品相关的植物盛产区,进货比较便宜。
此图可以分析出,不同的消费人群对于同类的药品的购买需求,对于同样的功能的药,药存储不同价格的种类,以满足广大消费者的需求。
此图可以分析以前的销售结果,哪类、什么价格的更受消费者欢迎,方便以后进货。
四、总结
通过自己的实践,对数据挖掘有了新的认识。简单来说,数据挖掘是基于“归纳”的思路,从大量的数据中(因为是基于归纳的思路,
因此数据量的大小很大程度上决定了数据挖掘结果的鲁棒性)寻找规
律,为决策提供证据。从这种角度上来说,数据挖掘可能并不适合进
行科学研究,因为从本质上来说,数据挖掘这个技术是不能证明因果
的,以一个最典型的例子来说,例如数据挖掘技术可以发现啤酒销量
和尿布之间的关系,但是显然这两者之间紧密相关的关系可能在理论
层面并没有多大的意义。不过,仅以此来否定数据挖掘的意义,显然
就是对数据挖掘这项技术价值加大的抹杀,显然,数据挖掘这项技术
从设计出现之初,就不是为了指导或支持理论研究的,它的重要意义
在于,它在应用领域体现出了极大地优越性。一下是我参阅资料总结
的设计数据挖掘的步骤:
①理解数据和数据的来源
②获取相关知识与技术
③整合与检查数据
④去除错误或不一致的数据。
⑤假设数据模型。
⑥实际数据挖掘工作(data mining)。
⑦测试和验证挖掘结果(testing and verfication)。⑧解释和应用(interpretation and use)。
由上述步骤可看出,数据挖掘牵涉了大量的准备工作与规划工作,事实上许多专家都认为整套数据挖掘的过程中,有80%的时间和精力是花费在数据预处理阶段,其中包括数据的净化、数据格式转换、变量整合,以及数据表的链接。可见,在进行数据挖掘技术的分析之前,还有许多准备工作要完成。