数据科学,预测分析和大数据的数据质量

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
这篇文章引入在供应链管理中的数据质量问题,并且提出了监测 和控制数据质量的方法。本文除了提出数据质量在供应链研究和 实践中的重要性外 ,还进一步提出了基于互补理论的跨学科研究 主题。
3,生产数据
一些学者类比产品制造和数据制造,进而类比戴明的全面质量管理,提出全 面数据质量管理
Total Quality Management 全面质量管理 计划,执行,检查,处理
2,文献简介
今天的供应链专家淹没在数据之中,积极地思考着寻求数据如何 产生,组织和分析的新的方式。这就推动了一些组织为了加快和 提高供应链的流程和绩效,接受并完善数据分析功能,例如数据 科学(data science) ,预测分析(predictive analytics)和大数据 (big data),简称DPB.
5,用统计过程控制方法控制数据质量
像生产制造一样,用控制图去控制数据质量 控制图(Control chart)就是对生产过程的关键质量特
性值进行测定、记录、评估并监测过程是否处于控 制状态的一种图形方法。 根据假设检验的原理构造 一种图,用于监测生产过程是否处于控制状态。它 是统计质量管理的一种重要手段和工具。
Customer shipping address in a customer relationship management system matches the address on the most recent customer order
Inventory management system reflects real-time inventory levels at each retail location
实例:喷气式发动机的压缩机的数据质量管理
制造喷气式发动机的组织和相关军用飞行器部件的组织应 用控制图的方法提高数据质量。
以数据的第四种基本维度:完整性,作为例子,其中:
Cik= 0 ,数据记录完整
1,数据记录不完整
i=1,2,…8 k=1,…NR
应用这个图,管理者就可以甄别数据质量问题,可采取的纠正行为有:重新训练数据记录 员的能力,然后重新设定累积和控制图表,整个过程就可以在控制中进行。
All requested delivery dates are entered in a DD/MM/YY format
Customer shipping address includes all data points necessary to complete a shipment (i.e. name, street address, city, state, and zip code)
6,用统计过程控制方法监测和控制供应链数据
statistical process control (SPC)统计过程控制 统计过程控制(简称SPC)是应用统计技术对过程中
的各个阶段进行评估wk.baidu.com监控,建立并保持过程处于 可接受的并且稳定的水平,从而保证产品与服务符 合规定的要求的一种质量管理技术。 Cumulative Sum control charts:累积和控制图, 又称累积和图,是质量控制图的一类。 其制作过程为:从与控制的测定值中减去预期值, 计算其累积和,并以此累积和对测定时间顺序作图。
Total Data Quality Management 全面数据质量管理(TDQM) 定义,测量,分析,改进,控制
4,数据质量维度
精确性,及时性,一致性,完整性
Data quality dimension Accuracy
Timeliness Consistency
Completeness
Description
Supply chain example
Are the data free of errors?
Are the data up-todate? Are the data presented in the same format? Are necessary data missing?
数据科学,预测分析和大数据的数据质量在供应 链管理中:问题的引入以及研究与应用的建议
1,文献题目
Data quality for data science, predictive analytics, and big data in supply chain management: An introduction to the problem and suggestions for research and applications
7,基于理论研究的可能 一,知识基础理论
1,数据质量的认识水平和DPB在供应链中的应用之间是否有关系?
2,在DPB活动和供应链应用之间,数据质量是扮演一个中介作用吗?
数据科学,预测分析和大数据的数据质量在供应链管理 中:问题的引入以及研究与应用的建议 期刊:Int. J. Production Economics 154 (2014) 72–80 作者:Benjamin T. Hazen , Christopher A. Boone
Jeremy D. Ezell , L. Allison Jones-Farmer
Data quality for data science, predictive analytics, and big data in supply chain
management: An introduction to the problem and suggestions for research and applications
知道数据的基本维度后,我们就可以确定测量这些维 度的方法,并用一些工具去监控数据的质量。比如, SPC即统计过程控制(Statistical Process Control)。
SPC主要是指应用统计分析技术对生产过程进行实时 监控,科学的区分出生产过程中产品质量的随机波动 与异常波动,从而对生产过程的异常趋势提出预警, 以便生产管理人员及时采取措施,消除异常,恢复过 程的稳定,从而达到提高和控制质量的目的。
相关文档
最新文档