工业大数据分析综述：模型与算法

合集下载

工业大数据的分析和应用

工业大数据的分析和应用由于互联网和物联网的爆发性发展，工业大数据正在成为很多企业的存留和迭代的核心竞争力。

工业大数据的应用范围从产品的全生命周期到生产的整体过程，包括产品的研发、制造、使用、维护、销售等各个环节。

利用工业大数据，企业可以迅速识别市场趋势，及时调整生产计划，提升产品质量和品牌形象，从而创造更大的价值。

一、工业大数据的来源和特点工业大数据的特点是海量、多样、快速、高精度。

海量数据可由工业物联网或监控设备收集而来，多样数据指数据类型的多样性，例如文本、图像、视频等，快速数据指实时获取数据和处理数据的速度，高精度数据指数据的准确性和可信度。

工业大数据源自工厂的各种生产信息和环境信息，包括工序、工艺参数、设备运行数据、生产计划等。

在制造业中，各个设备和流程都可以生成大量的数据，这些数据可以用于监测和调整生产效率、预测故障和维护设备等。

二、工业大数据的分析方法工业大数据的分析方法包括统计学、机器学习、数据挖掘和深度学习等。

统计学是利用大量数据来推断总体特征的一种方法，主要用于分析数据之间的关系和趋势。

机器学习是一种人工智能算法，可以基于数据来构造预测模型和分类器。

数据挖掘是对数据进行探索性分析的过程，可以发现规律和趋势。

深度学习则是一种用于模拟人类智能的技术，可以用于图像处理、自然语言处理等领域。

三、工业大数据的应用1.生产过程优化工业大数据可以用于监测生产过程，及时发现异常情况并采取应对措施，从而提高生产效率和产品质量。

此外，工业大数据还可以用于运行成本的优化，例如优化设备的维修计划和降低能耗。

2.产品智能化升级工业大数据可以用于产品的设计和开发，例如通过收集用户行为和反馈数据，了解用户对产品的需求和改进建议，优化产品设计和功能。

此外，基于大数据的智能维护系统能够监测设备的状态和使用情况，预测故障并提供故障解决方案，从而降低维护成本和提升用户体验。

3.制造业的数字化转型工业大数据可以促进制造业的数字化转型，通过建立数字化工厂来实现生产效率和质量的提升。

工业大数据概念、架构、分析模型

一工业大数据的发展背景当前，以大数据、云计算、移动物联网等为代表的新一轮科技革命席卷全球，正在构筑信息互通、资源共享、能力协同、开放合作的制造业新体系，极大扩展了制造业创新与发展空间。

新一代信息通信技术的发展驱动制造业迈向转型升级的新阶段——工业大数据驱动的新阶段，这是在新技术条件下制造业生产全流程、全产业链、产品全生命周期数据可获取、可分析、可执行的必然结果。

大数据（Big Data）指的是大容量的、复杂的、不断增长的、具有多个自主来源的数据集。

工业大数据是工业互联网的核心要素。

《中国制造2025》规划中明确指出，工业大数据是我国制造业转型升级的重要战略资源，需要针对我国工业自己的特点有效利用工业大数据推动工业升级。

一方面，我国是世界工厂，实体制造比重大，但技术含量低、劳动密集、高资源消耗制造的比重也大，实体工厂和实体制造升级迫在眉睫；另一方面，我国互联网产业发展具有领先优势，过去十多年消费互联网的高速发展使互联网技术得到长足发展，互联网思维深入人心，需要充分发挥这一优势，并将其与制造业紧密结合，促进制造业升级和生产性服务业的发展。

二工业大数据的内涵工业大数据即工业数据的总和，其来源主要包括企业信息化数据、工业物联网数据、“跨界”数据。

企业信息系统存储了高价值密度的核心业务数据，积累的产品研发数据、生产制造数据、供应链数据以及客户服务数据存在于企业或产业链内部，是工业领域传统数据资产。

近年来，物联网技术快速发展，工业物联网成为工业大数据新的、增长最快的来源之一，它能实时自动采集设备和装备运行状态数据，并对它们实施远程实时监控。

互联网也促进了工业与经济社会各个领域的深度融合，人们开始关注气候变化、生态约束、政治事件、自然灾害、市场变化等因素对企业经营产生的影响，因此外部跨界数据已成为工业大数据不可忽视的来源。

人和机器是产生工业大数据的主体。

人产生的数据是指由人输入计算机中的数据，例如设计数据、业务数据等；机器数据是指由传感器、仪器仪表和智能终端等采集的数据。

工业大数据处理与分析

工业大数据处理与分析一、工业大数据的概念随着工业化的进程，各种各样的设备、仪器、传感器等不断投入使用，大量的数据也随之而来。

这些数据被称为工业大数据，是有关工业生产和运营的各种信息的汇总。

它包括从设备、系统、生产流程、产品质量等方面产生的数据，数量庞大、种类繁多、来源广泛。

工业大数据不仅应用于制造业，而且也广泛应用于大型工程项目，包括航空航天、能源、矿业、交通等领域。

工业大数据对于企业的发展具有非常重要的意义，它可以让企业更快、更准确地了解市场需求、产品质量、运营状况、资产管理等情况。

二、工业大数据的处理在大数据时代，如何处理庞大的数据量成为人们关注的问题。

对于工业大数据的处理，可以采用以下三种方法：（一）批处理批处理指将数据分成若干个批次，分别处理。

这种方法比较适合对大数据量进行处理，可以通过一些传统的数据处理工具来实现。

但是，批处理的缺点是处理速度比较慢，不适用于对实时性要求很高的应用场景。

流处理是将数据不断地流式处理，将处理结果实时反馈给用户。

这种方法适用于实时性要求较高的场景，比如金融交易、视频监控等。

但流处理方法的缺陷是，会出现数据丢失和延迟等问题。

（三）复合处理复合处理是将批处理和流处理结合起来，以实现高效率和高实时性。

复合处理包括离线处理和实时处理两种方式，离线处理用于批处理大数据量，实时处理用于处理高实时性的数据。

三、工业大数据的分析对于工业大数据的分析，可以采用以下几种方法：（一）关联分析关联分析，也称为关联规则挖掘，是一种以大量的数据为基础，寻找数据项之间关联性的方法。

通过挖掘数据之间的关联性，可以帮助企业了解客户需求，提高产品质量，提高生产效率等。

（二）分类分析分类分析是将数据分为不同的类别或群组的方法。

这种方法适用于对大量数据进行分类的场景，比如消费者购买行为、新产品销售情况等。

分类分析可以帮助企业了解客户需求以及市场趋势，提高产品质量和销售能力。

预测分析是通过对历史数据的分析，预测未来可能发生的事件或趋势。

工业领域大数据中台的数仓分层维度建模的模型算法

工业领域大数据中台的数仓分层维度建模的模型算法随着工业领域大数据应用的不断深入，大数据中台的数仓分层维度建模成为工业数据处理的一项重要工作。

数仓分层维度建模是指将业务数据按照不同的维度进行分层建模，以便更好地支持数据分析和挖掘。

在工业领域中，数仓分层维度建模的模型算法有以下几种常用的方法。

1.维度建模理论维度建模理论是数仓分层维度建模的基础，它提出了一种将业务数据按照事实表和维度表进行建模的方法。

事实表是指记录具体业务事件发生的事实记录，而维度表则是描述事实记录中各种维度属性的表。

维度建模理论提供了一种将业务数据按照不同的维度进行分层建模的方法，以便更好地支持数据分析和挖掘。

2.数据挖掘算法数据挖掘算法是数仓分层维度建模中的关键技术之一，它们用于识别和挖掘数据中的模式和规律，以便更好地支持业务决策。

数据挖掘算法常用的有聚类算法、关联规则挖掘算法、分类算法和预测算法等。

这些算法能够帮助工业企业发现隐藏在海量数据中的有价值的知识和信息，从而帮助企业优化生产流程、提高产品质量和预测市场需求。

3.数据清洗和集成技术在工业领域，由于数据来源多样化、格式不一和质量差异化，因此数据清洗和集成技术非常重要。

数据清洗用于处理数据中的错误和不完整性，而数据集成则是将来自不同数据源的数据集成到一个一致的数据模型中。

数据清洗和集成技术能够帮助工业企业构建更加完整、准确和一致的数据仓库，从而为后续的数据分析和挖掘提供可靠的数据基础。

4. OLAP（联机分析处理）技术OLAP技术是一种用于多维数据分析的技术，它可以对数仓中的数据进行多维分析和交互式查询。

工业企业可以使用OLAP技术来分析生产过程中的关键指标（KPI）和趋势，以便更好地监控生产过程和进行实时决策。

OLAP技术提供了一种高效的数据分析手段，可以帮助企业从多个角度观察和分析生产过程中的数据。

5.数据可视化技术数据可视化技术是将大规模数据转换成图形化数据的技术，它可以帮助人们更直观地理解数据和发现数据中的规律。

工业大数据分析与应用

工业大数据分析与应用随着工业生产规模的扩大和技术的进步，工业企业每天产生大量的数据。

合理地分析和应用这些工业大数据，对企业的生产运营和管理决策具有重要意义。

本文将介绍工业大数据分析的概念、技术和应用，并探讨其对企业发展的影响。

一、工业大数据分析的概念工业大数据分析是指对大规模产生的工业数据进行收集、整理、清洗、存储、处理和分析的过程。

它利用计算机技术和统计学方法，从海量的数据中提取有用的信息和规律，并为企业的决策提供科学依据。

工业大数据分析借助数据挖掘、机器学习等手段，对工业生产过程中涉及的各种数据进行深度分析，以实现对生产状态、产品质量、能源消耗等指标的监控和改进。

二、工业大数据分析的技术1. 数据收集与存储：工业大数据的采集依赖于传感器、仪表等设备。

通过这些设备收集到的数据包括温度、压力、振动、能耗等各种参数。

为了保证数据的准确性和完整性，需要搭建数据采集系统，并将数据存储到大数据平台中，如Hadoop、Spark等。

这些平台具备高容量、高速度、高可靠性和高扩展性等特点，能够满足大数据处理的需求。

2. 数据清洗与预处理：由于工业数据的来源多样性和质量不一致性，需要进行数据清洗和预处理。

数据清洗主要是对异常值、重复值和缺失值进行处理，以保证数据的可靠性。

数据预处理包括数据标准化、特征选择、降维等，以提高数据分析的准确性和效率。

3. 数据分析与建模：数据分析是工业大数据应用的核心环节。

它利用统计学、数据挖掘和机器学习等方法，从数据中提取知识和规律。

数据分析的方法包括聚类分析、关联规则挖掘、分类算法、时间序列分析等。

数据建模是数据分析的结果，通过建立合适的模型来描述数据的关系和趋势，以便进行预测和优化。

三、工业大数据分析的应用1. 生产过程监控和优化：工业大数据分析可以实时监测生产过程中的各项指标，如温度、压力、振动等，及时发现异常和故障，并进行预警和维修。

另外，通过对生产数据的分析，可以找到影响产品质量和能源消耗的关键因素，从而进行优化和改进，提高生产效率和降低成本。

电网工业大数据分析报告(3篇)

第1篇一、引言随着我国经济的快速发展和能源需求的不断增长，电网作为能源传输的重要载体，其稳定性和安全性对国家能源安全和经济社会发展具有重要意义。

近年来，随着大数据、云计算、物联网等新一代信息技术的飞速发展，电网工业大数据分析成为电力行业创新的重要方向。

本报告旨在通过对电网工业大数据的分析，揭示电网运行规律，为电网规划、运行和维护提供决策支持。

二、电网工业大数据概述1. 数据来源电网工业大数据主要来源于以下几个方面：（1）电力系统运行数据：包括发电量、负荷、电压、电流、频率等实时数据。

（2）设备状态数据：包括变压器、线路、开关等设备的运行状态、故障记录、维护记录等。

（3）气象数据：包括风速、温度、湿度、降雨量等气象信息。

（4）用户用电数据：包括用户用电量、用电类型、用电时段等。

2. 数据类型电网工业大数据主要包括以下几种类型：（1）结构化数据：如设备参数、运行数据等。

（2）半结构化数据：如设备故障记录、用户用电数据等。

（3）非结构化数据：如设备图片、视频等。

三、电网工业大数据分析方法1. 描述性统计分析描述性统计分析是通过对电网工业大数据进行汇总、计算和描述，揭示数据的基本特征。

主要包括以下内容：（1）集中趋势分析：如平均值、中位数、众数等。

（2）离散程度分析：如标准差、方差、极差等。

（3）分布分析：如正态分布、偏态分布等。

2. 关联规则挖掘关联规则挖掘旨在发现数据之间的潜在关联关系，为电网运行和维护提供决策支持。

主要方法包括：（1）频繁项集挖掘：如Apriori算法、FP-growth算法等。

（2）关联规则挖掘：如Apriori算法、FP-growth算法等。

3. 时间序列分析时间序列分析是通过对电网工业大数据进行时间序列建模和分析，预测电网运行趋势。

主要方法包括：（1）自回归模型：如AR模型、ARIMA模型等。

（2）季节性分解：如STL分解、Holt-Winters方法等。

4. 机器学习机器学习是通过对电网工业大数据进行训练和预测，实现对电网运行状态的智能分析。

工业大数据分析的方法与应用研究

工业大数据分析的方法与应用研究随着智能制造、工业互联网等概念的提出，工业大数据成为当前热点话题。

如何利用工业大数据，为企业提供决策支持、提高生产效率，是当前亟需解决的问题。

本文将简要介绍工业大数据的基本概念，重点讨论工业大数据分析的方法与应用研究。

一、工业大数据的基本概念（一）什么是工业大数据？工业大数据是指在工业领域产生的、数量庞大的、多种多样的数据。

这些数据主要来源于传感器、智能设备、计算机系统等技术手段的应用，其中包括生产数据、质量数据、能源数据、运输数据、设备健康数据等。

利用这些数据，可以深入了解生产的各个环节，为企业带来更加高效和有益的决策。

（二）工业大数据的特点？A. 极大规模：百万个、亿级别的数据总量；B. 多样性：数据来源复杂，包括传感器数据、视频数据、声音等多种数据形式；C. 高速度：数据的实时性非常重要，可以更快地作出反应；D. 高质量：工业生产领域对数据质量要求极高，数据的准确性和可靠性对决策起到关键作用。

二、工业大数据分析的方法工业大数据分析的主要目的是对工业生产中的数据进行加工处理，从而提供更有价值的信息和决策支持。

工业大数据分析的方法多种多样，其中包括统计学、机器学习、数据挖掘、深度学习等众多方法。

下面我们分别来看看这些方法的具体应用。

（一）统计学方法统计学方法是工业大数据分析中最传统的方法之一，其主要应用在数据的描述和总结方面。

常用的统计学方法包括统计量、假设检验、回归分析等。

例如，对不同工厂的产量进行比较，可以采用平均值和方差的方法来描述数据集的分布情况。

（二）机器学习方法机器学习是一种利用计算机算法自动提取数据中模式和趋势的方法。

工业大数据分析中常用的机器学习方法包括决策树、神经网络、支持向量机等。

例如，利用机器学习方法可以对工厂的生产线进行预测，预测哪些设备可能会出现问题，并提前进行维修。

这样可以大大降低停机时间，提高生产效率。

（三）数据挖掘方法数据挖掘是从大数据中提取出隐藏在其中的模式和知识的过程。

工业过程数据分析与建模研究

工业过程数据分析与建模研究一、引言工业过程数据是指生产工艺中采集到的各种数据，如温度、压力、流量等。

这些数据是工厂进行运营管理和质量控制的重要依据。

然而，由于可视化工具的普及，大量的数据并没有被完全利用，导致生产效率低下和质量问题。

数据分析和建模可以提高工业过程的质量和效率，从而帮助企业更好地控制成本和提高生产力。

该领域近年来得到了广泛的应用和研究。

本文将讨论工业过程数据分析和建模的相关研究。

二、工业过程数据的分析和预测1.数据探索在开始建模之前需要对数据进行探索和分析。

首先需要确定变量之间的关系，以确定哪些变量是相关的。

然后需要对数据进行可视化和统计分析，以确定数据具有哪些特征和分布。

2.数据预处理在分析之前，数据还需要进行预处理。

这包括数据清洗、数据选择、数据转换等。

数据清洗涉及缺失值的处理和异常值的识别和处理。

数据选择可以选择特定的数据子集。

数据转换可以对数据进行标准化或正则化。

这个过程可以减小数据的噪音和误差，增加模型的准确性和可靠性。

3.建模和分析建模是一个关键的环节。

模型的选择取决于数据的特点和目标。

常用的模型包括回归模型、分类模型和聚类模型等。

通过足够多的数据分析和建模，可以为预测和控制提供足够的依据。

4.预测和控制在建立模型之后，即可预测和控制未来的数据。

在预测方面，可以采用多种方法，如时间序列模型、神经网络模型等。

在控制方面，可以采用反馈控制和前馈控制等方法。

这将帮助企业提高生产质量和生产效率。

三、应用实例1.汽车生产线的数据分析在汽车生产线生产过程中，有很多可以被跟踪和监控的变量，如温度、湿度、重量等。

一个实际的例子是汽车喷涂生产线上数据的分析。

通过分析数据，可以确定哪些变量会影响喷涂质量，以及如何调整变量在制造过程中的参量，改善喷涂质量。

2.电力系统的数据分析在电力系统中，大量传感器产生的数据可以用于诊断电力系统的健康状况和性能。

通过对数据的探索和建模，可以预测电力系统未来的负荷需求，从而更好地进行电力的分配和调节，减少浪费和成本。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

摘要：随着条形码、二维码、RFID、工业传感器、自动控制系统、工业互联网、ERP、CAD/CAM/CAE等信息技术在工业领域的广泛应用，大量与工业生产活动相关的数据被实时采集并存储到企业的信息系统中。

对这些数据进行分析，有助于改进生产工艺、提高生产效率、降低生产成本，为实现智能制造奠定基础。

因此，工业大数据分析引起了工业界和学术界的广泛关注。

模型和算法是大数据分析理论和技术中的两个核心问题。

介绍了工业大数据分析的基本概念，综述了几种流行的工业大数据分析模型在工业大数据分析领域的应用情况以及相应求解算法方面的研究成果，并探索了大数据分析模型和算法的未来研究方向。

关键词：工业大数据; 大数据分析; 模型; 算法; 智能制造1 引言当今时代，信息化和工业化的融合已经成为发展趋势，《中国制造2025》指出：“新一代信息技术与制造业深度融合，正在引发影响深远的产业变革，形成新的生产方式、产业形态、商业模式和经济增长点”。

工业大数据在两化融合过程中起着至关重要的作用，国务院颁发的《促进大数据发展行动纲要》把发展工业大数据列为主要任务之一：“推动大数据在工业研发设计、生产制造、经营管理、市场营销、售后服务等产品全生命周期、产业链全流程各环节的应用，分析感知用户需求，提升产品附加价值，打造智能工厂。

建立面向不同行业、不同环节的工业大数据资源聚合和分析应用平台”。

工业大数据是指在工业领域中产生的大数据。

随着信息化与工业化的深度融合，信息技术渗透到了工业企业产业链的各个环节，条形码、二维码、射频识别（radio frequency identification，RFID）、工业传感器、工业自动控制系统、工业互联网、企业资源计划（enterprise resource planning，ERP）、计算机辅助设计（computeraided design，CAD）、计算机辅助制造（computer aided manufacturing，CAM）、计算机辅助工程（computer aided engineering，CAE）等技术在工业企业中得到广泛应用。

互联网、移动互联网、物联网等新一代信息技术在工业领域的应用使得工业企业也进入新的发展阶段，其拥有的数据也日益丰富。

尤其是制造企业中生产线处于高速运转的状态，工业设备上产生了大量数据，同时，企业中人和计算机也产生了大规模数据。

例如，通用电气公司（GE）能源监测和诊断中心每天从客户那里收集10 GB的数据[1]，长虹集团有限公司等离子显示板生产流程数据涉及超过10 000个参数，每天产生3 000万条记录，数据量大约为10 GB[2]。

杭州西奥电梯有限公司的数字化车间监控超过500个参数，每天产生约50万条记录；浙江雅莹服装有限公司数字化生产线由15个子系统组成，每天产生约80万条记录，数据量大约为1 GB。

模型和算法是大数据分析中的两个核心问题。

大数据分析模型的研究可以分为3个层次，即描述分析、预测分析和规范分析。

描述分析探索历史数据，并描述发生了什么，这一层次包括发现数据规律的聚类[3]、相关规则挖掘[4]、模式发现[5]和描述数据规律的可视化分析[6]；预测分析用于预测未来的概率和趋势，例如基于逻辑回归的预测[7]、基于分类器的预测[8]等；规范分析根据期望的结果、特定场景、资源以及对过去和当前事件的了解对未来的决策给出建议，例如基于模拟的复杂系统分析[9]和基于给定约束的优化解生成[10]。

大数据分析算法的研究则针对特定的分析模型设计高效的算法，并研究如何提高算法的可扩展性、实时性等。

工业大数据除了具有大数据的5V （volume、velocity、variety、value、veracity）特征，还具有诸多与工业生产特性密切相关的特征，如数据来源多样、数据质量低、数据蕴含信息复杂、耦合不确定、数据实时性高等，这使得工业大数据分析的模型更加复杂多样，对算法的实时性要求更高。

目前，工业大数据分析的理论和技术研究仍处于起步阶段，分析模型以简单的单一模型为主，分析算法主要是通用的数据挖掘算法。

本文对工业大数据分析模型和算法的研究现状进行了综述，总结了大数据分析模型在工业场景中的应用，并对工业大数据分析模型的常用求解算法进行概述和评价。

2 大数据分析模型在工业中的应用大数据分析模型按照输入输出的形式，主要有关联规则分析、分类分析、回归分析和聚类分析，这些分析模型以及它们的组合被应用于多种实际工业场景的分析任务中，如工艺参数优化、产量预测、故障检测和诊断、客户需求分析和服务类型识别等。

2.1 关联规则分析模型关联规则挖掘是针对购物篮分析的问题提出的，其最初的目的是挖掘交易数据库中不同商品间存在的关联关系，以此得到顾客购买模式的一般性规则，并用这些规则指导商家进行合理的货架设计。

在实际工业过程中，许多场景可以用类似的关联关系建模，用频繁项集挖掘的方法来获取隐含规则，用数据和知识驱动的方式来代替传统的大量依靠经验的决策方式。

在工艺参数优化方面，参考文献[12]针对钢铁制造工艺，用关联规则分析制造过程中的化学成分（如碳、锰、磷、硫等）的含量、出钢温度和轧制速度对产品机械性能的影响。

在能耗优化方面，参考文献[13]用关联规则分析从大量历史能耗数据中获取生产参数对能耗影响的规则，以此来指导企业改进生产参数，优化能耗。

在工艺标准优化方面，参考文献[14]用关联规则分析服装款式、材料、年龄对实际工时与标准工时差异的影响程度，作为标准工时优化的依据；参考文献[15]用关联规则模型评估导致标准工时不合理的影响因素；参考文献[16]用关联规则挖掘模具企业计算机辅助工艺过程设计（computer aided process planning，CAPP）改模知识库，以此指导工艺设计，提高改模工艺继承性与重用性，促进改模工艺标准化。

在产品质量优化方面，参考文献[17]关注装配顺序对产品质量的影响。

首先用关联规则的方法从历史数据中抽取规则，再经人工整理，获得简洁有效的装配知识和规则，以此指导产品按合理顺序装配。

在企业的供应链管理方面，参考文献[18]用关联规则分析机械制造企业外购件间的隐含关系，指导企业制定采购计划；参考文献[19]用关联规则模型分析汽车企业产品价格、供应商评价、退货原因间的关联关系，以此建立采购决策支持系统；参考文献[20]用关联规则模型评价和选择供应商。

在销售和售后方面，参考文献[21]从卡车制造商的角度出发，用关联规则分析经销商订购车型间的关系，以进行品牌推广；参考文献[22]将关联规则运用到笔记本电脑接单制造（build to order，BTO）生产计划中，挖掘用户配置选择的关联关系，从用户和市场需求的角度出发，为生产计划制定提供合理依据；参考文献[23]用关联规则对钟表企业物料清单中的历史数据建模，分析不同零部件组合的产品的客户认可度和盈利能力，以此为基础制定营销策略；参考文献[24]在客户关系管理（customer relationship management，CRM）中运用关联规则来预测客户行为；参考文献[25]用关联规则分析通信设备制造业不同地区的销售特征，预测流失客户。

除了直接用关联规则模型进行工业大数据分析之外，也有研究者用关联规则对工业数据进行预处理，再结合其他方法对处理过的数据进行分析。

参考文献[26]针对半导体制造工艺过程中机器故障由多因素引起、因素间非线性的特点，提出了RMI （root-cause machine identifier）综合处理程序。

其关键步骤之一就是用关联规则模型对数据进行处理，得到候选集，再在候选集上进行计算来定位和发现机器缺陷；参考文献[27]用关联规则对毛毯制造数据进行降维，找到关键属性集，再利用关键属性集分析毛毯制造过程中出现故障的原因和相应的规则，帮助识别和定位故障。

2.2 分类模型和回归模型分类模型和回归模型在基于大数据的分析、判断和预测领域具有广泛应用。

其中，分类模型主要针对离散属性值的判断和预测，如故障检测和诊断、客户细分；而回归模型主要针对连续属性值，如产品的产量、销量。

决策树模型和神经网络模型是基于工业大数据的分类和回归分析中的主要模型。

决策树是一种树形结构，用来表征对象属性与对象值之间的映射关系。

决策树模型简单直观、可解释性强，具有良好的分析和预测能力，适用于工业大数据分析的诸多场景。

在工艺参数优化方面，参考文献[28]用分类决策树对玻璃镀膜工艺建模，根据给定的工艺参数预测产品质量，从而帮助企业快速确定符合预期质量产品的工艺参数。

在成本优化方面，参考文献[29]用决策树模型筛选对工艺成本影响最大的工序，通过控制和改进筛选出的工序优化整个工艺路线的成本。

在工艺标准优化方面，参考文献[14]用决策树模型对服装标准工时系统的数据进行分类，再在每一类数据上进行挖掘。

在产品质量监控方面，针对传统冷轧产品缺陷检测方法和检测标准不一、漏洞和误判多的问题，参考文献[30]使用生产数据训练二分类和多分类决策树，挖掘出定位产品缺陷的规则，以此帮助企业快速准确地检测出生产产品的缺陷。

类似地，在故障检测方面，参考文献[27]用毛毯制造数据训练决策树模型，得到导致生产线故障的规则，并用这些规则指导相关人员识别和定位生产线故障，大大提高了毛毯生产的效率；参考文献[31]用提升机各系统的监测数据训练决策树，表征故障隐患。

在生产调度方面，决策树模型受到了广泛关注。

参考文献[32]针对离散制造业静态Job Shop调度问题，用决策树模型提取调度知识，优化调度方案；参考文献[33]将工单数据和机器加工数据作为历史数据训练决策树模型，并用训练好的模型实时为工件安排机器进行加工，充分利用生产资源，实现智能化生产；参考文献[34]用决策树模型分析机器细小位置移动次数和机器效率对停止次数的影响规律，作为机器调整和检测的依据，有助于车间设备、人员的调配。

在采购方面，参考文献[35]用决策树模型挖掘汽车产品销售数据，指导管理者制定合理的采购计划。

在客户关系管理方面，决策树模型被广泛用于客户的评价、细分和预测。

参考文献[21]用决策树模型分析卡车经销商的重要程度；参考文献[36]用决策树模型将已有客户群按其忠诚度分类；参考文献[37]则用决策树模型来预测客户的忠诚度，以帮助企业发掘潜在客户；参考文献[24]用决策树模型挖掘客户潜在服务需求，帮助企业从被动服务模式向主动服务模式进化；参考文献[38]用决策树模型分析客户评价，以此衡量产品的满意度指标；参考文献[39]用决策树模型预测潜在流失客户，指导企业维系客户关系。

此外，在制造业企业的管理流程优化方面，参考文献[40]对机械制造企业的信息管理系统建立处理部门归属决策树模型，以规范管理流程，提高企业各部门间的协调运作效率。