工业大数据(Industrial big data)是指由工业设备高速产生的大量数据,对应不同时间下的设备状态,是
物联网中的讯息。此一词语在2012年随着
工业4.0的概念而出现,也和
信息技术行销流行的
大数据有关,工业大数据也意味着工业设备产生的大量数据有其潜在的商业价值。工业大数据会配合工业
互联网的技术,利用原始资料来支援管理上的决策,例如降低维护成本以及提升对客户的服务。
定义
工业大数据是指在工业领域中,围绕典型智能制造模式,从客户需求到销售、订单、计划、研发、设计、工艺、制造、采购、供应、库存、发货和交付、售后服务、运维、报废或回收再制造等整个产品全生命周期各个环节所产生的各类数据及相关技术和应用的总称。其以产品数据为核心,极大延展了传统工业数据范围,同时还包括工业大数据相关技术和应用。其主要来源可分为以下三类:第一类是生产经营相关业务数据。第二类是设备物联数据。第三类是外部数据。
工业大数据技术是使工业大数据中所蕴含的价值得以挖掘和展现的一系列技术与方法,包括数据规划、采集、预处理、存储、分析挖掘、可视化和智能控制等。工业大数据应用,则是对特定的工业大数据集,集成应用工业大数据系列技术与方法,获得有价值信息的过程。工业大数据技术的研究与突破,其本质目标就是从复杂的数据集中发现新的模式与知识,挖掘得到有价值的新信息,从而促进制造型企业的产品创新、提升经营水平和生产运作效率以及拓展新型商业模式。
特征
工业大数据除具有一般大数据的特征(数据量大、多样、快速和价值密度低)外,还具有时序性、强关联性、准确性、闭环性等特征。
(1)数据容量大 (Volume):数据的大小决定所考虑的数据的价值和潜在的信息;工业数据体量比较大,大量机器设备的高频数据和互联网数据持续涌入,大型工业企业的数据集将达到PB级甚至EB级别。
(2)多样 (Variety):指数据类型的多样性和来源广泛;工业数据分布广泛,分布于机器设备、工业产品、管理系统、互联网等各个环节;并且结构复杂,既有结构化和半结构化的传感数据,也有非结构化数据。
(3)快速 (Velocity):指获得和处理数据的速度。工业数据处理速度需求多样,生产现场级要求时限时间分析达到毫秒级,管理与决策应用需要支持交互式或批量数据分析。
(4)价值密度低 (Value):工业大数据更强调用户价值驱动和数据本身的可用性,包括:提升创新能力和生产经营效率,及促进个性化定制、服务化转型等智能制造新模式变革。
(5)时序性 (Sequence):工业大数据具有较强的时序性,如订单、设备状态数据等。
(6)强关联性 (Strong-Relevance):一方面,产品生命周期同一阶段的数据具有强关联性,如产品零部件组成、工况、设备状态、维修情况、零部件补充采购等;另一方面,产品生命周期的研发设计、生产、服务等不同环节的数据之间需要进行关联。
(7)准确性 (Accuracy):主要指数据的真实性、完整性和可靠性,更加关注数据质量,以及处理、分析技术和方法的可靠性。对数据分析的置信度要求较高,仅依靠统计相关性分析不足以支撑故障诊断、预测预警等工业应用,需要将物理模型与数据模型结合,挖掘因果关系。
(8)闭环性 (Closed-loop):包括产品全生命周期横向过程中数据链条的封闭和关联,以及智能制造纵向数据采集和处理过程中,需要支撑状态感知、分析、反馈、控制等闭环场景下的动态持续调整和优化。
由于以上特征,工业大数据作为大数据的一个应用行业,在具有广阔应用前景的同时,对于传统的数据管理技术与数据分析技术也提出了很大的挑战。
战略价值
大数据是制造业提高核心能力、整合产业链和实现从要素驱动向创新驱动转型的有力手段。对一个制造型企业来说,大数据不仅可以用来提升企业的运行效率,更重要的是如何通过大数据等新一代信息技术所提供的能力来改变商业流程及商业模式。从企业战略管理的视角,可看出大数据及相关技术与企业战略之间的三种主要关系如下:
架构
当前,工业领域主流的架构主要是从智能制造的视角进行设计,包括,德、美、中、日等,如下表所示。
为解决背景中提到的问题,
上海产业技术研究院工程大数据服务创新中心提出了一种工业大数据参考架构,为跨产业的大数据应用提供了一个具有通用性和一致性的架构模板和方法论。该架构包含三个维度:生命周期与价值流、企业纵向层和IT价值链,其中,生命周期与价值流维度分为三个阶段:研发与设计、生产与供应链管理及运维与服务,分别讨论各阶段的数据类型、应用及价值创新;企业纵向层从下至上包含信息物理系统CPS、管理信息系统MIS和互联平台系统Internet+,分别讨论企业各层为实现工业大数据应用及工业转型所需进行的工作;IT价值链讨论指导工业大数据落地的业务架构、信息系统架构和技术架构,且在技术架构中,针对工业大数据及工业企业的特点对实现工业大数据应用所需的技术组件进行了讨论。工业大数据架构下图。
生命周期
工业大数据架构中的生命周期与价值流维度涵盖了整个产品生命周期的各阶段,即研发与设计、生产、物流、销售、运维与服务五个阶段,其中,生产、物流和销售与产品可进一步归类于生产与供应链领域,则生命周期与价值流维度包含了三个领域:研发与设计、生产与供应链及运维与服务三个领域,各领域的应用场景如下图所示。
企业纵向层级
工业大数据架构的企业纵向层从物理域的角度自下而上共5层,分别为设备层、控制层、车间层、企业层和协同层;在设备层、控制层、车间层可利用物联网,基于信息物理系统(CPS)实现智能工厂;在企业层和车间层,企业集成内部各种信息化应用,进行企业内部业务流程整合和改造(BPM),提升企业运行效率;协同层使用工业云等平台技术,实现企业外部协同制造及制造业服务化等创新业务模式。企业纵向维度可以分成信息物理系统(CPS)、企业管理信息系统、互联平台系统(Internet+)三个子系统,如下图所示。
IT价值链
大数据的价值通过数据的收集、预处理、分析、可视化和访问等活动来实现。在IT价值链维度上,大数据价值通过为大数据应用提供存放大数据的网络、基础设施、平台、应用工具及其他服务来实现运营效率的提高和业务创新的支撑。大数据技术支撑的企业架构,参考美国开放组织Open Group的TOGAF架构划分方法,可分成业务架构、信息系统架构成及IT技术架构三个层次,如下图所示。
数据治理
工业大数据治理是对组织的工业大数据管理和利用进行评估、指导和监督的体系框架。它通过制定战略方针、建立组织架构、明确职责分工等,实现工业大数据的风险可控、安全合规、绩效提升和价值创造,并提供不断创新的大数据服务。
工业大数据治理对于确保工业大数据的优化、共享和安全是至关重要的。有效的工业大数据治理计划可通过改进决策、缩减成本、降低风险和提高安全合规等方式,将价值回馈于业务,并最终体现为增加收入和利润。工业大数据治理的作用可概括为四点:(1)有效的工业大数据治理能够促进工业大数据服务创新和价值制造;(2)科学的工业大数据治理框架有助于提升组织的工业大数据管理和决策水平;(3)有效的工业大数据治理能够产生高质量的数据,增强数据可信度,降低成本;(4)有效的工业大数据治理有助于提高合规监管和安全控制,并降低风险。