工业AI的失败陷阱：为什么标准化数据模型比算法更重要？-工业AI频道

　　在制造业中部署AI，一个重要的失败原因是数据结构不一致。预测性维护、质量分析和数字孪生都依赖于标准化、版本化且语义一致的数据模型。主数据模型定义了制造数据的含义、单位、层级和治理，使AI系统能够无须猜测地理解数据。缺少这一基础，数据分析体系将脆弱易崩，系统集成成本激增，工厂间的数据对比也将失效。

　　制造业数据模型的特点

　　制造业中的数据模型与企业系统中的数据模型略有不同。企业应用中的数据模型通常是软件系统及其数据元素的示意图。它最常用于可视化进出数据库中各个元素的流动。

　　制造系统中的数据模型定义了生产控制系统中相互关联的一组元素。例如，泵维护的数据模型可以组织一组泵的循环计数、运行时间、能源使用、资产识别和位置数据。

　　制造业数据模型可以很简单，也可以非常复杂。如果单一温度满足数据产品消费者的需求（包含实际数据的数据模型实例），就可以算作数据模型。复杂的数据模型可以包含数十甚至数百个相关元素，按层次组织。层级数据模型用于描述元素之间更复杂的关系。

　　标准化数据模型对智能制造的重要性

　　部署了全公司范围标准化数据模型的智能制造系统更易于维护、扩展，并能降低集成成本。标准数据模型使AI系统能够轻松处理数据、理解其上下文并提供合理的分析判断。依托不统一、定义模糊的数据开发的应用程序，稳定性差、易故障，且维护难度极大，甚至无法维护。

　　缺少标准化数据模型，智能制造系统便无法成功落地，应用程序无法正确地使用数据。举个最简单的例子：数值 “50” 可代表50摄氏度、50赫兹或50磅/平方英寸。没有数据模型，应用程序只能依靠其他先验方式解读数据。这类隐性定义缺少文档支撑，难以拓展至其他应用，极易因数据误读造成生产混乱。

　　架构师应如何搭建制造数据模型？

　　数据建模需从企业的专属需求 —— 亟待解决的实际问题出发。可围绕设备运行时长优化、损耗降低、运维升级等企业核心问题与优先级目标，搭建对应数据模型。

　　建模时，先梳理运营及管理团队的决策需求，反向推导支撑决策的全部核心数据项；明确所需数据后，逐一确定每个模型元素的名称、计量单位、数据类型及语义。例如，将 “Temp21” 规范定义为 “21 号烘箱当前温度（华氏度），整数类型”。此类数据模型可为数据采集设备提供模板，实现原始物理信号向模型所需数据的转换。

　　什么是元数据，为何它至关重要？

　　元数据（有时称为属性）是静态的描述性信息，能够更全面地理解数据元素。大多数生产控制系统中的数据元素本身完全无法解码（寄存器40202）或大多数数据无法解码（标签Speed44）。没有元数据，这些数据元素通常无用，除非依靠隐性知识或外部方式传递信息。

　　元数据分为多种类型：

　　●描述性元数据：如“2区压力”；

　　●结构性元数据：如数据类型、最大/最小值、数组维度；

　　●管理性元数据：如最新读取时间、显示名称、厂区名称。

　　元数据为静态信息，可在创建数据模型时添加，或在通过生产控制系统标签完成模型实例化时补充。创建模型时已知的元数据需直接绑定；控制团队掌握的其他元数据，需在模型实例化阶段配置。

图1：图示为包含静态数据的泵数据模型部分列表。

　　数据模型是如何组织的？

　　数据模型是简单的层级列表，包含数据元素和静态元数据。图1展示了用JSON格式编写的泵数据模型的一部分。泵部分包括身份、资产和价值部分，每个部分都通过创建数据模型时已知的元数据进一步描述。

　　虽然JSON是组织制造数据模型的较好方式之一，但模型通常通过多种不同的机制实现：

　　●在可编程控制器中，模型使用用户定义类型（UDT）来组织。

　　●在数据库中，模型使用定义每个表内容的模式来组织。

　　●在Excel表格中，列的组织方式是连续列表示层级结构。

　　●在文本文件中，模型通常使用JavaScript对象表示法（JSON）来实现。

　　数据模型必须放置在每个应用用户都能访问的地方。没有数据治理规则规定模型应如何组织，但包含这些主数据模型的文件必须对每个想使用它们的应用程序开放。将数据模型集中存储，便于架构师统一维护，且模型更新时可实现版本管控。

　　制造系统中使用数据模型的十项建议

　　1. 搭建适配企业生产的全域标准化模型

　　采用贴合行业及企业专属生产场景的标准化模型，在全厂区、全企业内开放共享，保障系统互操作性。若模型仅内置于应用程序、未执行标准化，将造成企业效率低下、系统混乱。

　　2. 采用标准协议与开放应用程序接口（API）

　　标准化可减少信息歧义、提升可维护性、消除定制化系统带来的混乱。ISA‑95、ISA‑88、OpenAPI、ISA‑101、PackML 等行业标准，构建了连接工厂各系统的通用语言与模型，规避非标准化数据传输引发的问题。

　　3. 围绕生产运营优先级定义数据模型

　　数据模型的最终用途是优化制造生产系统。需以终为始，明确待解决问题、所需数据项，再据此搭建数据模型。

　　4. 明确数据归属与治理规范

　　数据的含义在整个企业中必须清晰一致。各部门使用不同数据模型，等同于采用不同的设备综合效率（OEE）计算公式，将引发运营混乱。需指定团队或专人管理数据模型，负责变更管控、审批流程及全生命周期管理。

　　5. 做好数据模型安全防护

　　数据模型是制造运营的核心，需严格管控模型写入权限，同时广泛开放读取权限。

　　6. 摒弃数据模型固定不变的思维

　　数据模型和制造运营一样，并非固定不变。会添加新模型，修订旧模型，并移除不再适用的模型。为所有数据模型添加标识、描述和版本控制的元数据。

图2：在第1层和第2层开放时序数据具有应用价值

　　7. 同时搭建事务型与时序型数据接口模型

　　传统系统仅在架构第三、四级层级搭建事务型接口模型（见图 2），而在第一、二级层级开放时序数据采集模型同样具备价值。时序型与事务型数据模型可参考通用落地建议，也可采用独立主数据模型；第一、二级模型需包含全部PLC用户定义类型（UDT），保障AI系统识别对应时序数据。

　　8. 提供标准化的数据模型访问方式

　　当有标准API可用于访问数据模型时，集成可以得到简化。一致的标准API很难实现。相反，可以使用Swagger等工具（针对OpenAPI）来记录同步API，并实现对底层数据的标准访问。AsyncAPI是另一种工具，可以记录事件驱动架构（EDA）中的异步API。

　　9. 在模型创建与实例化阶段配置元数据

　　创建数据模型时已知的任何元数据都应纳入其中。在实例化时，应将源自控制系统团队知识的一组标准元数据包含在模型中。诸如死区、使能状态、时间值质量、度量单位等元数据对AI数据模型极其重要。

　　10. 在全企业范围统一命名、单位、时间格式与语义标准

　　不统一的标准与语义会破坏系统互操作性，引发隐性故障与AI幻觉问题。例如 “Oven21Temp” 与 “Oven_21_Temperature” 命名格式不一致，可能会直接导致AI模型失效。

　　AI并不能创造制造业洞察，它依托于结构化信息并返回分析结果。如果底层数据不一致、无文档记录或是隐式定义的，那么无论分析看起来多么先进，其结果都将不可靠。

　　2026 年智能制造的核心，并非AI算法，而是定义了数据含义、上下文、结构与访问方式的标准化制造数据模型。

　　搭建企业级主数据模型、统一元数据规范、通过标准化接口开放模型、依托严谨架构做好安全管控的制造企业，可打造出易维护、可拓展、适配AI的生产系统。那些依赖隐式定义、分散的模式和嵌入应用程序的模型的制造商，创建出的将是脆弱且无法扩展的集成。

　　在制造业应用部署AI时，可以遵循以下简要的实施清单：

　　●梳理企业核心业务决策需求；

　　●搭建支撑决策的结构化、标准化数据模型；

　　●在模型创建与实例化阶段配置完整元数据；

　　●集中存储模型并做好版本管控；

　　●通过安全、适配IT技术的接口开放模型；

　　●将模型与实例化后的具体数据产品深度集成。

　　如果没有标准化的数据模型，AI系统就必须推断上下文。推断会引入误差、漂移和不可靠的预测。当制造数据经过合理建模与架构设计，AI系统便可精准运行，不再依靠主观推测。业务洞察始于严谨的数据建模，而非算法本身。

工业AI的失败陷阱：为什么标准化数据模型比算法更重要？

NI Connect 2026：打造“AI就绪”的平台，重塑测试测量的生产力

【前50名免费】2026首届工业人工智能大会今日门票开抢！

AVEVA 2026工业AI新趋势：打通IT/OT数据生态，将AI无缝嵌入工业运营

热点新闻

推荐阅读

热点新闻