工程数据治理过程中多维度数据资产管理研究论文

2024-09-29 12:01:55 来源: 作者:dingchenxi
摘要:数字化时代,工程领域的数据规模和复杂性不断增加,因此有效管理工程数据资产至关重要。作为企业数字化转型的重要环节,多维度数据资产管理能够有效控制、保护、提升数据资产的价值。
摘要:数字化时代,工程领域的数据规模和复杂性不断增加,因此有效管理工程数据资产至关重要。作为企业数字化转型的重要环节,多维度数据资产管理能够有效控制、保护、提升数据资产的价值。文章围绕多维度数据资产管理在工程数据治理过程中的应用展开研究,以石油工业设备设施完整性管理项目为例,在阐述基本概念以及应用现状的基础上,探讨了数据资产管理的流程、工具、关键技术,以期为企业数字化转型奠定基础。
关键词:工程数据治理;数据资产;多维度;石油工业
0引言
近年来,随着工程领域数据规模的爆炸式增长,工程数据治理成为提高工程项目效率和质量的关键要素[1]。工程领域的数据涵盖了从设计到施工再到维护管理的全生命周期,但数据来源的多样性、数据格式的差异、数据量的庞大以及数据价值的不确定性,使得工程数据治理变得复杂而困难[2]。因此,引入多维度数据资产管理的概念和方法,对实现工程数据的高效治理具有重要的意义。
1数字资产管理基本概念
所谓的数据资产指的是能够为企业带来经济效益的资源,数字资产管理通过开发、执行数据相关的方案、政策、项目、流程、方法,控制、提升数据资产的价值,其本质在于“盘活”数据并释放其附加价值。
多维度数据资产管理将数据资产视为组织的重要资源,并通过多维度的管理方法来实现数据资产的全面管理[3]。多维度数据资产管理的原则为:(1)数据分类与标准化。通过对工程数据进行分类和标准化,可以提高数据的可管理性和可重复性,从而支持数据的有效整合和分析。(2)数据质量管理。通过建立数据质量评估体系和数据清洗流程,可以提高数据的准确性、完整性和一致性,并确保数据质量符合工程项目的要求。(3)数据安全保护。通过制定合适的数据访问权限和数据安全措施,保护工程数据的机密性和完整性,防止数据泄露和不当使用。(4)数据价值最大化。通过对工程数据进行深度分析和挖掘,提取有价值的信息和洞察,为工程项目的决策和优化提供支持。
2工程数据治理过程中多维度数据资产管理现状
随着新一轮科技革命的深化,各个行业纷纷开启了数字化建设的进程。在数字智能时代,中国海油加快推进数字油田、智能油田建设。下文以油气田设备设施完整性管理信息化建设为例,对其数据资产管理现状进行阐述。油气田在开发生产过程中已积累起数量庞大、系统来源复杂的设备设施完整性管理相关数据,需要对大量的数据进行管理和应用。设备设施完整性管理面对的数据治理关键问题有:(1)总部难以掌握不同业务数据的全貌,数据资产家底不清;(2)不同子业务数据之间存在断裂、缺失、结构化程度低、标准不统一等情况,无法从设备设施视角将数据进行串联和共享,积累的数据未能发挥出应有的协同价值[4]。
油气田设备设施完整性管理信息化建设面临的问题有:(1)数据分散,信息割裂。设备设施完整性管理是一个完整的全生命周期链条,从设备设施基础信息、维修执行、变更管理、停工大修、风险及隐患处置到设备设施退役及延寿。各个环节之间密切相连,但当前设备的维修数据、设备基础信息数据、检验检测数据、风险数据、变更数据、事故事件数据等,散落在不同的应用系统内,并且数据存在结构化表单、线下Excel、线上PDF等不同格式,围绕设备的数据全链条无法建立起来,导致业务执行全过程无法跟踪,进度无法监控,影响了设备设施的全过程、全生命周期综合分析,并对进一步完整性管理提升造成影响。(2)重复存储,质量欠佳。各业务均存在不同程度的数据重复录入、重复存储现象。在不同系统中,设备基础信息的字段、格式等由于录入方式、业务需求不同,容易造成数据不一致现象,且录入工作量大,数据共享、利用效率较低。此外,受人力资源紧张等问题的影响,无法及时对设备变更后的数据在系统内进行更新,导致出现数据准确性、及时性无法保证。(3)碎片管理,缺少体系。当前设备设施完整性管理缺少针对数据的统筹管理,尚未形成完整管理体系,易造成各自为政、分散管理的局面[5]。
3数据资产管理流程及关键技术
3.1数据资产管理流程
3.1.1数据资产盘点与识别
结合数据标准建设要求,全面了解数据资产资源,梳理现有数据资源保存和管理现状,了解数据内容、格式、来源、数量、采集方式、硬件设备等。设备设施完整性管理信息化建设需要标准化的数据范畴,包括设备设施数据(部分数据)、法规标准数据、计划与调度数据、检维修执行数据、事故事件与隐患数据、分析决策数据。需要建设的数据标准包括结构化数据标准部分(例如工单、事故记录等数据表的标准)以及非结构化部分(即文档、报告、图片等标准要求)。为保证与公司设备设施相关数据标准保持一致,以便未来进行对接统筹,结构化数据部分沿用公司数据标准的规范模板。非结构化部分标准则更注重于规范文档、图片的系统录入格式以及编码、命名规范,可参照现有工程类文档的管理方式。
3.1.2数据资产目录管理
数据资产目录是一个用于管理和维护组织内部数据资产的工具或系统。它用于记录和跟踪所有数据资产的信息,包括数据的来源、存储位置、质量、用途、安全性等。通过构建统一、完善的数据资产目录,促进数据共享和流通,支持数据的统一规范展示和便捷查询,方便油田业务人员了解油田数据资产,并快速定位所需数据,实现油田各专业、各类型数据资源共享,提升对数字化转型的促进作用。油田开发生产业务发展加快了数据膨胀的速度,也带来数据不唯一的问题,可通过数据资产目录明确数据定义和产生源头。数据资产目录管理能够为应用系统提供清晰、条理、全面的数据内容来源,从而更好地产生价值,提升油田企业的经营决策和科学研究水平。
数据资产目录具体工作步骤如下:(1)搭建数据目录体系框架,从业务、技术和管理等维度构建企业资产目录框架。(2)建立对应关系,根据数据分类框架、数据标签体系,将各数据项梳理对应到目录框架下。(3)发布数据资产目录,业务视角、技术视角等方面发布企业资产目录,为业务人员、数据分析人员、软件开发人员、数据管理人员提供数据检索和查看。(4)目录更新机制。建立数据资产目录更新机制,及时根据元数据、数据分类框架、数据确权等变更情况更新目录分类框架及映射关系。(5)完善配套工具,为企业提供多种维度的全域数据资产目录,提供覆盖主数据、业务数据、指标数据等多种数据资源目录,并支持多种维度的标签创建,实现企业数据资源的快速发现和定位。
从业务、技术、管理等视角构建数据资产目录框架,以业务、机构、主题、对象、数据类型五个维度发布数据资产目录。如图1所示,业务部门负责从业务维度制定资产目录框架,按照目前油田业务管理现状,基于管理流、业务流、监督流一体化思想,从油田业务管理流程出发,梳理业务流和数据流,形成设备设施完整性管理业务分类。L1业务类为设备设施完整性管理域,L2主题域包括设备设施、计划与调度、检维修执行、事故事件与隐患、财务预算、法规标准、人员与承包商、项目管理、分析决策等,在此基础上明确L3业务对象、L4逻辑数据实体以及对应的L5数据属性,并搭建目录框架。其中,业务对象是业务领域中重要的人、事、物对象,承载了业务运作和管理涉及的重要信息,具有独立性、唯一性、相对稳定的特点。按照业务域、主题域逐级梳理其所属业务对象,对每个业务对象进行定义,并明确其来源、描述其业务活动、执行单位以及业务对象数据。在业务对象描述基础上,对其所属逻辑数据实体进行梳理,对每个逻辑数据实体进行定义。基于业务、技术两方面,制定数据的属性、定义、来源、责任主体等标准,形成规则统一、定义一致、归属明确、可复用的数据标准全集,支撑集团、板块、企业数据资源中心数据资产梳理及落地,规范信息化项目设计与建设。
结合数据分类框架和数据确权成果,由信息部门将可以作为数据资产的数据项、数据表划分到相对应的资产目录框架中,建立与资产目录的对应关系。由信息部门将数据表和数据项对应到资产目录框架后,提交数据治理专家组进行审核,发布油田业务数据资产目录。信息部门制定相关的数据资产目录发布更新机制,信息部门及时将变更的数据项、数据分类框架、确权信息等内容提交至业务部门确认,由信息部门和业务部门共同维护数据资产目录,保障数据资产目录的真实性和时效性。信息部门提供多种维度的全域数据资产目录,提供覆盖主数据、业务数据、指标数据等多种数据资源目录,并支持多种维度的标签创建,实现企业数据资源的快速发现和定位。并提供可视化的数据资源统计,支持按组织机构、数据类型、数据源的资源分类统计,支持数据冷热度分析和数据质量评估指标统计。
3.1.3数据资产评估
数据资产评估指的是对数据资产进行认定,在此基础上进行分级管理并优化资源配置,优先保证高价值数据资产的应用。数据资产的价值不仅体现在现有数据方面,更表现在未来可以更新、扩充的能力。此外,数据价值还取决于应用场景。数据资产的价值受多种因素的影响,目前业内多从成本维度、质量维度、应用维度、风险维度等角度对其进行评估。由于不同评估方法具有其适用性,需要结合评估对象的特征选择合适的评估方法,如专家调查法、环比评分法、层次分析法、主成分分析法、熵权法等。
3.2数据资产管理关键技术
(1)基于机器学习的自动化。设备设施完整性管理数据资产具有极高的体量规模以及内生关联度,基于人工的管理和维护方式工作量极大。引入及其机器学习方式实现智能自动化,能够有效地提升数据管理效率,提升数据校验的精准程度。元数据发现、数据资产分类等机器学习的常用应用,能够从数据使用、场所等多个角度推断元数据的更新,并通过指标和组合,构建预测模型,对采集数据实时监测,判断其指标是否在合理波动范围内,实现感知—反馈—优化的良性循环。此外,通过信息提取、机器学习,对数据资产进行分类索引,实现数据的高效查找和使用。(2)知识图谱。常规树形结构目录难以描述数据之间的复杂关系,具有网状结构特征的知识图谱能够更好地表达数据之间的内生关系,是更好的数据组织方式。应用知识图谱技术,将现有数据与AI任务有效衔接,由已知知识产生新的知识,进一步丰富现有数据资产的内涵。(3)数据编排。数据编排技术提供对标准数据的访问能力,并抽象对异构数据存储的访问,减少了使用数据前手工显式复制数据的过程,降低了数据使用前的准备工作。此外,通过缓存、预取等手段加速数据访问,提升了数据访问的效率和准确性。在设备设施完整性管理数据资产应用领域,数据资产目录与数据编排服务二者相互协同,能够实现异构跨域目标数据资产的统一访问。
4结语
数据资产管理的实施能够帮助企业提升数据资产价值,是企业数字化转型的重要体现。选取设备设施完整性管理业务为研究对象,围绕多维度数据资产管理在工程数据治理过程中的应用展开研究,对企业部署数据资产管理有一定的参考价值。
参考文献:
[1]尚晶,胡清源,孙丽娟.数字生态下的数据资产管理实践[J].电信工程技术与标准化,2022,35(4):25-32.
[2]张晓光.中国石化数据资产管理研究[J].石油化工管理干部学院学报,2021,23(2):31-35,40.
[3]赵哲.企业数据资产治理与管理[J].科学与信息化,2022(1):187-189.
[4]李基亮.数据编织,简化数据资产管理[J].软件和集成电路,2022(11):40-41.
[5]黄登玺.夯实数据资产管理能力基础探索数据要素市场创新[J].中国金融电脑,2023(2):20-24.
