学术论文投稿/征稿

欢迎您!请

登录 注册

手机学刊吧

学刊吧移动端二维码

微信关注

学刊吧微信公众号二维码
关于我们
首页 > 学术论文库 > 经管论文 大数据背景下档案馆员数据治理能力建设着眼点研究论文

大数据背景下档案馆员数据治理能力建设着眼点研究论文

5

2026-01-26 16:03:10    来源:    作者:xuling

摘要:本文分析当前档案馆员数据治理面临的挑战,提出加强档案馆员数据质量管理能力、数据安全管控能力、数据开放审核能力三方面措施,从而提升档案馆员数据治理能力。

  [摘要]为响应国家政策、适应档案数据化管理趋势并满足社会公众的档案文化需求,亟须加强档案馆员的数据治理能力建设。本文分析当前档案馆员数据治理面临的挑战,提出加强档案馆员数据质量管理能力、数据安全管控能力、数据开放审核能力三方面措施,从而提升档案馆员数据治理能力。

  [关键词]大数据;档案馆员;数据治理;能力建设

  0引言

  档案数据化是当下档案馆亟待研究的重要课题,档案数据治理是未来智慧档案馆发展的重要模式。档案数据治理是推动档案馆从传统档案馆走向智慧档案馆,实现档案事业高质量发展的重要环节。大数据背景下,档案馆员数据治理能力建设是检验档案事业高质量发展的重要标准。2021年中办国办印发了《“十四五”全国档案事业发展规划》(以下简称为“十四五”规划)[1],该规划在发展目标中要求档案信息化建设要再上新台阶,新一代信息技术要在档案工作中广泛运用,信息化与档案事业各项工作要深度交融,档案人才队伍要取得新发展。2023年度全国档案主管部门和档案馆基本情况摘要中显示,各级档案主管部门现有专职人员博士研究生占0.04%,硕士研究生占2.29%,学士学位本科生占12.28%;学士学位以上的人数占总人数的15%不到。根据档案馆数据化的要求及档案馆员队伍建设的现实需求,档案馆员数据治理能力建设需要更多关注。

  1大数据背景下档案馆员数据治理能力建设的必要性

  1.1国家政策战略导向要求

  自2014年我国《政府工作报告》中首次提出“大数据”一词,大数据便深入各行各业。2015年国*院印发《促进大数据发展行动纲要》对我国大数据产业的发展做出了全局性规划。从“十三五”规划建议实施国家大数据战略到“十四五”规划建议建设数字中国、打造数字经济,政策的细化可以发现国家对大数据产业的重视,大数据产业高速发展成为大势所趋。2023年国*院办公厅印发《政务服务电子文件归档和电子档案管理办法》明确提出,各级政务服务机构应当推动完善政务服务办理系统归档功能,积极推进电子档案管理信息系统建设,还应当依托全国一体化政务服务平台,积极推进政务服务办理系统与电子档案管理信息系统衔接,支撑政务服务电子文件和电子档案全流程管理。大数据对档案归档流程、归档速度都提出了新要求,以上相关政策的出台表明档案工作要全面纳入国家大数据战略。档案工作的新政策向档案馆员们提出了新要求,档案馆员需积极融入国家大数据战略,提供*案信息资源服务。在此政策导向趋势下,档案馆员数据治理能力也应有所创新,提供高质量档案数据管理和服务,参与档案数据平台建设。

  1.2档案数据化管理需要

  随着数字化时代的到来,档案管理者既面临着纸质档案的保存,又面临着海量档案数据资源的管理。档案作为国家珍贵资源,是大数据治理过程中相当重要的一部分,也是强化国家治理能力的助推剂,档案管理工作的优化升级势不可当。档案数据资源由于其外在形式多样、形成主体多元和在计算机环境下易操作等特点,正逐步成为档案管理工作的主要对象。档案管理对象的变化直接导致档案管理工作的模式必须有所改革,同时海量数据的积累和“档案数字资源和传统档案具有同等效力,以电子形式作为凭证”[2]的提出,也进一步推动了传统档案管理向档案数据化管理发展。数据化管理模式下,档案馆员的职责也随之调整,档案数据治理的职能也随之转移到档案馆员身上。数据治理为数据管理提供了指导方针和规则,确保档案数据质量和安全。因此,档案馆员需要对档案数据资产管理进行指导和监督,包括档案数据政策、规则和程序的制定,档案数据知识组织,档案数据合规使用和开放审核。良好的数据治理和数据管理实践有助于提高数据资产的价值,并促进其在组织内部的有效使用。档案馆员数据治理能力关系着档案现代化工作的效率和连贯性,关系着档案数据的分析与整合,关系着档案数据管理平台的流畅与完善运行。综上所述,档案馆员数据治理能力建设是档案馆人才队伍建设的重要课题。

57790c74c2c42e3a95f3f42c5f0d7012.png

  1.3社会公众档案文化关注需求

  档案作为历史文化资源的重要组成部分,其开发、保管和利用受到了广泛关注。社会公众对我国独有文化遗产的关注程度日益提升,档案馆员因此能够参与到具有社会责任和文化内涵的工作中。档案馆员需要负责收集、整理、保管、统计、编研和利用文化遗产资料,以保证珍贵的档案数据资源不会因时间的流逝而被破坏或消失,为社会保留集体记忆。通过新兴的信息技术,将档案数据资料编纂成能够便于公众汲取的形式,能够促进我国优秀文化的传播和推广。档案馆员对于档案数据资源的编研能够为学者提供原始记录和数据分析,推进文化研究。他们协助教育相关工作者利用档案数据资料进行教学、研究,培育青少年对本土文化的了解和尊重。政府部门可以根据档案馆员所提供的资料来制定文化可持续发展政策。档案知识组织要求档案数据资源能够精细化分类、评析和处置,用户的个性化服务需求需要档案馆员数据治理能力适应社会公众的潜在需求。大数据时代,社会公众对档案文化高度关注,需要档案馆员提升自身数据治理能力,改进服务模式,适应时代发展,完成角色职能的进阶。

  2大数据背景下档案馆员数据治理能力面临的挑战

  2.1档案数据质量管理问题

  大数据时代,档案数据总量呈爆炸式增长,与此同时,数据冗余、数据污染、数据失真、数据孤岛等问题越来越普遍,档案数据质量问题已成为当前档案数据管理和利用中的重点和难点问题。目前档案数据质量存在以下几个方面的问题。①档案数据管理离散。我国政府部门条块化管理形式导致数据管理体系亦是条块化,政府相关部门之间缺少统一规划管理,容易形成“断头数据”。海关、工商、烟草和交通等垂直管理系统的数据能够实现内部垂直共享,但不同垂直部门之间无法共建共享数据系统,形成了“数据围墙”,很难将数据高效转化为生产力。②档案数据著录标准不一。档案数据著录建设时期不同,2022年国家档案局发布的《档案著录规则》(DA/T 18—2022)替代了1999年的版本,著录时期不同会带来数据著录语法错误和逻辑错误。语法错误是指某字段的数据与该字段表达的数据类型不符,如在该填写阿拉伯数字的数据段填写汉字。逻辑错误是指数据虽然符合数据类型的标准,但超过了实际范围,如档案入库时间晚于出库时间。③档案数据著录重复。其包括馆内重复和馆际重复。馆内重复是指上级发文和本级批转文件等造成的档案重复。随着大数据的发展,电子文件数量激增,同时重复率也进一步上升,这就会导致档案来源的不确定,进而造成档案管理的不便。馆际重复是指不同层级档案馆之间档案的重复。这不仅会造成档案馆藏数据的偏差,还会增加档案管理的工作负担,提高管理成本。④档案数据时效性滞后。我国对于开放档案有较长的时间限制,公众至少需等待10年才能利用档案,这是一种天然的滞后性。此外,档案数据鉴定与开发利用耗时较长,也会导致档案数据时效性的滞后。大数据时代下,公众对档案数据时效性的要求更高,期望能够及时将档案数据价值转化为生产成果[3]。档案数据质量是一个长期存在的问题,关系到档案数据资料的鉴定、编研和开放利用。

  2.2档案数据安全管理问题

  随着档案数据化进程的不断推进,档案馆员面临着档案数据资源安全、隐私保护和数据监管等管理问题,包括隐私泄露、云存储数据泄露和数据损毁。隐私泄露的风险主要指电子档案中包含档案形成者的大量隐私数据,如电子病历档案中囊括了该患者全部就诊信息和治疗数据。这类数据一般会被存放于云端,导致云端服务商获得访问权限。而经过调查可知,当前提供云端服务的商户具有“半诚实”的属性[4],其可以在不违反协议的前提下尽可能挖掘用户隐私数据。此外,从电子档案中获取的数据部分会被用来进行统计,最后成文发布以供民众对某些信息的现状与发展进行了解。由于这些数据的公开,有人可能利用数据差距推断出某些特定群体的隐私,这也是一种隐性数据泄露。云存储数据泄露是指信息窃取者和数据形成者主要关注用户隐私数据,而忽视了整个档案数据的安全性和机密性。一旦数据被保存至云端,用户对数据的监控能力就大幅减弱了,难以保障其安全性。数据损毁风险指的是当数据传至云端后,由于监管性的降低,不法分子可能监听、窃取或破坏数据,造成数据系统完整性与可使用性的下降[5]。档案馆员通常具有较强的档案数据安全意识及相关知识,但在档案数据挖掘、分级保管、加密技术、数据防篡改、伪造等安全能力方面较为缺乏。在档案数据全生命周期监控状态下,档案馆员如何及时采取数据屏蔽、数据匿名化等有效措施,将风险降至最低,尽可能地挽回损失;如何制订并执行灾后恢复计划,确保档案数据能够在尽可能短的时间内完成恢复;这些问题都是档案馆员在档案数据安全方面面临的重要课题。

  2.3档案数据开放审核问题

  当前受大数据发展和新档案法要求的影响,不同层级档案馆(室)都面临着一个重大挑战——档案数据开放审核。主要表现在四个方面。①开放审核工作量激增。新档案法实施后,档案封闭期限由30年缩短为25年,大量档案数据需要重新审核鉴定,开放利用服务压力加大。随着馆藏数量的增长、档案信息化建设的发展,存量纸质档案数字化率逐年提升,增量电子档案接收逐渐常态化,各级综合档案馆都面临待审核档案体量日益增大的问题[6]。②档案馆开放职责深化。新档案法中明确规定档案馆如违反开放利用条款将可能被严肃追责,这使档案馆必须更加重视档案开放审核工作,并提供优质的档案开放利用服务。③档案开放审核工作协同要求提高。新档案法对档案馆和档案形成机构在开放审核工作的职责方面作了明确划分,指出档案形成机构承担直接责任。但这对档案形成机构来说是从零开始工作,这就需要档案馆和档案形成机构通力合作,共同推进档案开放审核[7]。④开放审核专业力量不足。实践中,各级档案馆并未严格执行《地方各级档案馆人员编制标准(试行)》,普遍存在档案工作业务领域扩大、工作量激增,而档案馆员数量不变甚至编制不足的情况。档案开放审核要求档案馆员具有专业的数据审核技能,逐年增加的档案审核量和人工智能审核技术的引入,都要求档案馆配备专业的开放审核人员,这与各级档案馆现有的人员配置不相适应。

  3大数据背景下档案馆员数据治理能力建设着眼点

  3.1保障档案数据质量,加强档案馆员数据质量管理能力

  档案馆员数据质量意识是影响档案数据质量的直接原因。因此,档案馆员应提升档案数据意识,意识具有指导实践改造客观世界的作用。档案馆员需积极参与学术研讨活动,逐步增强其计算思维和档案数据质量控制意识,做到明确档案数据的收集范围,规范数据存档[8]。档案馆员数据质量管理能力可从以下三个方面加以提升。①档案数据处理技术。档案数据处理技术包括元数据的采集、融合和著录等技术以及数据识别、管理等查验技术。元数据采集、著录过程中需注意档案数据的规范标准,确保收集数据的标准性和有效性。在大数据时代,档案数据查验技术迭代较快,数据数量增加迅速和结构复杂,使用单一元数据标准进行管理会导致档案数据质量问题,档案馆员需要注意档案数据的分类整理以保护档案数据质量。②档案数据存储技术。档案数据存储技术包括档案载体存储技术和档案数据内容存储技术。档案载体存储既要保障档案库房安全和档案载体安全,还需保障档案数据载体、档案数据存储载体环境安全。档案数据内容存储技术是指由于档案数据生成空间的扩张,档案的来源已变得不准确,档案馆员需配合有关部门建立相关整合平台,将不同地区和层级档案馆(室)中所藏的档案集中在该系统中,打破“信息孤岛”,保证档案的一致性和完整性,从而提高档案数据质量[9]。③档案数据清洗技术。档案数据清洗技术是破除数据冗余的关键技术。该技术利用筛选、清洗和转码等操作手段在数据收集和整理阶段将数据的核心保存下来,保证其真实性、完整性。档案馆员在档案数据利用过程中,要注意数据异常值检测和处理、缺失数据处理和噪声数据处理,提升数据投送精确度,为每一位寻求档案数据服务的用户提供针对性服务[10]。由于档案数字化、数据化工作量较大,部分工作被外包给相关机构,但外包机构所交付的成果往往不尽如人意。档案馆员从以上三个方面掌握数据质量管理能力可加强监督,对档案数据化全过程进行掌控,量化评价标准,保证档案数据质量的稳定性和优良性[11],从而建立档案数据质量问题追责机制。

  3.2培养数据安全意识,加强档案馆员数据安全管控能力

  大数据时代下,档案馆员数据安全管控能力需要从数据安全意识和安全把控能力两个方面培养。档案馆员需具备数据安全意识,并掌握数据安全技能,才能服务档案数据安全体系和数据安全风险评估。数据安全意识需要档案馆员在获取、保存、分析、处理、利用数据过程中具备安全管理意识、能力和伦理,能够在较长时间内使档案数据处于高度安全的环境之中。在档案数据收集阶段,规范档案馆员档案数据格式意识,载体设备尽量避免利用虚拟化技术建设、共享档案数据,保障档案数据载体安全性。在档案数据存储阶段,加强档案馆员有意识地对存储于云端的数据进行控制,防止非授权用户获得数据访问权限,过滤出危险性较强的访问申请,并要求云端提供*案数据的存储证明[12]。在数据备份意识方面,培养定期对档案数据进行备份的意识,在云端崩溃时仍能保护档案数据,使其及时恢复,为用户提供服务[5]。在档案数据处理阶段,培养档案馆员具备宏观的档案数据意识,快速且精确地采集到所需的有效信息,能够帮助档案馆员更好地分析和处理档案数据资源,进而能够为用户提供更优质的服务。在档案数据利用阶段,档案馆员只有具有较高的数据意识才能清晰了解数据的完整性,精准了解某一主题数据,知道数据在哪里,谁拥有这些数据,谁可以利用这些数据,以及该数据的共享范围是多少。档案馆员数据安全把控能力培养需要馆员具备维护档案数据不同阶段安全的能力。在最初传输阶段,要利用加密技术隐藏传输通道,以保证其安全性;在存储阶段,需要馆员配合专业人员共同建构防火墙,避免外界不法分子的侵袭,形成相对封闭的互联网格子,降低人为造成的档案数据安全风险;在公开阶段,则需要对利用者进行评级,随后提供相应等级的利用权限,对于长期未要求档案利用服务的用户进行身份认证,保证该用户的权限并未转移;在利用阶段,培养预判风险的能力,将异地备份、实时备份、完全备份和增量备份等常态化,尤其是针对新进馆的档案数据资源要及时鉴定备份[9]。

  3.3强化数据治理能力,提升档案馆员数据开放审核能力

  大数据背景下,档案开放审核工作是档案馆各项基础业务工作中政治性、政策性、专业性较强的工作之一。在公众利用档案数据需求增大的情况下,档案馆员数据开放审核能力可从以下三个方面提升:①加强档案开放审核人员数据能力建设。智能化开放审核是未来档案开放审核的重要方向,开放审核人员的信息技术能力及现代化设备是智能化开放审核的重要保障。档案馆员应强化开放审核机制理论知识学习,持续提升自身在档案开放鉴定和开放审核方面的综合管理业务素质,强化与国家档案馆和各级档案馆的联系,保持馆际人员业务交流,相互提供先进的理论技术和有成效的实践经验,拓展档案馆员的视野,并为其知识体系添砖加瓦,明晰其解决鉴定和审核等方面问题的思路。②加强区域数据治理人才队伍共建共享建设。通过打造跨区域人才共享专家库,实现机关档案室、企业、高校档案馆等机构档案开放审核实践联动。通过档案开放审核实践工作经验总结,运用学习数据审核规范和工作标准,制定档案开放审核内部规则,细化档案馆的档案类型和内容倾向,列举不予开放的情况。③建立档案开放审核人员资质考核制度。档案机构应建立档案开放审核工作人员资质考核制度,对档案开放审核工作人员实行专业的资格认定评选。档案开放审核人员除了学习计算机科学、信息技术等方面的专业知识,更重要的是熟练运用各种新兴大数据技术,提高档案开放审核的效率,为用户提供高质量服务。

  4结束语

  大数据背景下,专业的档案人才队伍具备专业知识和数据技能,才能更好地适应数据量剧增的档案工作。本文以档案馆员数据质量管理能力、档案馆员数据安全管控能力、档案馆员开放审核能力三个方面为着眼点,提出增强档案馆员数据治理能力。在国家文化数字化背景下,档案人才队伍建设是档案事业发展不可或缺的一环。档案馆员必须不断学习和实践,提升自身数据治理能力,以推进档案数据资源管理工作的开展,最大限度地发挥档案的价值。

主要参考文献

  [1]中共中央办公厅,国*院办公厅.中办国办印发《“十四五”全国档案事业发展规划》[Z].2021.

  [2]中华人民共和国档案法[Z].2020.

  [3]吕姗姗,周枫,金波,等.档案数据质量问题表征与影响因素研究[J].情报科学,2024,42(10):16-23.

  [4]李詹宇,朱建明.数据挖掘隐私保护综述[J].信息安全与技术,2012,3(9):47-51.

  [5]戴玲,彭延国,彭长根.大数据环境下的电子档案信息安全问题及对策[J].兰台世界,2015(29):25-26.

  [6]边晓琳.求索创新之道推动档案开放破局前行[J].档案天地,2024(10):6-8.

  [7]曾毅.档案开放审核协同机制研究:基于新修订档案法的视角[J].浙江档案,2021(8):26-28.

  [8]周林兴,崔云萍.大数据视域下档案数据质量控制实现路径探析[J].档案学通讯,2022(3):39-47.

  [9]周林兴,林凯.大数据时代档案数据质量治理:因素、框架和路径[J].档案学研究,2023(2):111-119.

  [10]魏丽维.大数据时代档案数据质量控制研究[J].兰台世界,2024(2):69-71,74.

  [11]聂云霞,肖坤.数字人文视域下档案学专业学生数据素养培育探析[J].档案学通讯,2020(3):95-103.

  [12]陈兰香,许力.云存储服务中可证明数据持有及恢复技术研究[J].计算机研究与发展,2012,49(增刊1):19-25.