欢迎访问学兔兔标准下载网,学习、交流 分享 !
返回首页 |ICS 35.240.01 CCS L 67
江 苏 省 地 方 标 准
DB32/T 4608.4—2026
公共数据管理规范第 4 部分:数据治理
Specification for the management of public data—Part 4:Data governance
2026‑02‑06 发布 2026‑03‑06 实施
江苏省市场监督管理局 发 布中 国 标 准 出 版 社 出 版
DB32/T 4608.4—2026
目 次
前言 Ⅲ
引言 Ⅳ
1 范围 1
2 规范性引用文件 1
3 术语和定义 1
4 缩略语 2
5 总则 2
6 架构体系 3
7 组织管理 4
8 方法流程 5
9 运行管理 9
10 风险防控 11
附录 A(资料性) 数据治理目标和内容示例 13
附录 B(资料性) 数据模型命名与编码示例 14
附录 C(资料性) 数据质量检查规则示例 17
附录 D(资料性) 数据修正方法示例 18
附录 E(资料性) 数据转换规则示例 19
附录 F(资料性) 数据治理评价指标示例 20
参考文献 21
Ⅰ
DB32/T 4608.4—2026
前 言
本文件按照 GB/T 1.1—2020《标准化工作导则 第 1 部分:标准化文件的结构和起草规则》的规定起草 。
本文件是 DB32/T 4608《公共数据管理规范》的第 4 部分 。DB32/T 4608 已经发布了以下部分: ——第 1 部分:数据分类分级;
——第 2 部分:数据共享交换;
——第 3 部分:数据开放;
——第 4 部分:数据治理;
——第 5 部分:数据异议处理 。
请注意本文件的某些内容可能涉及专利 。本文件的发布机构不承担识别专利的责任 。
本文件由江苏省数据局提出并组织实施 。
本文件由江苏省数据标准化技术委员会归口 。
本文件起草单位:江苏省大数据管理中心 、江苏省人力资源和社会保障厅 、扬州市大数据管理中心 。
本文件主要起草人:杨波 、李萍 、吴善鹏 、刘超 、花凌锋 、庄光光 、朱小燕 、刘伟 、刘瑛 、张培勇 、卢冬冬 、袁瑞红 、付港 、刘林 、钟丽娟 。
Ⅲ
DB32/T 4608.4—2026
Ⅳ
引
言
公共数据是公共管理和服务机构为履行法定职责 、提供公共服务收集 、产生的,以电子或者其他方式记录 、保存的具有公共使用价值的信息记录 。规范公共数据管理 、保障公共数据安全 ,对推动数字政府建 设 、提升政府治理能力和公共服务水平具有重要意义 。DB32/T 4608《公共数据管理规范》旨在确立公共数据管理活动准则,由以下 5 部分组成 。
——第 1 部分:数据分类分级 。 目的在于确立公共数据分类分级的规则 、方法 、流程等 ,为数据应用和保护寻找平衡点提供指导 。
——第 2 部分:数据共享交换 。 目的在于指导开展省 、市公共数据共享交换平台建设 、管理和对接 ,规范各级公共管理和服务机构的数据接入 、归集 、交换共享等工作 ,建立健全全省一体化公共数据共享交换体系,促进全省数据高效共享和安全交换 。
——第 3 部分:数据开放 。 目的在于规范公共数据开放的原则 、过程 、安全等管理要求 ,为全省公共数据开放工作提供参考指导 。
——第 4 部 分 :数 据 治 理 。 目 的 在 于 明 确 公 共 数 据 治 理 的 目 标 、原 则 、架 构 体 系 、组 织 管 理 、方 法流程 、运行管理 、风险防控等内容,为全省公共数据治理提供参考指导 。
——第 5 部分:数据异议处理 。 目的在于指导建立完善公共数据异议的“提出 、受理 、核实 、处理 、反 馈 、评价 ”的全流程闭环处理机制 ,实现异议数据的高效处理 ,在数据使用过程中不断提升数据质量和服务水平 。
DB32/T 4608.4—2026
公共数据管理规范第 4 部分:数据治理
1 范围
本文件给出了公共数据治理的总则,规定了架构体系 、组织管理 、方法流程 、运行管理 、风险防控等内容与要求 。
本文件适用于公共管理和服务机构 、数据主管部门 、公共数据运行管理机构 、从事公共数据治理的相关单位或个人开展数据治理工作 。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款 。其中 ,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件 。
DB32/T 4608.5 公共数据管理规范 第 5 部分:数据异议处理
3 术语和定义
下列术语和定义适用于本文件 。
3.1
数据治理 data governance
提升数据的质量 、安全 、合规性,推动数据有效利用的过程 。
注 1:数据治理是数据和数据系统管理的基本要素 。
注 2:数据治理涉及数据全生存周期管理,无论数据是处于静态 、动态 、未完成状态还是应用状态 。 3.2
数据生存周期 data lifecycle
将原始数据转化为可用于行动的知识的一组过程 。
注:包含数据获取 、存储 、整合 、分析 、应用 、呈现 、归档和销毁等各种生存形态演变 。
[来源:GB/T 35295—2017,2.1.2;GB/T 34960.5—2018,3.7,有修改] 3.3
数据架构 data architecture
数据要素 、结构和接口等抽象及其相互关系的框架 。
[来源:GB/T 34960.5—2018,3.5] 3.4
数据模型 data model
数据的图形或文字表示,指明其特性 、结构和相互间关系 。
[来源:GB/T 18391.1—2009,3.2.7]
1
DB32/T 4608.4—2026
3.5
数据元 data element
由一组属性规定其定义 、标识 、表示和允许值的数据单元 。
[来源:GB/T 18391.1—2009,3.3.8] 3.6
数据质量 data quality
在指定条件下使用时,数据的特性满足明确的和隐含的要求的程度 。
[来源:GB/T 25000.12—2017,4.3] 3.7
元数据 metadata
定义和描述数据的数据,提供了关于数据的结构、特征和关系的信息,有助于组织、查找、理解、管理数据 。 [来源:GB/T 18391.1—2009,3.2.16,有修改]
3.8
数据处理 data processing
数据操作的系统执行,数据的收集 、存储 、使用 、加工 、传输 、提供 、公开等过程的集合 。
[来源:GB/T 5271.1—2000,01.01.06,有修改] 3.9
主数据 master data
组织中需要跨系统 、跨部门进行共享的核心业务实体数据 。
[来源:GB/T 36073—2018,3.12]
3.10
参考数据 reference data
对其他数据进行分类和规范的数据 。
[来源:GB/T 36073—2018,3.13]
4 缩略语
下列缩略语适用于本文件 。
ADS:数据应用层(Application Data Store)
ODS:原始数据层(Operational Data Store)
DM:数据集市层(Data Mart)
DWD:数据明细层(Data Warehouse Detail)
DWM:数据中间层(Data Warehouse Middle)
DWS:数据服务层(Data Warehouse Service)
5 总则
5.1 目标
数据治理的整体目标是实现对数据生存周期的有效管理和控制,具体目标包括:
a) 价值实现:以实现数据价值或解决业务问题为目标 ,赋能数据共享 、开放 、授权运营等数据开发利用领域;
b) 运行持续:健全完善数据治理机制 、流程 、方法 、规则等要素 ,保障数据治理常态化开展 ,数据资源底数清晰 、管理有序,持续优化完善,逐步提高治理效能;
2
DB32/T 4608.4—2026
c) 合规可信:数据治理各项行为要符合国家法律法规及相关组织管理规定 ,业务流程和操作行为合规,数据治理实施环境安全可信,风险可预期可管控 。
5.2 原则
数据治理要为业务的需求与创新发展提供支撑,主要原则如下:
a) 业务驱动:以业务为核心动力 ,按照业务目标和需求 ,在数据生命周期各阶段开展数据治理活动,数据赋能业务发展;
b) 客观合理:调研分析业务和数据的现状 ,相关信息客观真实 ,结合未来目标 、当前条件(制度 、资金 、人员等因素)等情况开展数据治理工作;
c) 多方协同:数据治理涉及管理 、业务 、技术多方面主体或者不同层级的主体,各参与方职责明确,权责一致,协同配合共同开展数据治理工作;
d) 互联互通:治理形成的数据资源应互联互通 ,相关元数据 、质量管理 、异议处理等标准宜保持统
一,能够支持数据共享 、开放 、授权运营等业务发展需求 。
6 架构体系
公共数据治理架构体系包括组织管理 、方法流程 、运行管理 、风险防控等部分(见图 1),具体如下:
a) 组织管理包含组织架构 、制度规范等,是数据治理实施的基础前提;
b) 方法流程包含调研分析 、规划设计 、实施执行等,具体明确现状 、目标 、工作内容等,并落地执行,是数据治理的具体方法措施 、流程和规则;
c) 运行管理包含元数据管理 、质量管理 、运行监测 、评价改进等 ,是保障数据治理的常态化运行和持续提升的手段;
d) 风险防控包含人员管理 、业务管理 、技术管理等,为数据治理提供底线防护 。
组织架构
制度规范
运行管理
元数据管理
质量管理
运行监测
评价改进
……
组织管理 方法流程
……
公共数据治理架构体系
调研分析
规划设计
实施执行
……
风险防控
业务管理
技术管理
人员管理
……
图 1 公共数据治理架构体系图
3
DB32/T 4608.4—2026
7 组织管理
7.1 数据治理组织架构7.1.1 部门内部
参考 GB/T 44109—2024 附录 A,宜采用集中式治理组织架构,由决策层 、管理层 、执行层等组成,各岗位人员工作内容如下:
a) 决策层:本部门主要负责人 、首席数据官等组成 ,统筹本部门数据治理工作 ,决策数据治理的组织架构 、制度规范 、目标方向 、实施路线 、评价机制 、风险防控 、保障体系等事宜;
b) 管理层:本部门数据共享 、数据开放 、数据授权运营等工作机构的负责人 、联络人等组成,承担数据治理日常管理工作 ,如人员组织 、制度规范编制 、调研分析 、规划设计 、运行监测 、评估评价等工作;
c) 执行层:数据治理实施操作人员组成 ,具体开展目录编制 、数据采集 、数据传输 、数据存储 、加工处理 、开发利用 、异议处理 、数据申请 、数据审核等工作 。
7.1.2 跨部门
参考 GB/T 44109—2024 附录 A,宜采用混合式治理组织架构 ,同一层级部门间跨部门数据治理组织架构按照行业主管部门 、数据主管部门 、公共数据运行管理机构划分,工作内容如下:
a) 行业主管部门统筹制定本行业公共数据治理制度规范 ,推动本行业公共数据源头治理 ,明确本行业数据质量标准 ,做好常态化数据资源更新维护 ,确保数据准确 、完整 、及时 、有效 ,汇聚数据资源至公共数据运行管理机构,及时处理本部门数据异议;
b) 数据主管部门统筹制定本区域内数据治理制度规范 ,统筹数据资源整合共享和开发利用 ,监督评价行业主管部门数据质量,以及数据共享 、开放 、授权运营工作开展成效;
c) 公共数据运行管理机构建设跨层级 、跨地域 、跨部门 、跨业务 、跨系统的数据互联互通机制和能力 ,协同行业主管部门开展数据综合治理 、数据共享开放 、数据异议处理等运行管理工作 ,监测行业主管部门源头数据治理 、数据应用服务情况;
d) 行业主管部门和数据主管部门 、公共数据运行管理机构协同构建沟通协调机制 ,共同推动数据全生命周期管理;
e) 同一层级行业主管部门之间数据治理 、互联互通通过本层级公共数据运行管理机构实现 。
7.1.3 跨层级
参考 GB/T 44109—2024 附录 A,跨层级的治理组织架构如下:
a) 行业主管部门:宜采用集中式治理组织或混合式治理组织 ,行业主管部门应统筹本行业数据治理制度规范,同一行业不同层级间数据可垂直流转或通过本层级公共数据运行管理机构流转;
b) 数据主管部门:宜采用混合式治理组织 ,上级数据主管部门统筹本区域内数据治理政策和制度规范,指导下一层级数据主管部门开展数据治理工作;
c) 公用数据运行管理机构:宜采用混合式治理组织 ,不同层级公共数据运行管理机构之间构建跨层级数据交互能力(如公共数据平台),实现不同层级间公共数据的互联互通 。
7.2 制度规范
7.2.1 参考 GB/T 44109—2024 附录 B,结合实际工作,制定相适应的管理制度和标准规范,并在其基础之上进一步细化制定数据建模 、数据采集 、数据传输 、数据存储 、数据归档 、数据异议处理等活动的标准
4
DB32/T 4608.4—2026
规范 。
7.2.2 应定期检查 、跟踪制度规范的执行情况,对发现存在的问题和不足,针对性地进行优化完善 。
8 方法流程
8.1 调研分析
开展数据治理调研分析 ,了解现状 ,明确数据治理目标和内容 ,确定实施路线 ,不同情况下的数据治理,其治理目标和内容 、实施路线有所差异,典型示例见附录 A。
8.2 规划设计
8.2.1 数据架构设计
8.2.1.1 数据架构
数据架构设计包括业务域及流程梳理 、数据实体识别 、数据分布确定 、数据集成流向梳理 、数据模型设计及应用等 。各部分含义及具体内容详见 GB/T 44109,数据架构应能够对数据分层分域管理(数据分层和分域具有交叉性质),实现流程控制 、标准管理 、血缘追溯 、简化开发 、提升质量等效果,典型的数据架构示例如图 2 所示 。
典型数据架构
数据分层 数据分域
应用
服务
集成
整合
加工
处理
数据
汇聚
ADS层
(数据应用层)
DM层
(数据集市层)
DWS层
(数据服务层)
DWM层
(数据中间层)
DWD层
(数据明细层)
0DS层
(数据源层)
按照应用服务渠道分域
按照需求方分域
按照业务主题分域
按照风险防控等级分域
按照数据来源渠道分域
图 2 典型数据架构图
5
DB32/T 4608.4—2026
8.2.1.2 数据分层
典型数据架构如下 。
a) 数据源层(ODS):也称为数据贴源层 、原始数据层或数据准备区 ,提供原始数据存档 、追溯等能力 ,通常包含多个数据源 ,汇聚多类业务领域 、多个业务系统的数据 ,这些数据源通常具有不同的数据格式 、结构 、语义和质量 ,因此需要按照一系列规则进行去重 、清洗 、转换等处理后方可使用 。
b) 数据明细层(DWD):对原始数据进行去重 、清洗 、转换等处理 ,形成标准化的数据 ,符合业务应用需要 ;在该层级 ,要明确数据治理标准和规则 ,并做数据质量的监测和评估 ,通过质检的数据进入下一处理环节,未通过质检的数据视为异议数据,需反馈至数源部门核实处理 。
c) 数据中间层(DWM):该层级根据业务需要可选择性地构建 ,在 DWD 层的数据基础上 ,对数据做一些轻微的集成聚合操作,生成一些中间结果表,提升公共指标的复用性,减少重复加工的工作量或者减少计算资源消耗 。
d) 数据服务层(DWS):在 DWD 层(或 DWM 层)的基础上进行聚合 、汇总和计算等加工处理,以满足各种业务需求和分析场景 ,是数据架构中的核心组成部分 。在该层级 ,数据模型以业务应用为中心,根据业务流程和业务需求进行建模,以支持各种复杂的查询和分析操作,可以采用星型模型 、雪花模型 、多维模型 、标签模型等多种建模方式 。
e) 数据集市层(DM):根据不同的需求,实现对数据的深加工,从 DWS 层中取出相关数据,按需加工处理,形成更贴近使用场景的数据子集 。
f) 数据应用层(ADS):面向业务应用和最终用户 ,为应用服务和业务系统提供数据接口和数据访问服务,包括业务办理 、数据查询 、数据可视化 、统计报表 、数据挖掘 、预测建模 、决策支持等 。
8.2.1.3 数据分域
数据资源分域可按照数据来源渠道 、业务主题 、需求方 、应用服务等方式进行划分:
a) 按照数据来源渠道分域:根据数据来源的部门 、地区或者信息系统等进行分域处理,每一个来源渠道划分一个数据域;
b) 按照业务主题分域:根据数据反映的业务内容 、描述对象等特征划分,每一类主题划分出一个数据域,例如关于自然人的数据划分到“人口库”、关于组织机构的数据划分到“法人库”、关于时空物体的数据划分到“ 空间地理库”、关于困难群众民生关怀的数据划分到“ 困难群众帮扶专题库 ”等;
c) 按照需求方分域:根据数据资源的需求方进行分域,每一个需求方划分一个数据域;
d) 按照应用服务分域:根据数据应用服务渠道 、服务领域等方式分域 ,例如可划分为数据共享 、数据开放 、授权运营等业务域;
e) 按照风险防控等级分域:按照数据安全保护需求,参考 GB/T 43697、DB32/T 310030、DB32/T 4608.1等标准,对数据划分“核心数据域 、重要数据域 、一般数据域 ”等级别,进行分域管理 。
8.2.2 数据模型
8.2.2.1 数据模型基本要素
数据模型描述的基本要素有以下:
a) 数据结构:描述数据的类型 、内容 、性质,以及数据之间的联系;
b) 数据操作:描述相应数据结构上的操作类型 、操作规则 、操作方式等;
c) 数据约束:描述数据结构之间的语法 、词义联系,以及彼此之间的约束关系 、约束条件,数据动态
6
DB32/T 4608.4—2026
变化的规则 。
8.2.2.2 数据模型管理
数据模型管理包含但不限于以下内容:
a) 数据模型命名:宜使用中文命名(可包含国际通用的外文单词或缩略语),对应的数据库 、数据表宜使用英文和数字混合命名,数据模型名称 、数据表名称应保持唯一不重复;数据模型命名示例见附录 B 中 B.1,数据库命名示例见 B.2,数据表命名示例见 B.3;
b) 数据模型编号:可采用合理位数的数字 、字母混合编码 ,数据模型的编号应唯一 ;数据模型编码示例见 B.4;
c) 数据模型描述:应准确说明数据模型的用途 、适用范围等内容 ,并使其区别于其他数据模型 ,以便准确与应用场景匹配;
d) 数据模型维护:根据业务和数据变化实时对数据模型动态维护 ,实现数据模型的新增 、变更 、实施 、消亡等全周期管理 。
8.2.2.3 数据建模流程
数据建模流程包含但不限于:
a) 需求分析:分析业务流程 、执行实体 、业务规则 、关联关系等信息,构建业务与数据之间的映射关系,确保数据模型与业务场景适配;
b) 概念模型:对业务逻辑 、业务规则进行抽象和定义 ,描述实体(如学生 、教师)、属性(如学号 、地址)及关系(如张三是李四的数学老师),实现现实世界到信息世界的映射转换;常见的概念模型有 E-R模型 、面向对象模型及谓词模型等;
c) 逻辑模型:在概念数据模型基础上进一步细化和精炼,根据需求对业务逻辑 、业务规则进行更加清晰明确的定义和表示 ,描述数据的逻辑结构 ;常见的有层次逻辑模型 、网状逻辑模型 、关系逻辑模型 、维度逻辑模型 、面向对象模型等;
d) 物理模型:数据建模的最后一个阶段,具体实现数据模型,将逻辑数据模型转换为实现细节和物理存储结构的数据库表 。
8.2.2.4 数据元定义
应 准 确 定 义 数 据 模 型 内 的 各 数 据 元 ,数 据 元 的 定 义 和 描 述 参 照 GB/T 19488.1、GB/T 19488.2、 DB32/T 4040.1、DB32/T 4040.2 等标准执行 。
8.3 实施执行
8.3.1 数据采集
根据业务目标和内容 ,在获得合规授权的前提下 ,进一步确定数据采集的范围 、内容 、频率 、数据类型 、方式等:
a) 采集范围:数据覆盖的地域范围 、时间范围等情况,数据采集范围不应超出业务需求;
b) 采集内容:被采集信息的主体的唯一标识(例如身份证号 、统一社会信用代码)、地址 、联系方式 、日期时间等,采集数据内容不应超出业务需求,避免过度采集信息;
c) 采集频率:按年 、月 、周 、天 、时 、分 、秒等不同频次 ,需要注意的是 ,采集频率会对信息系统的性能 、技术方案有一定影响;
d) 数据类型:库表 、文件 、接口 、消息队列等;
e) 采集方式:包括在线采集 、离线采集 、全量采集 、增量采集等方式 。
7
DB32/T 4608.4—2026
根据业务分析情况 ,综合考虑采集数据的范围 、内容 、时效等要求 ,选择或建设符合业务需求的信息系统或工具,如服务器 、网络 、数据库 、传输通道等 。
公共管理和服务机构应提供标准格式的 、可访问的数据资源 。
执行数据采集任务应保持稳定运行,保证数据采集完整 、准确 、及时等基本数据质量 。
8.3.2 数据传输
数据的发送端和接收端宜建立数据传输对账机制,及时比对传输的数据量 、内容等基本要素,保证数据的完整 、一致 。传输过程中,对于需要进行保护的数据可采取完整性校验 、加密等手段保障数据传输的完整性和安全性 。
8.3.3 数据存储
根据业务需求,数据存储考虑数据量 、数据类型 、访问频次 、读写性能 、业务并发量 、存储时长等要素,采用不同的存储机制和策略 。对于需要保护的数据宜采取权限控制 、数据加密 、容灾备份等手段,保障数据合规操作,降低数据丢失 、泄露等风险 。
8.3.4 数据探查
数据做加工处理之前 ,宜先进行数据探查 ,了解数据结构 、数据量 、主数据 、参考数据 、数据关系等情况 ,确保实际数据与需求符合 ,如存在数据不符合需求的情况(如部分数据项缺失 、数据量明显少于应有的规模 、数据项与业务情况不一致等),应及时处置后再进行下一步工作 。
8.3.5 数据加工处理
8.3.5.1 数据质检
参考 GB/T 36344、GB/T 19488.1、GB/T 19488.2、DB32/T 4040.1、DB32/T 4040.2 等标准 ,结合具体业务需要 ,从数据时效性 、完整性 、有效性 、准确性 、一致性 、唯一性等维度制定数据质量检查规则 。常见数据质量检查规则示例见附录 C。
根据数据质量检查规则 ,逐一检查数据 。数据质量检查可能存在多次迭代情况 ,宜定期对数据质量检查规则合理性进行评估分析,及时调整和改进不符合实际情况的质量检查规则 。
8.3.5.2 数据修正
相关数据若出现缺失 、违规 、重复 、冲突等情况 ,应对问题数据进行修正 。常见数据修正方法示例见附录 D。
8.3.5.3 数据转换
相关数据若不符合数据处理 、应用主体的现用标准 ,应对数据进行转换映射(例如格式 、代码等),使其符合需要 。常见数据转换规则示例见附录 E。
8.3.5.4 数据融合集成
根据业务需求 、数据关系 、主数据 、参考数据情况进行数据关联融合 、校核比对,形成符合业务需求的数据资源 。
注:该环节尤其注意对多源数据的校核比对,分析获得符合业务需求的数据 。
示例:离婚状态信息,应结合民政部门提供的结/离婚登记数据 、法院提供的离婚判决数据,进行自然人离婚情况的比对关联,获得准确的离婚状态信息 。
8
DB32/T 4608.4—2026
8.3.6 公共数据开发利用
8.3.6.1 按服务渠道划分
按服务渠道可划分为数据共享 、数据开放 、授权运营等类型 。
8.3.6.2 按业务领域划分
开发利用基于不同行业的业务需求 、数据类型和应用场景进行分类,包括但不限于政治领域 、经济领域 、文化领域 、社会领域 、生态文明领域等 。
8.3.6.3 按功能目标划分
按功能目标可划分为数据查询 、数据核验 、数据统计 、数据分析 、数据挖掘 、机器学习等 。
8.3.7 数据异议处理
宜建立数据异议处理流程和协作机制 ,及时处理数据质检 、应用等过程中发现的不符合预期的数据情 况 ,并 反 馈 核 实 处 理 结 果 ,形 成 数 据 治 理 的 闭 环 管 理 。 数 据 异 议 处 理 按 照 DB32/T 4608.5 的 要 求执行 。
8.3.8 数据归档/删除
对历史数据宜定期归档保存 ,所归档保存数据资源应明确说明覆盖的时间范围 ,保证数据完整 、连续 。对于超过保存期需要或者已无使用价值的数据应按照管理要求进行删除处理 ,明确删除方式 、操作人员 、监督人员 、操作时间等必要要素,执行删除后宜进行复核,确保数据删除彻底,不可恢复 。
9 运行管理
9.1 元数据管理
9.1.1 元数据分类
元数据可分为以下几种类型:
a) 业务元数据:描述业务领域相关概念 、关系和规则的数据 ,包括但不限于:数据(含数据集 、数据项等)的定义和描述 、业务规则 、业务术语 、数据质量规则 、数据血缘 、数据使用说明 、指标 、统计口径等;
b) 技术元数据:描述技术领域相关概念 、关系和规则的数据 ,包括物理模型的表与字段 、ETL 规则 、集成关系 、数据访问权限等;
c) 操作元数据:描述数据处理及运营情况的数据,包括数据处理日志 、访问记录 、调度任务记录 、数据归档文件 、数据备份等 。
9.1.2 元数据管理内容
元数据管理内容包含但不限于:
a) 元数据识别:识别并确定元数据及管理范围,包括技术元数据 、业务元数据 、管理元数据等;
b) 元数据创建整合:建立审核流程以验证元数据创建 、维护的结果;根据元数据的特点进行多种方式采集和存储,并对不同来源 、不同类型的元数据进行整合;
c) 元数据变更管理:建立元数据变更流程 ,以提升元数据的完整性 、准确性和时效性 ,保障元数据
9
DB32/T 4608.4—2026
的质量;元数据变更流程一般包括申请 、审核 、维护和发布四个阶段;
d) 元数据应用:依托采集整合的元数据 ,通过去重 、冲突处理 、关系还原等方式 ,开展链路分析 、差异分析 、热度分析 、数据地图展示 、数据资产发布等应用建设 。
9.2 质量管理
数据质量管理贯穿数据全周期各个环节 ,参考 GB/T 36344,常见数据质量评价维度有数据及时性 、完整性 、有效性 、准确性 、唯一性 、一致性等方面,具体如下:
a) 及 时 性 :也 称 时 效 性 ,指 数 据 从 产 生 到 可 查 看 或 可 使 用 的 时 间 间 隔 ,数 据 及 时 性 应 满 足 业 务需要;
b) 完整性:指数据信息是否存在缺失,数据缺失的情况可能是整个数据记载缺失,也可能是数据中某个数据项(字段信息)的记载缺失;
c) 有效性:也称为规范性,指数据的值 、格式和展现形式(数据的命名 、长度 、取值范围等)符合数据定义和业务定义的程度;
d) 准确性:指数据应真实 、准确地记录客观世界信息,无虚假 、错误的数据及信息;
e) 唯一性:指同一数据只能有唯一的标识符 ,度量数据是否重复 ,体现在一个数据集中 ,每个唯 一实体有一个键值且该键值只指向该实体;
f) 一致性:指同一个数据在不同系统 、不同库中的描述和相关属性应一致,不应存在差异或矛盾 。
9.3 运行监测
9.3.1 数据业务运行监测
数据业务运行监测侧重于数据全流程状态的跟踪,关注业务成效 、数据质量 、资源利用 、合规性 、连续性 、可用性 、安全性等要素,主要内容如下 。
a) 某一数据生存周期运行情况监测:构建数据血缘关系 ,跟踪数据从采集到开发利用的全流程运行情况 。例如,数据 A 在某天数据采集量 、数据质检合格情况 、应用服务量 、业务成效等 。
b) 数据治理某一环节全量数据运行情况监测:根据数据治理环节划分 ,了解某一环节上全量数据运行情况 。例如监测数据采集情况,某一统计周期内数据汇聚总量 。
9.3.2 信息系统运行监测
信息系统运行监测侧重于工具平台本身运行状态监控 ,以便及时了解各工具平台是否正常运行 ,关注于某一个工作环节,主要内容如下:
a) 访问用户量:某一统计周期内,登录或操作信息系统的用户量;
b) 数据传输量:某一统计周期内,数据传输数量;
c) 调度任务执行状态:数据治理任务是否正常执行,完成既定任务;
d) 资源消耗量:信息系统所使用的主机 CPU、内存 、存储消耗情况;
e) 接口调用量:调用信息系统服务接口的次数 。
9.4 评价改进
参考 GB/T 44109、GB/T 34960.3,结合数据治理目标 、内容和工作实际,编制数据治理评价方案,从数据治理组织 、制度 、活动及成效等方面设计数据治理评价指标体系,评价指标示例见附录 F。定期开展数据治理评价,宜每年不少于 1 次 。可采用差异分析方式对制定的数据治理目标与实际执行取得的治理结果进行比较 ,分析两者之间是否存在差距;若存在差距 ,则根据评估结果逐项开展差异原因分析 ,制定合理的数据治理改进方案,执行数据治理相关改进活动 。
10
DB32/T 4608.4—2026
10 风险防控