ICS 35.080
CCS L77
团体标准
T/ISC 0062—2024
数字政府统一运维 第1部分:运维平台建设指南
Digital government unified operations and maintenance Part 1: operations and maintenance platform construction guide
2024-09-09 发布2024-10-09 实施
中国互联网协会发布
目 次
前 言............................................................................................................................................................... II
引 言..............................................................................................................................................................III
1 范围....................................................................................................................................................................1
2 规范性引用文件................................................................................................................................................1
3 术语和定义........................................................................................................................................................1
4 运维平台建设整体框架................................................................................................................................... 2
5 统一运维应用场景............................................................................................................................................3
5.1 统一运维门户.............................................................................................................................................3
5.2 统一运维监控.............................................................................................................................................3
5.3 统一服务管理.............................................................................................................................................4
5.4 统一可视化管控.........................................................................................................................................4
5.5 统一告警管理.............................................................................................................................................5
5.6 统一资产管理.............................................................................................................................................5
6 基础能力支撑....................................................................................................................................................5
6.1 数据采控.....................................................................................................................................................5
6.2 数据管理.....................................................................................................................................................6
6.3 自动控制.....................................................................................................................................................6
6.4 知识管理.....................................................................................................................................................6
6.5 流程编排.....................................................................................................................................................7
6.6 安全管理.....................................................................................................................................................7
6.7 智能分析.....................................................................................................................................................7
6.8 开放集成.....................................................................................................................................................8
6.9 国产适配.....................................................................................................................................................8
6.10 平台自运维...............................................................................................................................................8
7 运维平台建设过程............................................................................................................................................9
7.1 统筹规划.....................................................................................................................................................9
7.2 构建运行.....................................................................................................................................................9
7.3 效果跟踪.....................................................................................................................................................9
7.4 改进优化.....................................................................................................................................................9
II
前 言
本文件按照GB 1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》给出的规
则起草。
本文件由中国互联网协会归口。
本文件由中国信息通信研究院政务服务中心、云智慧(北京)科技有限公司提出。
本文件起草单位:中国信息通信研究院政务服务中心、云智慧(北京)科技有限公司、海南省大数
据管理局、河南省政务大数据中心、河南省电子政务内网中心、玉溪市数据局、陕西省宝鸡市大数据管
理中心、数字海南有限公司、山西云时代政务云技术有限公司、云上广西网络科技有限公司、河南云政
数据管理有限公司、数字重庆大数据应用发展有限公司、雄安云网科技有限公司、中电信数智科技有限
公司、数字南阳科技有限公司、中国软件评测中心、中移系统集成有限公司、北京移动系统集成有限公
司、华为云计算技术有限公司、浪潮云信息技术股份公司、浪潮通信信息系统有限公司、中国联合网络
通信有限公司软件研究院、浙江云计算数据中心有限公司、联通数字科技有限公司、巩义市数字信息科
技有限公司、上海仪电鑫森科技发展有限公司、上海市疾病预防控制中心、北京星网锐捷网络技术有限
公司、上海卓繁信息技术股份有限公司、北京宝兰德软件股份有限公司。
本文件主要起草人:苏娜、陆兴海、张博、果金、伍杰、黄晓、何君、王书航、伍秋静、孟武帝、
杨帆、莫天宇、孟飞、沈学通、吴敏、沈军、张涛、孟子昂、吴祖顺、姚鑫、张黎兵、杨剑凌、左宁、
朱弘、胡源远、张翔越、李华、陈毅龙、刘学、陆勇、卢轶鲲、高剑、王宇东、王宏昊、王兆良、陈泉
伯、刘自幸、任伟立、刘闯、赵剑明,董星、李磊、吉鸿、林华鼎、王萌萌、刘运鑫、张目飞、孙永海、
许丙健、王志富、薛勇、田晋、周映、卢昌温、胡波、鲍建标、范军、何敏、贾玮强、蒋徐鑫、刘诚、
李志伟、郑青江、钟吉钢、詹年科、李源。
T/ISC 0062—2024
III
引 言
我国数字政府已进入高质量发展阶段,呈现建设与运维并重的特点。运维资源的整合已成为保障数
字政府长期稳定运行的重要课题,迫切需要实现数字政府统筹化、集中化的运维模式转型,形成运维规
范、运维数据、运维工具、运维流程、运维组织的一体化的运维管理能力。构建统一运维体系,建立一
体化运维保障流程,提供及时的运维响应和高质量服务。而运维体系的高效运转离不开平台的支撑,因
此,需要实施运维对象集中管控和智能运维,建设包括“监、管、控、析、安、服”等在内的一体化运
维平台,逐步实现不同运维工具与系统的数据互通、将分散在各个部分、各个层级的政务运维信息进行
集中汇聚,集中管控相关资源。实现统一的运维平台建设,通过大数据运维推动被动运维向主动运维转
变,借助自动化、智能化技术手段提升运维效率,基于自动化数据采集、自动化任务编排与执行、运维
知识库等平台能力,对各类运维数据进行处理与分析,实现自动化运维管理、可视化运行监控、智能化
事件分析。为此需要对数字政府统一运维模式下运维平台的建设框架,包含统一运维场景构建、基础能
力支撑、运维对象和平台建设过程提出要求,以指导统一运维平台建设工作的高效开展。
本文基于GB 28827.1-2022 信息技术服务运行维护第1部分:通用要求、GB 28827.2-2012 信
息技术服务运行维护第2部分:交付规范、GB 36074.3-2019 信息技术服务服务管理第3部分:
技术要求,结合数字政府统一运维在运行维护服务对象、运行环境适配、监管要求、运维管理等方面的
技术和管理特点,编制本文件,旨在为数字政府统一运维的需方、供方、第三方评估机构开展运维平台
建设提供依据。
本文件第四章提出了数字政府统一运维平台建设框架。
本文件第五章基于需方业务管理视角,强调运维的统一性,对包括统一运维门户、统一运维监控、
统一服务管理、统一可视化管控、统一告警管理、统一资产管理六大场景提出了能力和技术相关要求。
本文件第六章基于基础能力保障的视角,针对统一运维平台基础能力各维度的技术实现,从数据采
控、数据管理、自动控制、智能分析、安全管理、知识管理、流程编排、开放集成、国产适配、平台自
运维几个方面提出相关技术要求。
本文件第七章说明了平台建设过程涉及的统筹规划、构建运行、效果跟踪、改进优化四大过程,对
平台建设相关的管理与持续改进提出相关要求。
T/ISC 0062—2024
1
数字政府统一运维第1 部分:运维平台建设指南
1 范围
本文件提出了数字政府统一运行维护模式下运维平台的建设方法,对统一运维场景构建、基础能力
支撑、运行维护服务对象和平台建设过程提出相关要求。
本文件适用于:
——数字政府领域相关的政务云、政务应用等运行维护保障平台建设;
——为数字政府统一运维平台的需方提供选型或建设的参考方法及依据;
——为数字政府运统一维平台的供方提供平台规划、设计与开发指导;
——为第三方评测提供开发技术、实施能力以及项目质量评价的评测依据。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,
仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本
文件。
GB 28827.1-2022 信息技术服务运行维护第1部分:通用要求
GB 36074.3-2019 信息技术服务服务管理第3部分:技术要求
GB 24405.1-2009 信息技术服务管理第1部分:规范
GB 22239-2019 信息安全技术网络安全等级保护基本要求
TISC 0042-2024 软件安全开发能力评估技术规范
GB 43698-2024 网络安全技术软件供应链安全要求
TISC 0044-2024 软件供应链安全要求
3 术语和定义
下列术语和定义适用于本文件。
3.1
统一运维unified operations and maintenance
一种新型的运维模式,面向运行维护服务对象实现统筹和集约化的运维管理,实现工具、组织、技
术、数据以及资源的统一运维管控。
3.2
运行维护服务operation maintenance service
采用信息技术手段及方法,依据需方提出的服务要求,对其信息系统的机房基础设施、物理资源、
虚拟资源、平台资源、应用和数据,以及满足用户使用信息系统过程中的需求等提供的综合服务。
[来源:GB 28827.1-2022,3.1]
3.3
运行维护服务对象operation and maintenance service object
T/ISC 0062—2024
2
运行维护服务的受体。
注:运行维护服务对象通常指机房基础设施、物理资源、虚拟资源、平台资源、应用和数据等。
[来源:GB 28827.1-2022,3.8]
3.4
安全开发能力security development capability
组织在组织建设、制度流程、技术工具以及人员能力等方面对安全开发的保障。
[来源:T/ISC 0042—2024,3.6]
3.5
软件供应链安全software supply chain security
指软件供应链生命周期中各环节、过程涉及的软件产品和服务安全、供应关系安全、人员安全及软
件供应链基础设施安全的总和。
[来源:TISC 0044-2024,3.2]
3.6
软件供应链全生命周期software supply chain life cycle
在软件供应链中,从软件的需求分析开始至软件的废止停用或者供需双方终止协议的整个时期,包
括开发环节、交付环节和使用环节,划分为协商、生产、交付、获取、使用、运维、废止7个过程。
[来源:TISC 0044-2024,3.3]
3.7
告警收敛alert convergence
指减少不必要或冗余的告警,可通过过滤、合并或抑制相似或重复的告警来实现。
3.8
告警富集alert enrichment
利用额外的数据,赋予告警消息更丰富的信息。
3.9
运维数据operation and maintenance data
运维活动所涉及的运维对象或者运维操作相关配置、监控、流程、管理、日志的直接相关或间接衍
生的数据。
[来源:GB 43208.1-2023,3.8,有修改]
4 运维平台建设整体框架
本文件规定了数字政府统一运维模式下运维平台的建设方法,对统一运维场景构建、基础能力支撑、
运行维护服务对象和平台建设过程提出相关要求。数字政府统一运维平台建设框架如图1所示。
T/ISC 0062—2024
3
图1 数字政府统一运维平台建设整体框架
其中:
统一运维应用场景从用户视角构建统一运维平台的一站式入口及业务应用,包括统一运维门户、统
一运维监控、统一服务管理、统一可视化管控、统一告警管理、统一资产管理。
基础能力支撑是统一运维平台的技术和能力保障,各维度的技术实现包括数据管理、自动控制、智
能分析、安全管理、知识管理、流程编排、数据采控、开放集成、国产适配、平台自运维。
运行维护服务对象覆盖机房基础设施、政务云、政务应用、公共支撑和安全资源五个部分,是管理
对象和运维数据的来源。
运维平台建设过程部分包括统筹规划、构建运行、效果跟踪、改进优化四大过程,对平台建设相关
的管理与持续改进提出相关要求,以提升运维平台建设与管理水平。
5 统一运维应用场景
5.1 统一运维门户
构建统一的运维门户相关场景,实现界面整合、组织用户管理、用户与权限集成、单点登录以及数
据展示等能力。具体包括:
a) 应能通过统一的运维门户实现和已有以及未来多个相关运维系统的界面整合与集成;
b) 应提供个人工作台,显示已授权的功能模块、日常工作任务、工作流程、知识资源等;
c) 宜提供统一的工作视图,包括运维视图和领导视图等;
d) 宜支持界面自定义,可按个人偏好对视图或界面进行布局。
5.2 统一运维监控
构建统一的运维监控相关场景,结合大数据分析及人工智能等能力,实现对运行维护服务对象的统
一监控与分析,帮助快速发现、分析并定位故障。具体包括:
T/ISC 0062—2024
4
a) 应构建统一监控能力,监控覆盖从底层动环到上层业务的运行维护服务对象各类资源,不需再
联动各种第三方监控工具,帮助更快、更全面的进行资源监控和分析;
b) 宜提供端侧、网络、云侧一体化的综合监控视图,围绕政务云应用打通指标、日志、事件、链
路,实现全方位监控与多维数据下钻分析;
c) 应支持基于模型的资源统一监控,提供横向(多维度数据的综合监控)和纵向(立体化拓扑监
控)的监控分析能力,便于从多种角度进行日常监控和故障分析;
d) 应支持多指标综合分析,可将体现业务、应用、服务、组件、硬件等运行状态的指标放置在同
一视图中进行分析,如对比关联指标的趋势等,同时宜实现针对多维度指标的维度筛选、维度
聚合、多维分析等;
e) 应提供统一资源运行状态展示和检索资源能力,如以业务或应用为对象,展示对应的事件、健
康度、监控指标数等状态信息,帮助全局展现和把控资源的运行状态;
f) 宜支持自定义监控视图、自定义仪表盘和拓扑监控视图;
g) 宜能围绕资源事件,联动多维监控数据与智能算法,丰富监控和故障根因分析路径,帮助快速
故障根因定位,为故障自愈提供支撑。
5.3 统一服务管理
构建统一的运维服务管理相关场景,通过标准化、流程化的运营方式为组织提供高质量、高效率的
IT 服务。具体包括:
a) 应支持服务目录与服务级别协议管理,包括服务目录、服务水平指标定义、监控和报告等,确
保IT 服务的准确性、唯一性,提升质量和可靠性;
b) 应支持服务请求管理,包括服务请求的受理、分配、处理、关闭和评价等;
c) 应支持事件管理,包括事件的受理、分类、派发、处理、关闭和评价等;
d) 应支持问题管理,包括问题报告、问题跟踪、问题分析和问题解决等;
e) 应支持变更管理,包括变更计划、变更评估、变更审批和变更实施、变更验证和关闭等,同时
应支持变更日历,变更信息自动同步到配置管理等;
f) 应支持配置管理,包括配置项的录入、变更和报告,宜实现变更与流程联动能力;
g) 应支持值班管理,包括排班计划、值班人员管理等,宜实现服务台和自动派单功能联动;
h) 应支持任务管理,包括任务的创建、分配、跟踪和完成情况汇报等;
i) 应支持自服务,包括自助提交申请、查看进度、搜索知识库以及智能知识推荐等;
j) 应提供服务报告,包括自定义服务报告模板, 报告周期筛选,报告分享等;
k) 应支持服务台会话,宜支持智能问答、自动化流程引导与智能推荐等。
5.4 统一可视化管控
构建统一的运维可视化管控相关场景,通过监控大屏与数据报表等可视化方式展示系统的运行状
态、性能指标和异常情况等信息,帮助更好地监控和管理系统,增强信息透明度,提升组织协同能力。
具体包括:
a) 应建设各种面向运维与运营的可视化监控大屏,如资源运行态势、网络质量、应用健康、业务
链路追踪、资源台账、业务运营、网络安全、服务质量、事件与告警以及用户体验等维度的大
屏展示和分析;
b) 应提供报表分析管理能力,实现数据的灵活展示与自助式分析,让非技术人员方便快捷获取与
分析运维数据;
c) 应实现数据访问控制机制,可根据用户和角色对数据资源进行授权,数据能够按照不同授权进
行查询和展示;
T/ISC 0062—2024
5
d) 宜建立数据可视化低代码平台,如通过拖拉拽方式快速搭建展示界面,实现一站式可视化开发。
5.5 统一告警管理
构建统一的告警管理相关场景,对来自各种监控系统的事件进行统一接入与处理,支持告警事件的
过滤、通知、响应、处置、定级、跟踪以及多维分析,利用算法实现告警收敛、异常检测、根因分析等
智能运维场景化应用,实现告警事件全生命周期管控。具体包括:
a) 应支持多种告警源接入方式,能够对接多种监控工具;
b) 应支持多种告警通知渠道,如短信、邮件、电话、即时通信软件等;
c) 应具备告警收敛能力,实现基于规则或智能算法抑制事件数量,减少无用重复告警干扰;
d) 应实现事件集中管理,运维人员可以在统一界面进行事件的查看、分析、统计与处置;
e) 宜与自动化工具对接,通过特定自动化脚本实现故障自愈;
f) 宜与IT 服务管理工具对接,将告警事件与流程进行关联,基于事件自动生成工单,实现告警
事件的快速响应;
g) 宜具备基于事件数据的智能根因分析能力;
h) 宜与配置管理工具对接,将事件与配置项关联,通过配置项拓扑关系实现快速故障定位;
i) 宜支持告警富集,利用额外数据赋予告警更丰富的信息。
5.6 统一资产管理
构建统一资产管理相关场景,有效地管理各类软硬件IT 资产,帮助更好地规划、预算与管理,提
高资产的稳定性、利用率,降低成本。
a) 应具备资产台账管理能力,记录和跟踪所有硬件和软件详细信息,包括型号、序列号、配置和
位置等;
b) 应具备资产分类和标记能力,能将资产按照类型、用途、部门等维度进行分类和标记;
c) 应具备资产生命周期管理能力,跟踪采购、部署、维护、更新和报废等生命周期阶段;
d) 应具备合同信息和许可证管理能力,能管理硬件和软件的购买合同、许可证和保修信息,宜具
备到期提醒能力;
e) 应具备资产报告和分析能力,帮助掌握资产使用情况、成本分析、风险评估等信息;
f) 宜具备资产位置跟踪能力,记录资产的物理位置或网络位置以快速定位;
g) 宜具备资产故障管理能力,跟踪资产的故障和维修历史,帮助及时修复故障并减少停机时间。
6 基础能力支撑
6.1 数据采控
应具备运维数据统筹化采集控制能力,利用特定协议或方法实现运维数据的集中化采集管理与管
控,实现从运维工具或系统中采集运维元数据、性能指标数据、事件数据、工单数据等。具体包括:
a) 应通过代理或者无代理方式实现数据采集,采集代理需支持自动化部署和配置,采集代理需具
备可更新能力,确保长期稳定运行;
b) 应提供易于集成的SDK、拨测或接口等方式,向目标节点设备发送采集指令,经过采集端的
解析、转换等边缘计算处理,处理完的数据可供上游系统消费;
c) 采集代理应兼容Linux、Windows、AIX、MacOS、应用服务实例等多种不同类型与版本的操作
系统,支持采集日志、进程、性能数据、告警数据等;
T/ISC 0062—2024
6
d) 应提供集中化管理控制台,实现节点管理,对接入的物理机、云主机、虚拟机、容器等联网设
备或系统进行统一管控,可监控节点状态,提供健康检查、故障预警能力、资源使用报告能力;
e) 应提供采集任务管理能力,包含单个任务管理及批量任务管理,可根据采集需求对采集任务进
行灵活配置,包括数据源、采集频率、解析规则、转换逻辑和发送目标等;
f) 应实现采集器版本管理,对部署的所有采集器版本进行管控,支持版本回滚和升级,支持批量
上传安装解析安装包,性能测试报告查看等;
g) 应实现对数据采控所消耗资源的监控告警,当监测到资源消耗触发了设定的告警规则时,第一
时间通知用户对异常进行处理;
h) 宜提供系统级的保护机制,以实现熔断保护,当监控到采集任务对CPU、内存、磁盘和网络
的资源消耗超过设定的阈值时,则自动触发熔断机制,防止因资源持续消耗对业务造成影响。
6.2 数据管理
应提供统一的运维数据管理能力,对采集的数据进行过滤、清洗、加工、存储、统计计算、数据建
模、发布数据服务接口等。应能实现数据资产统一管理,满足对数据应用的敏捷开发、智能分析、数据
血缘、数据地图、数据质量、数据服务等要求,能够充分利用运维数据实现复杂业务场景。具体包括:
a) 应支持多种形式的运维数据存储,具备按照数据存储标准在计算机的存储装置或外围储存设备
中存储海量离线与实时运维数据的能力;
b) 应提供可视化分析查询能力,同时可支持多维度分析,方便进行数据洞察和决策支撑;
c) 应提供运维数据指标管理能力,实现运维指标统一入库管理,包括指标信息维护、指标元数据
管理、指标分类、指标维度管理、实时的指标加工、批量导入与导出、指标手工录入、指标查
询和指标发布等;
d) 应提供数据服务能力,用接口的形式给外部提供数据服务以实现运维数据共享,数据服务接口
需具备良好的安全性和稳定性,支持多种数据访问控制机制;
e) 应提供数据质量管理能力,实现异常数据的实时监控并出具数据质量体检报告,形成从标准定
义、质量监控、质量分析、问题告警和数据运营的数据质量管理闭环;
f) 宜提供运维数据运营能力,包括数据消费侧的指标地图或目录、指标订阅、指标查询、血缘管
理等、数据供应侧的指标版本管理、指标分析、指标质量、指标应用追溯等。
6.3 自动控制
应提供自动控制能力以实现自动化运维,利用自动化技术或手段,使运维活动按照预期目标自动执
行,实现对运维对象的管理和处置,提升运维效率。
a) 应提供常规运维操作自动化的能力,减少手动操作带来的错误;
b) 应提供脚本管理功能,包括脚本编写、版本管理、执行日志等,确保脚本的规范化和可追溯性;
c) 应提供图形化编排能力,支持多脚本任务编排以实现复杂的自动化场景;
d) 应提供任务调度管理能力,支持任务的按策略自动调度,包括系统部署、配置管理、故障排除
等场景;
e) 应实时监测运维作业的执行情况和效果,统计数据及生成报告;
f) 应具备跨平台兼容性,适配不同操作系统和云平台以实现统一的自动化运维管理。
6.4 知识管理
应具备知识管理能力,面向运维服务管理、运维作业操作等多种运维场景,实现知识分类与建模、
知识存储、知识审批、知识图谱、知识更新、知识贡献和知识服务等多个技术要求。
T/ISC 0062—2024
7
a) 应具备多维度分类能力:知识条目可按产品、用户群、业务领域等进行分类,同时可设定维护
责任人,以便管理和维护;
b) 应具备知识建模能力,能够定义知识的模板并可按模板创建知识条目;
c) 应具备文档管理能力,可存储、组织和管理各种类型的文档,如文本文件、电子表格、演示文
稿、图片和视频等;
d) 应提供创建、审核、发布和撤回知识条目等规范的知识管理流程;
e) 应具备检索功能,支持关键字检索、全文模糊检索、附件内容检索等多种检索方式,提高知识
检索的效率和准确性;
f) 应支持知识的评价、评分和分享,评分按知识进行统计,促进知识的交流和分享;
g) 应具备标签和分类能力,可通过标签和分类将知识进行组织和归档,便于查找和浏览;
h) 应具备协作和共享能力,允许多人协作编辑、评论和分享文档,支持权限管理和团队协作;
i) 应提供知识导入和导出能力,支持从其他软件导入数据,以及将知识导出为不同格式的文件;
j) 宜具备知识图谱能力,通过构建知识图谱来展示知识之间的关联和联系,帮助系统接口调用分
析以及帮助用户更好地理解知识结构。
6.5 流程编排
应具备流程编排能力,支持多人之间协作的流程以及面向自动化作业的流程,包括创建、编辑和优
化工作流程,以及定义任务、设置条件和规则、指定责任人和审批流程等。
a) 应提供图形化流程设计能力,实现对各类流程的灵活设计,支持流程设计绑定表单,可通过拖
拽方式完成表单布局和流程逻辑的设计,同时支持流程的模拟测试、导入和导出等;
b) 应支持串行流程、并行流程、子流程的混合流程设计;
c) 应支持自定义流程的流转策略、节点处理策略、流程间交互和关联审批等;
d) 应支持任务节点和会签节点,且会签节点的条件设置支持变量,动态赋值;
e) 应支持提交、驳回、撤回、指派、转派、关联发起其他工单、知识库、挂起/唤醒、催办、取
回或撤单、抢单或接单、拒绝、关闭等动作;
f) 应支持流程自动化的设置及处理,能够根据工单操作、表单字段值匹配条件来设置流程节点自
动化处理触发规则;
g) 应实现面向自动化作业的流程编排,通过条件判断、并行执行等流程设置,结合不同的操作步
骤,完成对复杂自动化运维场景的支持。
6.6 安全管理
应具备安全管理能力,在国家相关政策法规要求下满足权限管理和数据安全管理等要求,以保障系
统稳定运行和数据安全。
a) 应具备权限管理能力,包括提供集中的组织与用户管理、双因子认证、基于角色的权限访问控
制模型、统一认证管理和统一审计管理等;
b) 应具备数据安全管理能力,确保数据采集、传输、加工、存储、应用、维护和归档/退役等环
节的安全可控,防止业务数据泄漏、被篡改;
c) 应具备安全审计能力,实现运维平台的日志管理,分析异常行为和安全事件,确保运维数据生
存周期各环节中管理、使用、消费、操作等过程可追溯、可审计;
d) 平台应达到国家网络安全等级保护三级要求,确保具备相应的安全防护能力;
e) 平台应使用国密算法进行数据加密和传输,以符合国家密码管理局相关要求。
6.7 智能分析
T/ISC 0062—2024
8
宜具备智能分析能力,针对特定的业务目标和运维场景,可综合运用规则和算法模型,通过筛选、
整合和加工相关运维数据。
a) 宜具备对运维场景的预测和判断能力,根据历史数据和算法模型,自主预测运维事件发生概率,
判断可能对业务造成的影响;
b) 宜具备综合运用规则和算法模型的能力,对运维数据进行深度分析,场景可涵盖异常检测、根
因分析、趋势分析等方面,实现智能的运维数据洞察;
c) 宜支持多种算法模型的应用,包括机器学习模型、统计分析模型、规则引擎等,算法模型应能
够自适应调整和优化,根据运维数据的变化进行模型更新和优化,实现高效的预测和分析能力;
d) 宜提供多维度的数据可视化智能分析能力,帮助运维人员直观地理解和分析运维数据,满足不
同场景下的分析需求;
e) 宜提供实时异常检测能力,通过模型分析和规则判断,包含单指标异常检测、多指标复合异常
检测等,及时发现和报警异常事件。
6.8 开放集成
应提供开放集成能力,实现运维平台与其他系统集成、数据共享、功能扩展和自动化运维等,包括
数据接口、插件扩展、支持第三方集成以及提供标准化的集成方式等。
a) 应支持常见的标准化接口和通信协议,如RESTful API、SOAP、MQTT 等;
b) 应提供API 管理能力,管理平台对外提供的API 以及平台集成的第三方API;
c) 应采用插件化架构设计,使得系统功能模块化,方便通过插件的方式扩展新功能或集成第三方
组件。插件可支持安装、升级、卸载和版本控制,确保灵活性和安全性;
d) 应提供开放的数据格式实现数据交换和共享,具备良好的可读性和可扩展性,支持多种编程语
言,如JSON、XML 等;
e) 应提供异步消息传递机制,如支持消息队列或消息总线,以实现系统之间的松耦合集成,提高
系统的可扩展性和灵活性;
f) 应提供适配器和连接器,用于连接不同的系统或数据源,以实现系统间的集成和数据交换。
6.9 国产适配
应实现国产适配,技术要求包括运行环境(国产CPU 和操作系统)、国产硬软件运维对象的数据
采集与接口适配以及统一运维平台本身的国产化组件替代相关要求等。
a) 应严格遵循国产化硬件、CPU 与操作系统相关的标准和规范,确保平台的安装部署符合相应
的国家标准和政策要求;
b) 应支撑国产化运行环境,兼容国产化CPU、操作系统、国产化浏览器,同时满足稳定性和可
靠性要求;
c) 应适配国产化运维服务对象,如政务云、国产硬件设备、国产中间件与数据库、各类国产政务
系统等的数据采集接口,实现各类运维数据的采集;
d) 应实现平台的中间件、数据库、3D 可视化引擎等核心技术组件的国产化替代;
e) 宜提供国际化支持,包括支持中文繁体、多国语言、多时区、多货币等特性,以满足不同地区
用户的需求。
6.10 平台自运维
平台应具备高稳定性和高可靠性,应具备自监控与自动处置相关技术能力。
a) 应支持自身资源、状态、性能方面的监控和展示功能的监控,及时发现问题并预警;
b) 应支持自动化巡检、升级、扩容等维护操作;
T/ISC 0062—2024
9
c) 应能自动记录和管理系统日志信息,以帮助故障诊断和审计;
d) 应支持关键数据备份/恢复功能;
e) 宜支持自动化故障处理,对于常见故障,可自动进行故障处理,恢复服务;
f) 宜支持自动化扩展,根据负载情况自动扩展平台资源,确保平台性能稳定。
7 运维平台建设过程
7.1 统筹规划
统筹规划阶段,运维平台建设至少应从如下方面考虑:
a) 识别现状和目标,进行统筹规划,且与组织的数字化战略和IT 运维规划对齐;
b) 针对组织、人员配套进行规划,明确职责、岗位和分工,应关注人力资源配置等;
c) 针对流程规划,应建立相关流程制度,包括平台规划、建设、测试、实施及改进等;
d) 针对技术规划,应考虑组织现有技术水平、人员能力、技术趋势以及建设成本与周期等;
e) 从管理和技术两个方面对运维平台安全开发能力进行规划;
1) 考虑安全策略、安全管理制度与法律法规、等保以及行业监管要求的合规性;
f) 从软件供应链全生命周期的角度制定运维平台建设的相关策略。
7.2 构建运行
构建运行阶段,运维平台建设至少应从如下方面考虑:
a) 针对组织建设,建立特定的组织和制度,包括组织架构、角色职责、岗位能力和绩效管理等;
b) 针对流程建设,建立过程管理制度与标准体系,覆盖平台设计、研发、测试、部署发布等内容;
c) 明确运维平台开发过程各阶段的安全要求,实施安全过程管理;
d) 基于运维平台软件质量管理标准体系,实施运维平台质量管理;
e) 制定运维平台涉及的数据风险监测和防范机制,监测、防御、处置数据安全风险和威胁,保护
数据免受非授权访问、非法使用及滥用,防范数据泄露、窃取、篡改、损毁等情况发生;
f) 对运维平台安全运维进行重点保障,包括最小原则平台安装部署、运维环境配置安全、软件制
品完整性检查、安全补丁更新、安全加固、安全漏洞检测与修复等。
7.3 效果跟踪
效果跟踪阶段,运维平台建设至少应从如下方面考虑:
a) 针对平台建设的全周期管理,关注各阶段的影响因素,制定相应管理措施;
b) 针对平台建设效果,依据度量指标进行效果考评,度量指标包括技术指标和业务指标;
c) 对运维平台建设效果进行分析,包括业务需求匹配度、质量和安全等方面。
7.4 改进优化
改进优化阶段,运维平台建设至少应从如下方面考虑:
a) 对运维平台建设过程与效果进行复盘分析,包括组织、流程和技术等方面;
b) 针对组织改进,应发现与改进平台建设过程中组织与职责不匹配的情况并及时调整;
c) 针对流程改进,应建立问题改进流程,实现对问题的协同跟踪;
d) 针对技术改进,应持续对平台的功能和非功能要求如性能、可靠性、安全性进行持续优化改进;
e) 针对运维平台持续运营,实现优化治理管控,包括质量监测、数据可视化、资源保障等。