欢迎访问学兔兔标准下载网,学习、交流 分享 !
返回首页 |团 体 标 准
T/ISC 0113—2026
政务云智能运维平台能力技术要求
Technical Requirements for Government Cloud Intelligent Operations Platform
Capabilities
(发布稿)
2026 - 05 - 11 发布 2026 - 06 - 11 实施
中 国 互 联 网 协 会 发 布
前 言
本文件按照GB/T 1.1—2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由中国互联网协会提出并归口。
本文件起草单位:广州市数字政府运营中心、广州广电运通信息科技有限公司、中国信息通信研究院、中国电信股份有限公司广州分公司、中国联合网络通信有限公司广州市分公司、中国移动通信集团广东有限公司广州分公司、广州广宽科技有限公司、北明软件有限公司、北京东方通软件有限公司、中数通信息有限公司、华为云计算技术有限公司、联通数字科技有限公司、数字湖南有限公司、湖北省楚天云有限公司、浪潮云信息技术有限公司、太极计算机股份有限公司、新疆数字兵团信息产业发展有限责任公司、中金数据(武汉)超算技术有限公司、山西云时代技术有限公司、首信云技术有限公司、西安数字研究院有限公司、北京国科云计算技术有限公司
本文件主要起草人:路明怀、刘愉滨、吴鹏、付伟炳、彭杰、曾静敏、张蔚铮、林于亮、曾蔚、罗祺、 曲舒琦、唐逸杰、冯亦龙、倪杰、刘颖、罗桦瀚、蓝磊、戴顺、罗小峰、曹拓荒、李念、吴卫增、张琳琳、吴宁、宋光通、吴佳兴、宋佳明、姬海南、石子豪、王宁、杨绍光、王梓瑄、刘璐楠、陈德伟、石凌凡、李军、贺超、李阳、王刚、颜秉泰、韩旭、郑佳佳、柯鑫、李巍、郑雅璐、张迪、满波、颜峰 、艾微、王名实、李亚妨、 吕天华、闵欢、张青青、万国权、张晓亮、 吕静 、吴涛、邹立刚,陈鹭
政务云智能运维平台能力技术要求
1 范围
本文件规定了政务云智能运维平台能力技术要求,包括门户管理、运维场景层、服务管理层、服务支撑层、数据资源层、数据接入层及一体化管理能力的技术要求。
本文件适用于提供政务云智能运维能力技术的服务商,智能运维对象主要覆盖各类基础设施及业务应用等。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T 25000.51-2016 系统与软件工程 系统与软件质量要求和评价(SQuaRE) 第51部分:就绪可用软件产品(RUSP)的质量要求和测试细则》
GB/T 8566-2007 信息技术 软件生存周期过程
GB/T 11457-2006 信息技术 软件工程术语
GB/T 43208.1-2023 信息技术服务 智能运维 第1部分 :通用要求
3 术语和定义
GB/T 25000.51-2016界定的以及下列术语和定义适用于本文件。
3.1 智能运维 Intelligent Operation and Maintenance
具备能感知、会描述、自学习、会诊断、可决策、自执行、自适应等若干人工智能特征的运维服务。 [来源:GB/T 43208.1—2023 :3.1]
3.2 配置项 Configuration item
一个配置中的实体,它满足一项最终使用功能,并能在给定的基准点上单独标识。
[来源:GB/T 8566-2007 :3.6]
3.3 配置管理 Configuration management
是一个过程,通过该过程,可以维护一切与环境相关的信息,这些信息可以被定义、修改、存储和检索。应用技术和管理的指导和监控方法以标识和说明配置项的功能和物理特征,控制这些特征的变更,记录和报告变更处理和实现状态并验证与规定的需求的遵循性。
[来源:GB/T 11457-2006:2.313]
3.4 运维大模型 Operation Large Model
面向政务云运维场景专门训练的大语言模型,具备运维知识理解、故障诊断推理、处置方案生成等能力。
4 符号和缩略语
下列符号和缩略语适用于本文件。
API 应用程序接口(Application Programming Interface)
CMDB 配置管理数据库(Configuration Management Database)
SLA 服务等级协议 (Service Level Agreement)
LLM 大语言模型(Large Language Model)
RAG 检索增强生成(Retrieval-Augmented Generation)
MTTR 平均修复时间(Mean Time To Repair)
5 概述
5.1 平台总体架构
一体化政务云智能运维平台包括中心节点、区域节点多级架构,如图 1 所示。
中心节点是实现各区域节点运维能力互联互通、信息共享及统一管理的核心载体,各区域节点由地方参照本规范自主建设,具备独立的政务云智慧运维平台。
一体化政务云智慧运维平台与各节点平台之间、中心节点与区域节点之间,均通过标准 API 接口实现数据与指令的双向交互:各区域节点政务云智慧运维平台需具备标准 API 接口,对运维相关数据进行合规性验证、清洗与转换处理后,推送至中心节点平台;
中心节点平台接收区域节点上报的 IT 资源、监控告警等运维数据,实现对全域政务云 IT 资产与资源运行状态的统一总览,并可通过 API 向区域节点下发运维规章制度、运维知识,协助区域节点处理复杂 IT 故障,从而形成上下联动、协同高效的一体化运维管理体系。
图1 一体化政务云智能运维平台分级架构
5.2 平台技术架构
本文件对政务云智能运维能力技术要求进行规范,包括门户管理、运维场景层、服务管理层、服务支撑层、数据资源层、数据接入层以及一体化管理的能力。政务云智能运维能力技术架构图如图2所示。
图2 政务云智能运维能力功能架构图
6 门户管理
门户管理要求如下:
a) 统一门户管理要求如下:
• 应支持统一登录入口进行身份认证,用户一次登录即可访问各类应用;
• 应支持与云平台有对接功能;
• 宜支持基于AI的登录风险评估,异常登录主动拦截。
b) 统一用户管理要求如下:
• 应支持组织架构的统一管理,支持多层级组织架构的增、删、改、查等操作;
• 应支持记录人员操作信息,对用户操作进行安全审计;
• 宜支持运维人员操作行为分析。
c) 统一鉴权管理要求如下:
• 应支持通过集中访问控制,基于最小权限原则实现用户访问;
• 宜支持双因子认证功能。
7 运维场景层
7.1 可视化展示
可视化展示的要求如下。
a) 运维驾驶舱要求如下:
• 应支持告警、指标、性能、资产、流程等数据多维度展示;
• 应支持在一个关注项对不同服务、不同维度的数据进行对比查看;
• 应支持多模态运维工单看板展示;
• 宜支持智能对比分析, 自动识别异常差异;
• 宜支持资源容量、业务流量的预测曲线展示。
b) 统计报表要求如下:
• 应支持自定义查询组件, 自定义查询条件和多条件组合查询报表;
• 应支持灵活设置报表统计分析,例如基于数据源拖拽报表分析的维度及指标;
• 应支持多种报表类型,例如明细表、聚合表、分组数据报表等;
• 应支持下载导出;
• 应支持根据设置的频率和时间向指定邮箱发送订阅邮件。
7.2 监控与告警
监控与告警的要求如下。
a) 异常检测要求如下:
• 应支持单指标、多指标异常检测,包括但不限于系统资源使用、性能指标、应用程序行为等方面;
• 应支持实时异常检测;
• 应支持自定义配置告警阈值策略,超出阈值产生告警并通知;
• 宜支持提供自适应阈值功能,平台能够根据历史数据和实时环境动态调整异常检测的阈值;
• 宜支持配置检测算法参数、检测时间窗口等参数;
• 宜支持基于深度学习的日志模式异常检测,识别未知错误模式;
• 宜支持告警影响级别的评估;
• 宜支持动态拓扑影响分析,实时展示故障传播路径。
b) 告警策略要求如下:
• 应支持不同告警阈值,如普通阈值、规则阈值、复合阈值、实例丢失阈值等告警阈值策略;
• 应支持用户个性化设置,允许用户根据其特定需求进行个性化的告警处理设置,例如设置特定时间段内的告警内容、告警级别、屏蔽指定类型等;
• 宜支持告警过滤,可以通过设置过滤规则、正则表达式、关键字匹配等方式进行告警过滤;
• 宜支持基于图算法的智能告警收敛,识别衍生告警;
• 宜支持语义相似度去重,相同根因告警智能合并。
c) 告警通知要求如下:
• 应支持两种以上的通知方式,如短信、邮件、 电话、即时消息、移动推送、工单系统等;
• 应支持灵活的告警规则和策略配置,可以根据不同的情况和需求设置不同的通知人员;
• 应支持告警智能屏蔽和免扰模式的能力,允许接收者在特定情况下暂时屏蔽或延迟接收告警通知;
• 应支持告警通知的追踪和确认机制,确保通知的送达和接收情况可追溯;
• 应支持自定义告警通知内容模板;
• 应支持告警合并通知;
• 应支持告警触发和告警恢复通知。
d) 影响分析要求如下:
• 应支持告警影响级别的评估;
• 应支持告警影响指标的展示;
• 宜支持告警影响范围的拓扑展示。
e) 关联分析要求如下:
• 宜支持告警关联关系识别能力,能够自动或半自动地识别不同告警之间的关联关系。通过分析告警的内容、时间序列、触发条件等信息,识别出相互关联的告警;
• 宜支持两个及多个指标之间的关联分析。
7.3 故障处理
故障处理的要求如下。
a) 故障识别要求如下:
• 宜支持根据已有故障图谱进行匹配,识别故障信息;
• 宜支持基于多模态数据的故障智能识别;
• 宜支持故障智能分级。
b) 故障定位要求如下:
• 宜支持根因自动定位,结合图谱匹配与实时数据分析;
• 宜支持算法自动选择,根据故障特征匹配最优分析算法;
• 宜支持人机协同验证,人工确认后反馈优化模型;
• 宜支持根因自动定位,结合图谱匹配与实时数据分析
c) 故障修复要求如下:
• 宜支持修复方案自动生成,基于知识库与当前环境;
• 宜支持风险分级执行,低风险自动执行,高风险人工确认;
• 宜支持故障修复时效监控,统计并优化MTTR;
• 宜支持判断故障修复后状态。
d) 故障预测要求如下:
• 宜支持对指标进行时序预测,了解指标(如可用度、健康度、繁忙度等)变化情况;
• 宜支持对预测结果通过动态阈值,判断指标(如可用度、健康度、繁忙度等)是否存在异常;
• 宜支持修复后的自动验证,异常自动回滚。
7.4 智能化分析
智能化分析的要求如下。
a) 资源优化要求如下:
• 宜具备资源使用优化的能力,包括但不限于磁盘容量、 内存容量、性能调优、CPU能力、网络带宽等;
• 宜支持基于业务场景的资源分析与优化。
b) 趋势预测要求如下:
• 宜具备物理资源和云计算资源的实时容量视图和趋势预测;
• 宜支持实时查询容量及性能,及时进行容量告警并可预测容量趋势变化;
c) 智能变更要求如下:
• 宜支持变更任务编排能力;
• 宜支持变更回滚,具备基于智能化策略智能回滚能力;
• 宜支持变更评估能力,评估内容包括风险、影响范围、涉及人员、方案等。
d) 智能客服要求如下:
• 宜支持基于运维大模型的智能问答;
• 宜支持多轮对话与上下文理解;
• 宜支持对话记忆与个性化,基于用户历史优化回答。
8 服务管理层
服务管理层要求如下:
8.1 需求管理
需求管理要求如下。
• 应具备可自定义化的需求管理流程;
• 应具备可自定义化的节点审批人员配置;
• 宜支持需求管理流程多元化配置,如:并行、排他网关的应用;
• 宜具备SLA管理能力,如超时提醒、不同等级事件通知不同群体等;
• 应提供需求管理交付标准说明。
8.2 事件管理
事件管理要求如下。
• 应支持事件流程分类管理能力;
• 应支持事件模板自定义管理能力;
• 应支持事件流程自定义配置管理能力;
• 应具备事件工单申请模块;
• 宜具备定时/周期发送事件工单能力;
• 宜支持多源事件智能聚合,告警/热线/监控统一接入
• 宜支持预设自动分配规则,系统根据规则自动派单;
• 宜提供运行服务支撑系统的通用应用程序接口(API);
• 宜支持多系统联动,如:告警、运维热线平台投诉等自动通过工单派发。
8.3 问题管理
问题管理要求如下。
• 宜具备对问题库的创建和集中维护管理能力;
• 宜支持问题索引;
• 宜具备问题库分类统计能力;
• 宜支持问题库内问题归类维护和管理;
• 宜具备草稿箱暂存问题的能力。
8.4 变更管理
变更管理要求如下。
• 应支持变更风险智能评估;
• 应支持变更影响智能分析,基于知识图谱识别关联系统;
• 应具备可自定义化的变更管理流程能力。
8.5 知识库管理
知识库管理要求如下。
• 宜支持知识智能分类与标签生成;
• 宜支持知识智能检索与问答;
• 宜支持文章批量导入或导出功能;
• 宜支持知识库内知识归类维护和管理;
• 宜具备草稿箱暂存知识的能力。
9 服务支撑层
9.1 可观测性管理
可观测性管理的要求如下。
a) 指标管理要求如下:
• 宜支持基于历史数据的动态基线自动学习;
• 宜支持多指标间的关联关系自动发现;
b) 日志管理要求如下:
• 应支持日志收集和存储能力,能够从不同的来源(如操作系统、应用程序、网络设备等)收集日志数据,并将其存储数据库或文件系统中;
• 应支持日志搜索和检索能力,支持快速、高效的日志搜索和检索功能。能够根据关键词、时间范围、 日志级别等条件,快速定位特定的日志记录,并提供相应的检索结果;
• 宜支持日志分析和统计能力,具备对日志数据进行分析和统计的能力,以发现潜在的问题、趋势和模式;
• 应支持日志实时监控和告警能力,能够实时监控日志数据,发现异常或关键事件,并触发相应的告警机制;
• 宜支持日志可视化和报告功能:具备将日志数据以可视化的方式展示给用户的能力。可以通过图表、仪表盘等形式呈现日志数据的统计信息和趋势,生成报告以供审计、分析和决策使用;
• 宜支持日志异常实时检测。
c) 链路管理要求如下:
• 宜支持基于链路分析的故障自动定位;
• 宜支持依赖关系自动发现,基于流量分析动态更新拓扑。
d) 拨测管理要求如下:
• 宜支持拨测任务配置能力,能够配置和管理拨测任务的参数和设置,如目标地址、拨测频率、测试方式(如PING、HTTP、TCP等)、超时时间、重试次数等;
• 宜支持分布式多点拨测能力,可以从不同的位置或节点进行拨测。模拟用户在不同地理位置访问网络和系统的情况;
• 宜支持拨测结果分析能力,支持对拨测结果进行分析和解读,对拨测的响应时间、丢包率、网络延迟等指标进行统计和分析,帮助评估网络和系统的质量和稳定性;
• 宜支持实时监控和告警能力,能够实时监控拨测任务的执行状态和结果,并在异常情况下触发告警,可以根据预设的阈值和规则,发送通知或告警给相关人员,以便及时发现和解决问题。
9.2 智能化运维
智能化运维的要求如下。
• 应支持私有化部署的运维领域大模型,具备自然语言理解、知识问答、方案生成能力;
• 应支持时序异常检测、 日志模式识别、根因定位、容量预测等算法,支持算法自动选择;
• 宜支持运维智能体(Agent)构建,单智能体自治执行,多智能体协同完成复杂任务;
• 宜支持运维知识图谱构建与推理,如故障传播分析;
• 宜支持私有化部署的运维领域大模型(LLM),具备自然语言理解、知识问答、方案生成能力
• 宜支持RAG知识检索。
10 数据资源层
10.1 CMDB(配置管理数据库)
a) 政务云配置管理数据库能力要求如下:
• 应支持统一的配置项管理规则,对各类配置项进行标准化定义和关系建模;
• 应支持统一的配置项管理规则,对各类配置项进行标准化定义和关系建模;
• 宜支持配置项的自动发现与识别,涵盖物理设备、虚拟资源、应用程序等;
• 宜实现配置项关系的自动构建与维护,支持依赖关系、组成关系等;
• 宜支持配置项全生命周期版本管理,记录所有变更历史。
• 宜采用机器学习技术实现配置项的智能分类和关系推理。
10.2 资产管理
a) 政务云资产管理能力要求如下:
• 应建立资产全生命周期管理机制,覆盖资产采购、入库、部署、运维、报废等各阶段;
• 宜实现资产信息与CMDB配置项的自动关联与同步,确保信息一致性;
• 宜支持资产信息的标准化管理,包括资产编号、型号规格、供应商信息等;
• 宜支持资产价值管理,记录资产原值、折旧信息、运维成本等财务数据。
10.3 服务管理
a) 政务云服务管理能力要求如下:
• 宜建立服务目录管理体系,明确定义各项服务的功能、服务等级等;
• 宜实现服务健康度监控,基于关键性能指标动态评估服务运行状态;
• 宜建立服务变更影响分析机制,评估基础设施变更对上层服务的影响范围;
• 宜支持服务拓扑可视化展示,直观呈现服务组件间的调用关系。
10.4 配置管理
a) 政务云配置管理能力要求如下:
• 宜建立统一的配置管理策略,确保各类系统配置的标准化和一致性;
• 宜支持配置文件的版本控制,所有配置变更需记录版本历史和变更原因;
• 宜实现配置合规性检查, 自动检测配置项是否符合安全基线和最佳实践。
10.5 拓扑管理
a) 政务云拓扑管理能力要求如下:
• 宜支持网络拓扑可视化展示,实时呈现网络设备连接关系;
• 宜实现应用拓扑动态构建, 自动识别应用组件间的调用关系和依赖路径;
• 宜建立拓扑数据与CMDB的自动同步机制,确保拓扑信息准确性。
11 数据接入层
11.1 数据采集
a) 政务云数据采集能力要求如下:
• 应支持主流监控协议的数据采集,包括但不限于 SNMP、IPMI、HTTP/HTTPS、gRPC、JMX、 Prometheus 等;
• 宜建立分级采集策略:根据数据重要性和实时性要求,设置不同的采集频率和优先级;
• 宜具备采集状态监控能力:实时监控采集任务执行状态,异常时自动告警并重试。
11.2 数据传输
a) 政务云数据传输能力要求如下:
• 宜支持加密传输通道:采用TLS/SSL等加密技术保障数据传输安全性;
• 宜实现数据压缩传输:对大规模监控数据采用压缩算法减少网络带宽占用;
• 宜建立可靠传输机制:支持断点续传、数据校验、重传机制确保数据完整性;
• 宜支持多路传输负载均衡:在多个传输通道间智能分配数据流量;
• 宜具备传输质量监控:实时监测传输延迟、丢包率等关键指标。
11.3 数据预处理
a) 政务云数据预处理能力要求如下:
• 宜实现数据格式标准化:将异构数据转换为统一的标准化数据格式;
• 宜支持数据清洗规则: 自动处理重复数据、缺失值填充、异常值检测等;
• 宜建立数据过滤机制:根据预设规则过滤无关数据,提高数据质量;
• 宜支持数据丰富化处理: 自动添加时间戳、数据源标识等元数据信息;
• 宜具备实时流处理能力:支持对数据流的实时处理和转换操作。
11.4 数据存储
a) 政务云数据存储能力要求如下:
• 应具备完善的数据容灾备份与恢复机制,包括:全量备份、增量备份、差异备份等多元化策略,跨地域容灾,备份数据可用性验证,快速恢复能力等。
• 宜支持多类型存储引擎:包括时序数据库、关系数据库、NoSQL数据库等;
• 宜建立分级存储策略:根据数据访问频率设置热数据、温数据、冷数据存储方案;
• 宜实现数据索引优化:建立高效索引机制支持快速查询和分析;
• 宜支持数据分区管理:按时间、类型等维度进行数据分区存储;
• 宜具备存储容量监控:实时监控存储使用情况,预警容量风险。
12 一体化管理
12.1 多级统一管理
a) 政务云多级管理能力要求如下:
• 应支持多级权限管理,应至少可分配中心管理权限、区域管理权限及租户管理权限;
• 应支持中心节点对区域节点的统一监控管理能力,可实现区域节点工单、告警、日志数据的统一采集与处理;
• 应支持中心节点对区域节点的统一运维服务能力,实现资源申请变更,安全策略申请变更流程自动化;
• 宜支持中心节点对区域节点重大故障的集中处置管理能力,区域节点发生重大故障,中心节点可对重大故障进行分析研判,并提供远程支持和解决方案;
• 宜支持中心节点对区域节点的统一运维事件和知识库的管理,区域节点运维事件工单闭环后,可上传中心节点形成事件备案,形成统一运维知识库,实现运维事件全局共享。
12.2 全域资源管理
政务云全域资源管理能力要求如下:
a) 资源管控能力要求如下:
• 应支持统一资源纳管能力,对政务云不同数据中心和不同异构云环境进行统一资源纳管,包含但不限于服务器、网络设备、安全设备等,提供统一资源池管理;
• 应支持统一监控管理能力,对云资源和基础设施进行统一监控,包含但不限于云平台、虚拟机、服务器、网络设备、安全设备等全面监控,并及时进行异常预警,保障业务系统稳定运行;
• 宜支持统一配置管理能力,统一维护云资源、业务、服务器、网络设备、安全设备等信息,确保政务云中所有设备的配置信息得到完整的记录;
• 宜支持统一运维服务能力,包含但不限于资源申请、变更、注销,防火墙策略开通等运维服务;
• 应支持统一可视化展示能力,包含但不限于工单管理、告警管理、资产管理、数据管理等多个维度进行统计及可视化展示。
b) 智能分析能力要求如下:
• 宜支持对跨区域运维数据的集中分析能力;
• 宜支持基于历史数据的趋势分析与运行态势研判;
• 宜支持对共性运维问题形成统一分析结论与指导建议;
• 宜支持对区域节点智能运维能力的策略配置与启停管理;
• 应支持智能分析结论与建议的留痕、审计与追溯。
c) 流程支撑能力要求如下:
• 应支持流程设计,能够提供流程设计工具,帮助用户设计和创建流程,包括流程图、流程步骤、流程节点、流程参数等方面的设计;
• 宜支持流程部署,可以将设计好的流程部署到系统中,包括流程的安装、升级、卸载等方面的操作。
• 应支持流程管理,可以对流程进行统一管理,包括但不限于流程的配置、权限管理、日志管理等方面的操作,方便用户对流程进行管理和维护。
• 应支持流程监控,可以监控流程的运行状态和执行情况,包括但不限于任务的执行时间、执行结果、异常情况等方面的监控。
d) 消息通知能力要求如下:
• 应支持消息的接收,可以接收来自不同渠道的消息,包括系统日志、告警信息、操作指令等;
• 宜支持消息的管理,可以对接收到的消息进行过滤、分类和管理。
• 应支持消息通知和提醒,可以向运维人员发送消息通知和提醒,包括但不限于告警通知、故障提醒等方面的通知和提醒,支持多种通知方式,包含担不限于邮件、短信、即时通讯等。