欢迎访问学兔兔标准下载网,学习、交流 分享 !
返回首页 |DB21
辽 宁 省 地 方 标 准
DB21/T 4419—2026
组织病理学全切片图像标注技术规程
Technical code of pract ice for aannotat ion of histopathology whole
s l ide images
2026 - 04 - 01 发布 2026 - 05 - 01 实施
辽宁省市场监督管理局 发 布
前 言
本文件按照 GB/T 1.1—2020《标准化工作导则 第 1 部分:标准化文件的结构和起草规则》 的规定起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由辽宁省数据局提出并归口。
本文件起草单位: 中国医科大学附属第一医院、东北大学、 中国医科大学、辽宁中医药大学、沈阳大学、锦州医科大学、大连市皮肤病医院、锦州医科大学附属第三医院、辽宁省肿瘤医院、沈阳市第七人民医院、沈阳理工大学、沈阳市妇婴医院、沈阳碳卡智能智造科技有限公司。
本文件主要起草人:齐瑞群、崔笑宇、马腾、周昕欣、张志涛、姜华茂、宋梦、高兴华、 吕成志、陆航、赵越、孙海静、张勇、王珍、张乐、方樱翰、邵一川。
本文件发布实施后,任何单位和个人如有问题和意见建议,均可以通过来电和来函等方式进行反馈,我们将及时答复并认真处理,根据实际情况依法进行评估及复审。
归口管理部门通讯地址:辽宁省数据局(辽宁省沈阳市皇姑区崇山中路109号),联系电话:024- 86916223。
标准起草单位通讯地址: 中国医科大学附属第一医院(辽宁省沈阳市和平区南京北街155号),联
系电话:024-83283333。
组织病理学全切片图像标注技术规程
1 范围
本文件确立了组织病理学全切片图像(Whole Slide Image, WSI)标注的程序,规定了程序确立(含标注任务定义、资源条件) 、程序指示(含前期准备、实施操作、审核与仲裁)、追溯与证实以及数据交付与归档的操作要求。
本文件适用于组织病理学全切片图像手工标注及半自动标注活动。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T 39725—2020 信息安全技术 医疗健康数据安全指南
GB/T 41864—2022 信息技术 计算机视觉 术语
GB/T 42755—2023 人工智能 面向机器学习的数据标注规程
GB/T 45674—2025 网络安全技术 生成式人工智能数据标注安全规范
YY/T 1833.1—2022 人工智能医疗器械 质量要求和评价 第 1 部分:术语
YY/T 1833.2—2022 人工智能医疗器械 质量要求和评价 第 2 部分:数据集通用要求
YY/T 1833.3—2022 人工智能医疗器械 质量要求和评价 第 3 部分:数据标注通用要求
3 术语和定义
GB/T 41864—2022、YY/T 1833.1—2022、YY/T 1833.3—2022 界定的以及下列术语和定义适用于本文件。
3.1
病理全切片图像 whole Slide Image (WSI)
利用数字切片扫描系统将传统的玻璃病理切片进行高分辨率数字化扫描,生成的包含切片全视野信息的金字塔结构数字图像。
3.2
手工标注 manual Annotation
由病理专业人员完全依赖病理学知识与视觉经验,使用标注工具手动完成感兴趣区域识别、定位与特征描述的过程。
3.3
半自动标注 semi-automatic Annotation
人工和机器混合完成的病理图像标注任务;具体指利用人工智能算法对病理图像进行预处理并生成初步标注结果,随后由病理专业人员对预标注结果进行审核、修正、增补的交互式标注过程。
3.4
真值 ground Truth
经由具备相应资质的病理学专家最终确认的、被作为算法训练或验证基准的标注数据。
3.5
标注一致性 annotation Consistency
不同标注模式下对同一病理特征识别与描述的吻合程度。
3.6
感兴趣区域 region of Interest (ROI)
根据诊断或研究目的,在全切片图像中选定的包含特定病理特征的图像区域。
3.7
标注元数据 annotation Metadata
描述标注数据属性的结构化信息,包括标注人员信息、标注时间、使用工具及版本、标注任务编号、质量审核记录等。
3.8
标注粒度 annotation Granularity
标注对象的精细程度,分为细胞级、组织级、病变级等不同层级。
3.9
数据预处理 data Preprocessing
为提升标注质量对原始病理图像进行的前期处理操作,包括去噪、重采样、图像配准等。
3.10
质量控制 quality Control (QC)
为确保标注结果符合预设标准而实施的一系列检查、审核与修正措施。
4 缩略语
下列缩略语适用于本文件。
WSI:病理全切片图像(Whole Slide Image)
ROI:感兴趣区域(Region of Interest)
JSON:JavaScript 对象表示法(JavaScript Object Notation)
XML:可扩展标记语言(Extensible Markup Language)
IoU:交并比(Intersection over Union)
5 程序确立
5.1 标注程序构成
组织病理学全切片图像标注程序包括程序确立、程序指示、追溯与证实、数据交付与归档等核心
阶段。具体的标注程序流程图见图 A.1。
5.2 标注任务定义
5.2.1 任务内容
应明确标注的具体目标(如“为 AI 辅助诊断模型训练提供皮肤病理 WSI 分割标注数据 ”)。
5.2.2 数据范围
应明确包含的组织类型、病变类型、样本数量及数据格式。数据格式应符合第 8 章的要求。
5.2.3 标注粒度
应明确标注层级,如细胞级、组织级或病变级。
5.2.4 任务规则
应由标注仲裁人员制定《标注作业指导书》(编制模板见附录 C),明确如下内容:
a) 标签体系:明确标签 ID、名称、定义、颜色编码及标签的层级关系(如父子标签);
b) 标注边界:明确如肿瘤区域与正常组织的分界判定规则;
c) 疑难处理:明确“不确定区域 ”的标记方式及仲裁流程。
5.2.5 任务分配
同一批次数据宜采用“背靠背 ”双盲标注方式,任务分配需记录标注人员、任务量及完成时限。
5.3 资源条件
5.3.1 人员配置
YY/T 1833.3—2022 所规定的标注人员角色分配方式适用于本文件,病理标注团队的人员配置应
满足以下要求,并建立明确的“标注执行-质量审核-专家仲裁 ”的逐级流转机制:
a) 标注执行人员:应具备组织病理学基础知识与形态学识别能力,熟练掌握标注工具的使用方法。负责依据《标注作业指导书》执行具体标注任务,遵循数据安全规范;
b) 标注审核人员:应具备独立开展病理诊断的能力,熟悉数字病理标注流程与质量控制要求。负责对初始标注结果进行质量检查,开展过程质控与一致性评价,出具质量报告;
c) 标注仲裁人员:应具备丰富的临床病理诊断经验及疑难病例判定能力。当多名标注执行人员对同一标注对象的标注结果不一致或存在争议时,负责进行最终判定,制定规则,审核真值结果。
5.3.2 工具配置
YY/T 1833.3—2022 第 7 章所规定标注工具的通用要求适用于本文件。标注工具应具备以下基本
功能与配置:
a) 处理对象:应支持 svs、ndpi、tiff 等核心格式,及其他符合医学数字病理规范的 WSI 格式;
b) 核心功能:应支持 WSI 金字塔结构多倍率无极缩放;提供点、线、矩形、多边形及画笔/橡皮擦 等 基 础 标 注 工 具; 支 持 操 作 撤 销 / 重 做 (Undo/Redo ) 功 能; 支 持 标 签 树 管 理 及 属 性(Attributes)扩展;
c) 人机协同:若涉及半自动标注,应支持模型推理结果的可视化叠加与编辑;
d) 管理功能:应具备分级权限管理功能,严格区分标注、审核、仲裁人员的操作权限;支持操作日志记录与导出;支持标注结果的批量导出;支持数据分级处理,适配核心数据加密标注需求;可与医疗健康数据管理平台对接。
6 程序指示
6.1 前期准备
6.1.1 伦理合规审查
涉及人体组织样本的数字病理图像数据,在开展标注前应确保其来源合法合规 。依据 GB/T
39725—2020 的要求,相关数据收集与标注计划应报相关医疗机构的伦理委员会审批。原则上需取得患者的知情同意;对于回溯性研究等已无法追溯到患者或获取同意代价太高的情况,在数据严格去标识化的前提下,可向伦理委员会申请知情同意豁免。
6.1.2 数据清洗
应在标注前完成以下数据清洗工作:
a) 冗余清洗:清理无关元数据,对数据进行查重,剔除重复的 WSI 样本;
b) 有效性清洗:限定文件大小阈值;剔除采集信息无法追溯、文件损毁无法预览的样本;排除数据缺失、非目标部位的无效图像;
c) 质量筛选:剔除染色不均、扫描分辨率不达标、图像质量不合格的样本。若剔除样本,需记录剔除原因及所用工具信息。
6.1.3 数据去标识化
核心病理数据在开展标注前,必须依据 GB/T 39725—2020 的要求开展去标识化处理,处理完成
后,应验证在受控共享环境下无法通过剩余信息反向识别患者身份,评估结果需留存备案。
在技术操作层面:
a) 对病理切片图像:应对图像中可能承载患者身份信息的宏观标签区域(如条码、手写姓名、住院号等)采用掩码遮盖、区域裁剪等方式,移除可识别个人身份的可见信息;
b) 对随附的结构化临床数据:应去除姓名、身份证号、联系方式等直接标识符,并对年龄、 日期等间接标识符进行泛化(如年龄区间化)或时间偏移转换处理,确保数据无法关联到特定自然人。
6.1.4 数据预处理
根据需求对清洗后的数据进行滤波、增强、重采样、尺寸裁剪或均一化处理。预处理过程应具备
可恢复性与可追溯性,并评估对后续模型的影响。
6.1.5 工具与人员准备
工具与人员准备应满足以下要求:
a) 工具调试:确认 WSI 可正常缩放、标签编辑正常;半自动模式下验证模型调用正常;确认权限管控及日志记录功能生效;
b) 人员准备:标注人员上岗前应完成《标注作业指导书》的专项培训及考核。考核合格后,应签署符合 GB/T 39725—2020 及 GB/T 45674—2025 要求的《数据安全责任承诺书》(见附录 D)。该承诺书中有关医疗隐私数据的保密义务,不因项目结束或人员离岗而终止,须满足相关法律法规的长期保护要求。
6.2 实施操作
6.2.1 模式选择
应根据任务需求选择以下模式之一:
a) 手工模式:适用于高精度金标准制作、疑难病理形态探索或无成熟算法支持的场景;
b) 半自动模式:适用于大规模数据初筛、常规细胞计数或已有高成熟度模型支持的场景。
6.2.2 手工模式操作步骤
手工模式操作步骤应按以下流程执行:
a) 浏览与定位:应首先在低倍镜下浏览全片,确定病变分布范围,随后切换至高倍镜(20 倍或40 倍)定位具体的感兴趣区域(ROI);
b) 勾画:应沿病变区域轮廓贴边勾勒,或采用规则图形(矩形、圆环、点)标记。轨迹应连续、边界清晰;
c) 覆盖原则:应遵循“先整体后局部 ”原则,病变区域需完整覆盖,避免遗漏浸润边缘;
d) 标签录入:勾画完成后应立即选择对应病理标签,确保标签与区域一致。核心数据需填写标注说明(如判定依据);
e) 自检:完成后应自查是否存在漏标、错标、标签错误。核心数据需进行双人互查。
6.2.3 半自动模式操作步骤
半自动模式操作步骤应按以下流程执行:
a) 预标注生成: 由机器端调用 AI 模型对 WSI 进行推理,生成初步标注结果;
b) 阈值筛选: 由人工端手动调节置信度阈值,过滤机器预标注的低质量结果;
c) 交互修正: 由人工端对预标注结果执行确认、修改边界、删除误检或补录漏检操作,完成人机混合标注闭环。
6.2.4 标注数据流转方式
标注数据在人员间的流转方式包括以下两类:
a) 双盲标注:适用于诊断、分类或定位标注任务。应由至少 2 名标注人员背靠背独立完成同一图像的标注操作,形成比对数据;
b) 线性标注:适用于分割或病灶范围标注任务。应由标注人员完成初始勾画, 由复核人员进行修改与完善,形成待审核数据。
6.3 审核与仲裁
6.3.1 审核流程
标注数据的审核流程应满足以下要求:
a) 结果核验:审核人员应对双盲标注产生的比对不一致的结果进行介入判定;应对线性标注提交的边界与属性进行审查与确认;
b) 疑难分流:经审核确认无误或介入判定后达成一致的结果予以通过;经审核仍无法判定、存在重大分歧或涉及核心指标的疑难数据,应提交仲裁;
c) 审核记录:审核过程及结果应形成书面记录(或电子日志),内容包含审核人、审核时间、问题描述及处理意见,确保过程可追溯。
6.3.2 仲裁流程
疑难及争议数据的仲裁流程应按以下步骤执行:
a) 分歧提交:当存在标注分歧或疑难案例时,由审核人员提交至仲裁专家,并附分歧说明;
b) 仲裁执行: 由至少 3 名(且为单数,如 3 人、5 人)标注仲裁人员依据病理学规范开展集体评议;
c) 结果处理:达成一致的按共识标注;未达成一致且经评估属于切片伪影、组织折叠或非目标区域的,标记为“忽略 ”;对于病理特征本身具有歧义、专家组亦无法确诊的区域,标记为“不确定 ”。“忽略 ”与“不确定 ”区域的数据均不应作为算法模型训练的有效真值。
7 追溯与证实
7.1 过程记录与追溯
在执行程序过程中 ,应记录并保持以下全流程信息以备追溯,确保追溯的完备性符合 YY/T
1833.2—2022、YY/T 1833.3—2022 及 GB/T 45674—2025 的要求:
a) 人员信息记录:完整记录涉及标注任务及质控全流程的人员信息,包括任务创建者、管理者、标注执行人员、审核人员及仲裁人员等;
b) 操作与流转日志:详细记录标注任务包含的所有操作行为(如初始标注、比对、合并、补充、修改、删除、审核、仲裁等),以及标注数据的流转动作(如传输、复制等) 。 日志内容需关联具体的执行时间与操作者,并确保不可篡改;
c) 工具环境信息:记录所用标注工具的具体标识与运行环境,包括工具名称、完整版本号、制造商及运行环境等;
d) 时间节点信息:精确记录每个样本完成初始标注、质量审核及争议仲裁等关键环节的时间节点。
7.2 过程验证方法
7.2.1 机器验证
在任务进行期间(如执行双盲或多人标注任务时),安排超过一名人员做同一个子任务以选择出
最优、最正确的标注结果。在此环节中,结果的验证与选择可通过下列方式:
a) 自动选择:通过与标注工具匹配的模型推理,或拟合若干个标注结果,选择其中置信度最高的标注结果,作为最终结果;
b) 人工辅助选择:人工对多个标注结果进行对比,从而挑选出置信度最高的标注结果作为最终结果。对于需要特定专业知识标注的领域,进行人工辅助标注时应以多个专家的共同商议结果作为最终结果。
7.2.2 埋题验证
在任务进行期间,除了常规标注子任务外,在任务中混进若干已知结果的测试题(需匹配数据特
征、限制使用次数),以此验证标注质量。
7.2.3 人员状态验证
通过对标注人员的操作规范性、注意力状态及标注准确率等方面进行检查与监测,发现异常时对
对应时段的标注数据进行检查或返工。
7.2.4 一致性检查
采用统计规则或模型验证方法评估标注一致性,一致性阈值可根据项目需求设定,发现离群点或下降趋势时及时预警。
7.3 结果评价指标
7.3.1 质量特性要求
标注结果的质量特性应满足以下要求:
a) 准确性:标注结果需与标注仲裁人员或其组成的专家组确认的真值保持一致;
b) 一致性:标注人员个体内、个体间对标注规则的理解及操作结果需保持一致;
c) 精度:对可定量描述的标注结果,需验证其符合预设的精度指标;
d) 其他特性:标注信息需具备可理解性、可访问性、可移植性、保密性与可追溯性。
7.3.2 定量评价指标
7.3.2.1 准确性指标
a) 检出与分类任务:检出任务可使用召回率(Recall) 、精确度(Precision)评价;分类任务可使用灵敏度(Sensitivity)、特异度(Specificity)、准确率(Accuracy)评价。计算方法见式(1)至(4):
Recall / Sensitivity= 푇PN................................................................(1)
P푟푒푐isioᵷ= 푇P푇P.........................................................................(2)
푆푝푒푐ifi푐itY= 푇P.........................................................................(3)
퐴푐푐푢푟a푐Y= 푇P++퐹N...................................................................(4)
式中:
TP ——真阳性(正确识别为目标类别)的样本数;
TN ——真阴性(正确识别为非目标类别)的样本数;
FP ——假阳性(错误识别为目标类别)的样本数;
FN ——假阴性(错误识别为非目标类别)的样本数。
b) 分割任务:可使用交并比(IoU)、Dice 系数评价分割任务的准确性指标。
. 交并比:评价预测的分割区域与真实分割区域的重合程度,计算方法见式(5):
IoU ......................................................................(5)
. Dice 系数:用于计算两个分割区域的重合度,计算方法见式(6):
Dice ......................................................................(6)
式中:
A ——待评价的标注区域;
G ——专家确定的真值区域。
7.3.2.2 一致性指标
分类任务采用 Cohen's Kappa 系数评价标注人员间的一致性。计算方法见式(7)和(8) ,判定
方法见表 1。
K= ..............................................................................(7)
pe
式中:
Acc ——观察一致性;
pe ——期望一致性;
m ——类别数量;
Nij ——混淆矩阵的数值。
表 1 Cohen's Kappa 系数一致性判定标准
7.3.2.3 精度指标
精度指标的具体评价方式与允许误差阈值(如边界像素偏差等)应在开展标注作业前,于《标注
作业指导书》 的质量要求中予以明确。标注完成后,应依据《标注作业指导书》 中预设的精度参数,对标注边界与专家真值边界的吻合度进行验证与评价。
7.3.3 非定量评价指标
对于可理解性、可访问性、可移植性、保密性等其他特性,不采用数学公式计算,应采用人工抽
检、平台权限验证、数据格式解析及安全审计等非定量方式进行验证与评价。
7.3.4 评价结果的应用
评价指标达到本规程或《标注作业指导书》设定阈值的批次数据,视为合格并进入交付环节;评
价结果未达标的,需将不合格数据退回重置或进行人工复标,同时应暂停相关标注执行人员的任务,对其重新进行培训与评估。
8 数据交付与归档
8.1 交付内容
交付内容与类别应符合 GB/T 42755—2023 的相关规定,标注项目交付物应包含以下内容:
a) 标注结果:JSON 格式的结构化文件(含细胞、区域坐标、描述、创建时间及最后修改时间等标注信息,结构规范见附录 B);
b) 说明文档:含原始 WSI 扫描参数、倍率、染色方式、人员列表及标签映射表;
c) 标注规范:项目执行的标注规则文档;
d) 原始数据:原始 WSI 文件(核心数据仅提供授权访问)。
8.2 交付验收
标注管理方应在收到交付物后合同或任务协议约定的期限内,依据《标注作业指导书》约定的验
收标准对交付物进行检查与评价,确定是否通过验收;若未在约定时间内提出异议,视为验收通过。
8.3 归档要求
数据归档应满足以下规范与安全要求:
a) 格式:标注文件应符合 JSON Schema 规范;
b) 命名:归档的整体数据包(或项目文件夹)建议采用“项目编号_数据级别_数据类型_ 日期 ”规则(如 XY2025_核心数据_皮肤病理_20251125) ;其内部的单张 WSI 标注文件命名规则建议参照附录 B.2.2 的示例执行,允许标注方根据需求在文件或文件夹命名中增加自定义字段;
c) 安全:递交与保存应约定介质、删除原则及责任起止点;应增设数据校验环节(如核对 MD5值),确保交付数据的完整性;
d) 期限:依据 GB/T 39725—2020 的要求,标注数据归档保存期限应满足相关业务需求及监管要求;
e) 销毁:对于超过保存期限或按约定需彻底删除的数据,应采取不可恢复的介质覆写或物理粉碎方式进行安全销毁,并留存销毁记录。
附 录 A
(资料性)
标注程序流程图
图 A.1 标注程序流程图
附 录 B
(资料性)
标注数据存储结构规范
B.1 JSON Schema 完整可机读格式
{
"$schema": "https://example.org/standard/pathology-annotation.schema.json", "task_id": "TASK_WSI_PATH_2025001",
"image": {
"uid": "WSI_LN_20251128_00001",
"modality": "WSI",
"shape": [ 100000,
80000
],
"spacing": [ 0.25,
0.25
],
"mpp": 0.25,
"origin": [ 0,
0
],
"direction": [ 1,
0,
0,
1
],
"acquisition": {
"date": "2025-11-28",
"device": "Scanner_Model_XYZ",
"staining_method": "HE",
"series_number": "001",
"hospital_id": "LN_HOSP_003"
}
},
"annotations": [
{
"id": "ANNOT_CELL_001",
"category": "cell",
"label_code": "LYMPHOCYTE",
"type": "polygon",
"segmentation": [
[
1250.5,
678.2,
1255.3,
678.5,
1255.1,
683.4,
1249.8,
683.1,
1250.5,
678.2
]
],
"bbox": [ 1249.8,
678.2,
5.5,
5.2
],
"attributes": {
"cell_morphology": "normal",
"segmentation_method": "manual",
"confidence": 0.99,
"annotator_note": "细胞核居中,形态规则"
},
"timestamp": "2025-11-28T 10:35:22Z" },
{
"id": "ANNOT_LESION_001",
"category": "lesion",
"label_code": "TUMOR_INVASIVE", "type": "polygon",
"segmentation": [
[
2500.1,
1800.3,
2650.4,
1802.5,
2648.2,
2000.7,
2498.5,
1998.2,
2500.1,
1800.3
]
],
"bbox": [ 2498.5,
1800.3,
151.9,
198.4
],
"attributes": {
"lesion_grade": "II",
"invasion_depth": " ≤5mm",
"segmentation_method": "semi_auto",
"confidence": 0.95,
"slice_range": [ 1,
1
],
"volume_estimate": 1500.8
},
"timestamp": "2025-11-28T 10:42: 15Z" }
],
"metadata": {
"annotator": "Annotator_ID_003",
"reviewer": "Reviewer_ID_001",
"institution": "Liaoning_Pathology_Center",
"software": {
"name": "Patho_Annotation_Platform",
"version": "V2.4.0",
"ai_model": {
"model_name": "Patho_SemiAuto_SegNet",
"model_version": "V0.9.5" }
},
"timestamps": {
"task_start": "2025-11-28T 10:30:00Z",
"task_end": "2025-11-28T 11: 10:25Z",
"last_modify": "2025-11-28T 11:08:40Z" },
"qc": {
"status": "passed",
"issues": [],
"qc_score": 95 },
"version": "V 1.1", "audit": [
{
"action": "task_create",
"user": "System_Admin",
"time": "2025-11-28T 10:28: 15Z" },
{
"action": "image_load",
"user": "Annotator_ID_003",
"time": "2025-11-28T 10:30:00Z" },
{
"action": "qc_review",
"user": "Reviewer_ID_001",
"time": "2025-11-28T 14:20: 10Z" }
],
"data_level": "important_data",
"unique_identifier": "LN_WSI_20251128_TASK001_UID00001_V 1.1" }
}
}
B.2 格式规范与说明
B.2.1 核心字段说明
a) 唯一标识字段:
. task_id:任务唯一标识,建议格式为“任务类型_模态_年份_序号 ”或采用 UUID,确保任务级区分;
. image.u id:切片唯一 ID,格式为 “WSI_省份缩写_ 日期_序号 ”,解决单张切片重复标注识别问题;
. annotations[*].id:单个标注实体唯一 ID,格式为 “ANNOT_类型_序号 ”,确保标注级追溯;
. metadata.unique_identifier:全局唯一标识,整合多维度信息,确保跨任务、跨切片的唯一性。
b) 时间戳字段:
. 任务级:metadata.timestamps(开始/结束/最后修改时间);
. 标注级:annotations[*].timestamp(标注创建时间及最后修改时间);
. 操作级:metadata.audit[*].time(全流程操作时间),实现毫秒级追溯。
c) 病理专属字段:
. image.acquisition.staining_method:染色方式(HE/IHC 等);
. annotations[*].attributes:包含病理属性(病变分级、浸润深度、细胞形态等);
. annotations[*].label_code:采用标准化病理术语编码,符合 WHO 肿瘤分类标准。
B.2.2 格式要求
a) 字符编码宜采用 UTF-8,JSON 结构宜符合国际通用的 JSON 数据交换标准语法规范;
b) 坐标、间距等数值保留 2 位小数,确保精度统一;
c) 标签编码(label_code)采用英文大写字母 + 下划线格式,不宜使用中文或特殊字符;
d) 核心数据(data_level="core_data") 的 JSON 文件宜额外采用 SM4 加密算法加密,加密密钥由数据安全负责人保管;
e) 单个 JSON 文件对应单张 WSI 的完整标注数据,文件名命名规则为“image.u id_task_id_version.json ”,如
“WSI_LN_20251128_00001_TASK_WSI_PATH_2025001_V1.1.json ”。
B.2.3 兼容性要求
a) 支持与主流病理分析软件(如 QuPath v0.4.4+、ImageJ 1.8.0+)及 AI 框架(如TensorFlow 2.10.0+、PyTorch 1.13.0+)直接对接;
b) 标注数据可通过工具自动转换为 GeoJSON、XML 等格式,转换过程无信息丢失;
c) 字段设计兼容 GB/T 42755—2023、YY/T 1833.3—2022 等国家标准,确保跨机构数据兼容性。
附 录 C
(资料性)
标注作业指导书编制模板
表C.1 标注作业指导书
附 录 D
(资料性)
数据安全责任承诺书模板
一、承诺事项
本人郑重承诺,在参与上述项目组织病理学全切片图像标注相关工作期间,严格遵守《中华人民共和国数据安全法》 《中华人民共和国个人信息保护法》 《组织病理学全切片图像标注技术规程》及项目数据安全管理规定,全面履行以下数据安全责任:
资质合规承诺:确认本人具备参与本项目数据处理的相应资质, 已完成项目数据安全专项培训并考核合格,熟悉数据分级分类规则、典型安全风险场景、遵纪守法要求及对应安全操作要求。
操作规范承诺:严格按照项目授权范围开展数据处理工作,仅在指定的安全环境内操作,不超权限访问、下载、复制数据;遵守 “最小必要 ” 原则,不获取与工作无关的任何数据信息。
数据保护承诺:对接触的所有标注数据(含原始 WSI 、标注结果、过程数据及元数据)严格保密,不通过任何渠道(包括但不限于截图、存储介质拷贝、网络传输、 口头传播等)泄露、传播或转让数据;不擅自留存数据副本或衍生数据。
设备使用承诺:仅使用项目指定的合规设备处理数据,不将数据存储至个人设备或非授权存储介质;设备出现故障或异常时,立即停止操作并按流程上报,不擅自拆机或数据迁移。
安全防护承诺:主动配合项目数据安全技术防护措施实施,不规避、篡改或破坏访问控制、操作审计、数据加密等安全机制;妥善保管个人账号、密码及授权凭证,不转借他人使用或泄露。
应急处置承诺:发现数据泄露、丢失、篡改或疑似安全事件时,立即终止相关操作,在 1 小时内上报项目数据安全负责人及所属单位安全管理部门,并配合开展事件调查与处置,不隐瞒、不拖延、不谎报。
数据销毁承诺:在数据使用结束或约定的使用期限届满后 30 天内,本人承诺严格按照控制者或项目管理方的要求,对留存在本地授权设备上的二次利用数据及衍生数据进行彻底销毁,并配合提供销毁的书面证明,确保不留存任何数据副本。
离岗交接承诺:因岗位调整、离职等原因离开项目时,本人承诺:
(1) 主动交还所有与数据相关的资料、存储介质及授权设备;
(2) 配合完成账号注销、权限回收等流程,确保无残留访问权限;
(3) 离岗或离职后仍严格遵守本项目的数据保密义务,不因离开岗位而免除保密责任,若发生泄露愿依法承担相应的法律责任。
二、责任追究
本人明确知晓并认可:若违反上述承诺事项,将依据《组织病理学全切片图像标注技术规程》 《中华人民共和国数据安全法》等相关规定及所在单位规章制度接受处理;造成数据安全事故或损失的,承担相应经济赔偿责任;构成违法犯罪的,依法承担相应法律责任。
三、其他事项
本承诺书自签署之日起生效。其中涉及患者隐私及核心医疗数据的保密义务,不因本人离岗或项目结束而终止,该保密义务具有长期法律约束力,直至相关数据被合法彻底销毁或公开。
本承诺书一式三份,承诺人留存一份、项目管理方留存一份、所属单位安全管理部门留存一份,具有同等法律效力。
四、签署确认
说明:
(1) 承诺人需如实填写个人及项目相关信息,“参与数据级别 ” 需根据实际参与处理的数据类型勾选对应选项,多重级别需全部勾选。
(2) 承诺事项需由承诺人逐一条目阅读确认,签署前需手写 “ 已阅读并理解本承诺书全部内容, 自愿承担相应责任 ” 字样。
(3) 项目数据安全负责人需对承诺人资质及培训情况进行审核,审核通过后签字确认;所属单位安全管理部门需完成备案登记并加盖公章。
(4) 本承诺书需使用黑色签字笔填写,字迹清晰、无涂改,修改处需加盖校对章或签字确认。
参 考 文 献
[1] GB/T 1.1—2020 标准化工作导则 第 1 部分:标准化文件的结构和起草规则.
[2] 中华医学会病理学分会, 中国医疗保健国际交流促进会病理学分会, 中国医学装备协会病理装备分会, 等. 人工智能辅助胃部组织病理学诊断的数据采集和标注专家共识[J]. 中华病理学杂志, 2024, 53 (6) : 561-567.
[3] 中华医学会消化内镜学分会人工智能协作组. 中国消化内镜人工智能数据采集与标注质量控制体系专家共识意见(完整版)[J]. 中华消化内镜杂志, 2019, 36(11) : 800-804.
[4] 国家卫生健康委员会. 卫生健康标准管理办法 : 国卫法规发〔2019〕44 号 [A]. 2019.
[5] Landis J R, Koch G G. The measurement of observer agreement for categorical data [J]. Biometrics, 1977, 33 (1) : 159-174.