欢迎访问学兔兔标准下载网,学习、交流 分享 !

返回首页 |
当前位置: 首页 > 资料下载>地方标准规范 > DB43/T 3250-2025 基于高通量测序的农作物基因分型检测技术规程

DB43/T 3250-2025 基于高通量测序的农作物基因分型检测技术规程

收藏
关键词:农作物   基因   通量   技术规程   DB43
资源简介

  ICS 07.080 CCS B 21

  43

  湖 南 省 地 方 标 准

  DB 43/T 3250—2025

  基于高通量测序的农作物基因分型检测

  技术规程

  Code of practice for crop genotyping - high-throughput sequencing method

  2025 - 07 - 18 发布 2025 - 10 - 18 实施

  湖南省市场监督管理局 发 布

  前 言

  本文件按照GB/T 1.1—2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定起草。

  请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。

  本文件由湖南省农业农村厅提出。

  本文件由湖南省农业标准化技术委员会归口。

  本文件起草单位:华智生物技术有限公司、袁隆平农业高科技股份有限公司、湖南师范大学生命科学学院、湖南农业大学农学院、湖南省农业科学院作物科学研究所、深圳华大智造科技股份有限公司、湖南华智智造科技有限公司。

  本文件主要起草人:黄刚、田冰川、杨远柱、梁满中、唐顺学、严明理、康雷、彭欢欢、谭司苡、李为国、方妙全、李乐、许美娟、肖湘谊、王俊领、黄祖军、罗超伟、尹立新、唐宜、戴倩。

  基于高通量测序的农作物基因分型检测

  技术规程

  1 范围

  本文件规定了基于高通量测序的农作物基因分型检测的样本质量控制、高通量测序、测序数据质控及基因分型检测。

  本文件适用于基于高通量测序的农作物基因分型。

  2 规范性引用文件

  下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。

  GB/T 6682 分析实验室用水规格和试验方法

  GB/T 30989 高通量基因测序技术规程

  GB/T 33767.14-2023 信息技术 生物特征样本质量 第14部分:DNA数据

  GB/T 35537 高通量基因测序结果评价要求

  GB/T 35890-2018 高通量测序数据序列格式规范

  GB/T 37864 生物样本库质量和能力通用要求

  GB/T 37874 核酸提取纯化方法评价通则

  3 术语和定义

  GB/T 30989 界定的以及下列术语和定义适用于本文件。

  3. 1

  基因型 genotype

  个体在一个或多个基因座上的等位基因组合。

  3.2

  基因分型 genotyping

  通过检测及分析个体脱氧核糖核酸(DNA)序列来确定其基因型的技术。

  4 样本质量控制

  4. 1 通用要求

  4.1.1 DNA

  用于高通量测序的 DNA 根据 GB/T 35537 中碱基测序准确率的要求进行质量控制,DNA 同时满足完整性和浓度要求才是合格样本。

  4.1.2 样本

  农作物样本及相关数据的使用遵守区域、国家和国际的伦理规范。农作物样本的取样、前处理过程、保存、销毁、运输等操作符合 GB/T 37864 的规定。

  4.1.3 水和试剂

  本文件所使用的水均为一级水,符合 GB/T 6682 规定的一级水要求。除非另有说明,在分析中仅使用分析纯试剂,所有试剂溶液宜大体积配制、小体积分装后高压灭菌后使用,不宜高压灭菌的试剂用0.22 μm 膜过滤除菌,酶溶液避免反复冻融。

  4.2 叶片样本取样、保存及运输

  4.2.1 取样

  农作物叶片样本取样要求如下:

  a) 在田间采集无病虫斑、无发黄枯萎、无霉变、无污染物的新鲜叶片样本后,将叶片样本装入有编号的塑料自封袋、牛皮纸袋、圆底微量离心管(EP 管)或 96 孔深孔板中;

  b) EP 管与自封袋要将口密封以防样本泄露或污染;

  c) 牛皮纸袋口折叠 3 次进行封口以防样本泄露或污染;

  d) 96 孔深孔板用硬滤纸板覆盖,用橡皮筋扎紧以防叶片样本泄露或污染。

  4.2.2 保存及运输

  本文推荐简单处理法、干燥处理法及冷冻处理法,其它能保障叶片样本在保存及运输中 DNA 不降解的方法均可适用。

  4.2.2.1 简单处理法

  样本保存运送时间小于 1 d,样本放入泡沫箱后加入蓝冰袋运送到实验室。

  4.2.2.2 干燥处理法

  样本保存运送时间大于 1 d 但小于 1 w,根据水份含量高低分两种处理方法如下:

  a) 水份含量较低的样本,用二氧化硅硅胶将叶片干燥变脆后,密封保存或运送;

  b) 水份含量较高的样本,用真空冷冻干燥机将叶片冷冻干燥变脆后,密封保存或运送。

  4.2.2.3 冷冻处理法

  样本保存运送时间大于 1 w 但不超过 6 m,样本用液氮速冻后存入-80 ℃冰箱保存。样本装入有足量干冰的泡沫箱进行长距离运输。

  4.3 种子样本取样、保存及运输

  4.3.1 取样

  选取无病虫斑、无霉变、无污染的种子去净泥土或灰尘,装入有编号的塑料自封袋、牛皮纸袋、圆底 EP 管或 96 孔深孔板中。

  4.3.2 保存

  千粒重小于 50 g 的种子样本,不少于 4 g 或不低于 60 粒。千粒重大于 50 g 的种子样本,不少于 10 g 或不低于 20 粒。

  4.3.3 运输

  干燥的种子打包后常温快递运输,未经干燥的种子打包后低温运输。

  4.4 DNA 提取

  本文推荐采用 Cetyltrimethylammonium Bromide 法或离心柱提取法提取 DNA,其它能满足高通量测序文库构建要求的提取方法均可适用,DNA 质量符合 GB/T 37874 的要求。

  4.4.1 CTAB 磁珠提取法

  4.4.1.1 样本干燥

  农作物叶片样本 DNA 提取宜采用本方法,取 30 mg 组织装入 EP 管或 96 孔深孔板,真空冷冻干燥12 h 以上。

  4.4.1.2 样本研磨

  EP 管或 96 孔深孔板中加入钢珠,盖上硅胶膜,置于自动化研磨仪中进行研磨。

  4.4.1.3 DNA 提取

  用 CTAB 试剂裂解组织并离心获得上清溶液,然后加入磁珠进行 DNA 纯化,用double distilled water溶解,获得高质量的基因组 DNA。

  4.4.2 离心柱提取法

  4.4.2.1 样本干燥

  农作物种子、肉质块根、高油高脂类组织 DNA 提取宜采用本方法,取新鲜组织 100 mg、干组织 30 mg 装 EP 管或 96 孔深孔板中,真空冷冻干燥 12 h 以上。

  4.4.2.2 样本研磨

  EP 管或 96 孔深孔板中加入钢珠,盖上硅胶膜,置于自动化研磨仪中进行研磨。

  4.4.2.3 DNA 提取

  用含 #-巯基乙醇和 Rnase 的裂解液 37℃孵育30 min,进行组织裂解。加入蛋白酶 K 后,水浴2 h~3 h。加入氯仿并混匀后离心,吸取上层水相至新的管孔中,加入等体积缓冲液后,转入离心柱,进行 2次漂洗后,用 TE 进行溶解,获得高质量的基因组 DNA。

  4.5 DNA 质控

  DNA 进行完整性和浓度质控,两项质控均达标才是合格 DNA。

  4.5.1 DNA 完整性质控

  本文件推荐用 1%浓度的琼脂糖凝胶电泳法对 DNA 进行完整性质控,其它能满足 DNA 完整性质控的方法均可适用。基因组 DNA 完整性判断标准:

  a) 凝胶电泳主带单一,在 15 kb 以上条带清晰,无严重降解;

  b) 如主带不清晰呈弥散状,则为严重降解样本;

  c) 完整性检测图谱见附录 A 图 A.1。

  4.5.2 DNA 浓度质控

  本文推荐用荧光染料法进行 DNA 浓度测定,其它能满足 DNA 定量的方法均可适用。DNA 浓度不低于 20 ng/μL。

  5 高通量测序

  5. 1 步骤

  5.1.1 文库构建及质控

  质控合格 DNA 进行片段化后连上接头,Polymerase Chain Reaction 扩增后进行文库片段选择,获得常规测序文库;进行靶向测序文库构建还需用探针对常规测序文库进行杂交捕获和 PCR 扩增,获取靶向测序文库。

  5.1.2 测序信号收集

  以测序文库为模板,在测序反应体系的作用下,游离核苷酸与文库模板进行配对、结合及延伸,核苷酸所带荧光基团发出荧光,通过高清摄像头拍摄照片,收集保存荧光信号,完成测序反应。

  5.1.3 碱基识别

  对测序反应中拍摄的照片、图像进行处理分析,将荧光信号转变为碱基序列信息,得到测序原始数据,输出 Fast Quality 格式数据文件。

  5. 2 联合探针锚定测序法

  5.2.1 测序文库制备及质控

  5.2.1.1 DNA 片段化

  机械打断法或酶切打断法将 DNA 片段化。

  5.2.1.2 文库构建

  片段化 DNA 经接头连接、纯化、PCR 扩增及片段选择,获得两端接头、中间有待测 DNA 片段的文库,两端接头主要包括扩增及测序引物互补序列、标签序列。

  5.2.1.3 文库质控

  测序文库浓度、片段大小检测:文库浓度≥10 ng/μL,文库片段大小主峰在 450 bp~600 bp 为合格文库。

  5.2.2 测序文库环化及 DNB 制备

  5.2.2.1 解链

  双链的 DNA 测序文库进行 95 ℃高温变性解链成单链。

  5.2.2.2 环化

  加入夹板引物及 T4 连接酶反应体系进行环化反应。

  5.2.2.3 消化

  环化反应结束后加入核酸外切酶 I 和核酸外切酶Ⅲ进行消化,去除未环化线性 DNA 文库,纯化后获得环化产物。

  5.2.2.4 DNB 制备

  环化产物经 RCA 扩增制备成 DNA Nano Balls,获得测序模板。

  5.2.3 DNB 加载

  将准备好的 DNB 加载到测序载片中。

  5.2.4 碱基循环测序

  5.2.4.1 测序引物与测序模板结合

  测序引物与测序模板的接头序列互补配对。

  5.2.4.2 生化反应

  依次加入带特定荧光标记的四种脱氧核糖核苷酸,通过 DNA 聚合酶的作用,使得测序引物 3’-末端进行单脱氧核糖核苷酸结合及延伸,荧光标记被切除激发出荧光信号。

  5.2.4.3 荧光信号采集

  CCD 照相机对测序载片拍照,采集并保存单次延伸的荧光信号,四种脱氧核糖核苷酸的延伸反应和信号采集结束后,完成一轮测序。

  5.2.4.4 循环测序

  重复 5.2.4.2 和 5.2.4.3 的步骤,直至将所有信号采集完成。

  5.2.4.5 双端测序

  进行双端测序时,Read1 端测序完成后,MDA 聚合酶链置换反应,重复 5.2.4.2 、5.2.4.3 和 5.2.4.4的步骤,进行 Read2 端测序,直至将所有信号采集完成。单端测序不需要进行此步骤。

  5.2.4.6 标签序列测序

  标签序列的测序引物与测序模板中的标签序列上游序列互补配对,重复 5.2.4.2 、5.2.4.3 和 5.2.4.4步骤,直至将标签序列信号采集完成。

  5.2.4.7 碱基识别

  信号分析软件对采集得到的荧光信号图片进行处理和分析,将荧光信号转换成碱基序列。碱基序列以 FASTQ 格式的文件进行存储,FASTQ 格式中每一条测序序列用4 行信息表示,符合 GB/T 35890 中6.1 的要求,FASTQ 格式文件示例如附录 B 图 B.1。

  5.2.4.8 数据拆分

  根据标签序列将混合测序样本数据进行拆分。

  5.2.4.9 测序报告生成

  生成测序芯片数据产出率、产出有效 Reads 数、数据质量值、测序读长等参数的报告。

  5.3 边合成边测序法测序

  5.3.1 测序文库制备及质控

  5.3.1.1 DNA 片段化

  机械打断法或酶切打断法将 DNA 片段化。

  5.3.1.2 文库构建

  片段化 DNA 经接头连接、纯化、PCR 扩增及片段选择,获得两端接头、中间有待测 DNA 片段的文库,两端接头主要包括扩增及测序引物互补序列、标签序列。

  5.3.1.3 文库质控

  测序文库浓度、片段大小检测:文库浓度≥10 ng/μL,文库片段大小主峰在 450 bp~600 bp 为合格文库。

  5.3.2 测序文库加载到测序载片

  测序文库加载到测序载片,通过桥式PCR,测序文库在测序载片上进行簇生成,获得测序模板。

  5.3.3 碱基循环测序

  5.3.3.1 测序引物与测序模板结合

  测序引物与测序模板的接头序列互补配对。

  5.3.3.2 生化反应

  依次加入带特定荧光标记的四种脱氧核糖核苷酸,通过 DNA 聚合酶的作用,使得测序引物 3’-末端进行单脱氧核糖核苷酸结合及延伸,荧光标记被切除激发出荧光信号。

  5.3.3.3 荧光信号采集

  CCD 照相机对测序载片拍照,采集并保存单次延伸的荧光信号,四种脱氧核糖核苷酸的单碱基延伸反应和信号采集结束后,完成一轮测序。

  5.3.3.4 循环测序

  重复 5.3.3.2 和 5.3.3.3 的步骤,直至将所有信号采集完成。

  5.3.3.5 双端测序

  进行双端测序时,Read 1 端测序完成,将测序产生的新序列从测序模板上洗脱,通过桥式 PCR 扩增获得测序模板的互补链,然后切除掉测序模板,以互补链为新的测序模板,重复 5.3.3.2 、5.3.3.3 和5.3.3.4 步骤,测序获得 Read 2。

  5.3.3.6 标签序列测序

  标签序列的测序引物与测序模板中的标签序列上游序列互补配对。重复 5.3.3.2 、5.3.3.3 和 5.3.3.4步骤,直至将标签序列信号采集完成。

  5.3.3.7 碱基识别

  信号分析软件对采集得到的荧光信号图片进行处理和分析,将荧光信号转换成碱基序列。碱基序列以 FASTQ 格式的文件进行存储,FASTQ 格式中每一条测序序列用 4 行信息表示,符合 GB/T 35890- 2018 中 6.1 的要求,FASTQ 格式文件示例如附录 B 图 B.1。

  5.3.3.8 数据拆分

  根据标签序列将混合测序样本数据进行拆分。

  5.3.3.9 测序报告生成

  生成测序芯片数据产出率、产出有效 Reads 数、数据质量值、测序读长等参数的报告。

  6 测序数据质控及基因分型检测

  6. 1 测序数据质量分析及过滤

  6.1.1 测序数据质量分析

  根据 GB/T 33767.14-2023 中 6.1.1 的规定,用生物信息分析软件对测序数据进行质量分析。

  6.1.2 测序数据过滤

  删除不符合质量要求的数据,获得纯净数据,纯净数据的文件仍是 FASTQ 格式,符合 GB/T 35890- 2018 中 6.1 的要求,且不包含测序建库接头序列。

  注:接头序列是一段已知的短核苷酸序列,用于连接未知的目标测序片段。

  6.2 基因分型

  6.2.1 序列比对

  6.2.1.1 参考基因组比对

  用生信分析软件,将纯净数据比对到参考基因组,确定测序 Reads 在染色体上的位置。

  6.2.1.2 比对结果质量评估

  比对过程中每个短序列分配一个比对质量值表示映射质量分数,来表明比对过程的可信度。

  6.2.1.3 比对结果统计

  通过比对到参考基因组次数和范围来计算测序深度和覆盖度。

  6.2.1.4 比对结果输出

  数据比对结果输出为 SAM/BAM 文件格式。

  注1:比对质量值:比对到错误位置的概率的整数映射,用来衡量比对正确的概率,通常以数字值直接表示。

  注2:SAM/BAM 格式:基于文本的储存核酸序列及其测序质量和序列比对相关的信息,其头部为注释信息,主体部分以行表示序列且每行以制表符分隔的标准格式,BAM 格式是 SAM 格式的二进制压缩格式。

  6.2.2 个体变异检测

  基于序列比对结果,用生信分析工具确定个体基因组中的 SNPs、InDel 和 SVs 等变异,输出 GVCF文件。

  6.2.3 群体变异检测

  在群体研究中,用生信分析工具整合突变群体的变异信息,主要是 SNPs 信息,输出VCF 文件。

  6.2.4 基因型检测

  6.2.4.1 文件格式转换

  分型软件将 VCF 文件转换成基因分型数据文件,分型数据文件中包含但不限于样本编号、SNP 名称和基因型。

  6.2.4.2 基因型判定

  农作物基因型的鉴定按照“二八”原则进行杂合基因型判定:当基因座出现两种不同的基因型时,如低频率的基因型占比≥20%(即高频率的基因型占比≤80%)才被判定为真实的杂合基因型。否则,如低频率的基因型占比<20%(即高频率的基因型占比>80%)则被判定为无效杂合基因型,该基因座将被判定为高频率基因型的纯合型。

  6.2.4.3 基因型表示

  基因型以 ACGT 中的两型组合表示,未得到基因型或无法明确判定基因型的记为“NA”。

  6.2.4.4 基因型质控

  按照 GB/T 33767.14-2023 中 6.1 、6.2、6.3 的要求,对基因型数据进行质量判断,统计分析基因型数据的准确性、完备性和可溯性,基因分型数据准确率不低于 98%。

  A

  A

  附 录 A

  (资料性)

  DNA 完整性检测凝胶电泳图

  凝胶电泳检测基因组 DNA 样本完整性结果见图 A.1。

  注:1) “1~15”:样本 DNA 在 15kb 左右主带清晰,无严重降解现象,为合格 DNA 样本。

  2) “M” :marker,参照标准,用于指示 DNA 分子大小的一系列核酸分子;

  3) “bp”:base pair,碱基对,用于表示核酸类样本分子大小的单位。

  图A.1 DNA 完整性检测凝胶电泳图

  B

  B

  附 录 B

  (资料性)

  FASTQ 格式文件示例图

  FASTQ 格式文件示例图 B.1。

  注:a)第一行以“@”开头,随后为测序仪测序识别符和描述文字;

  b)第二行是碱基序列;

  c)第三行以“+”开头,随后为测序仪测序标识别符,一般省略;

  d)第四行是对应碱基的测序质量,该行中每个字符对应的 ASCII 值减去 33,即为对应第二行碱基的测序质量值。

  图B.1 FASTQ 格式文件示例图

下载地址
DB43/T 3250-2025 基于高通量测序的农作物基因分型检测技术规程资源截图