Page 94 - 《广西植物》2025年第3期
P. 94
4 7 4 广 西 植 物 45 卷
切酶法且克隆测序烟草( Nicotiana tabacum)ꎬ获得 barcode 文库ꎬ便可获得完整或几近完整的质体基
首条质体基因组序列ꎮ 随后该方法被 PCR 扩增和 因组序列ꎬ这为基于馆藏标本遗传信息的生物学
双脱氧核苷酸末端终止法(或称 Sanger 测序法) 替 研究带来了新的机遇ꎮ Alsos 等(2020) 对上千份
代( Tabarlet et al.ꎬ 1991)ꎮ 如 今ꎬ 借 助 二 代 测 序 馆藏标本和硅胶干燥材料进行比较研究ꎬ发现硅
(next ̄generation sequencingꎬ NGS)的全基因组浅层 胶干燥材料的质体基因组组装成功率大于馆藏标
测 序 ( genome skimming) 技 术ꎬ 获 得 全 基 因 组 本ꎬ表明植物野外科考调查除标本和种子收集以
(gDNA)较低测序深度的基因组数据ꎬ便能组装出 外ꎬ还应留有硅胶干燥的分子材料ꎮ
完整的质体全基因组、线粒体全基因组和部分核 目前ꎬNGS 平台的读长为 35 ~ 700 bpꎬ尽管这
基因序列ꎮ 3 套基因组组装效率差异主要是由于 比 Sanger 测序长度要短ꎬ但足以用于质体基因组
植物细胞中包含了大量质体ꎬ单个细胞的质体基 的从头组装ꎮ NGS 测序通常选择短片段测序或双
因组数量超过核基因组的 100 倍ꎬ因此使用相对 端测序ꎬ即 2 × 150 bpꎮ 测序时应注意ꎬ质体片段
较低的测序深度便可获得足够的数据来组装质体 的覆盖度(coverage) 应大于 30xꎬ但覆盖度并非越
全基因组(Straub et al.ꎬ 2012)ꎮ 全基因组浅层测 大越 好ꎬ 100x ~ 200x 为 最 佳 ( Twyford & Nessꎬ
序因无需事先富集或者分离纯化质体ꎬ可直接使 2017)ꎮ 测序后的数据大于 500 Mb 就足以组装出
用较低测序深度(0.1x ~ 10x) 的优点ꎬ被认为是目 质体全基因组ꎬ但根据类群的质体基因组大小和
前获 得 质 体 基 因 组 最 直 接 且 成 本 最 低 的 方 法 结构复杂性的区别ꎬ一般需要 2 ~ 5 Gb 数据ꎬ除能
(Dodsworthꎬ 2015ꎻ Twyford & Nessꎬ 2017)ꎮ 相比 提取出质体基因组以外ꎬ还能组装 nrDNA 和线粒
较之下ꎬ尽管质体分离纯化富集法易从头组装ꎬ但 体基因(Twyford & Nessꎬ 2017)ꎮ 对于个别复杂类
因其耗时、耗力、耗钱且仅能获得质体基因组而被 群ꎬ如寄生植物质体拷贝数低或 GC 含量异常ꎬ卷
淘汰ꎮ 柏科质体基因组存在同向重复( direct repeatꎬ DR)
NGS 文库核心步骤为基因组打断-末端修复- 结构和重排ꎬ可考虑长片段测序或结合三代测序
加接头-PCR ̄测序前信号放大ꎬ根据是否进行 PCR 技术ꎬ这能有效克服质体全基因组重复和结构变
可以分为 2 类ꎬ依赖 PCR 的 NGS 文库和 PCR ̄free 异等问题( Bleidornꎬ 2016ꎻ Hu et al.ꎬ 2021)ꎮ 不
的 NGS 文库ꎮ 尽管后者因避免扩增错误和偏向 过ꎬ三代测序仪较高的错误率和成本较高且通量
性ꎬ以及高保真性和高数据利用率而备受研究人 较低ꎬ使其不能完全取代第二代测序平台ꎮ 因此ꎬ
员的青睐ꎬ但必需的起始 DNA 量是前者的 100 倍 质体基因组结构复杂类群的研究需要组合二代和
(为 1 ug DNA)ꎮ 常用的建库试剂盒有用酶切法的 三代的测序方法ꎮ
Illumina DNA Prep、片段化的 Illumina TruSeq、兼容 2.2 植物质体基因组组装策略和方法
型的 NEB Ultra 和磁珠型 DNA selection beadsꎮ 维 基因组组装策略和方法的选取直接影响质体
管植物的质体基因组大小和测序的组织类型存在 基因组数据的完整性和准确性ꎬ而组装策略的选
差异ꎬ其 gDNA 中所含的质体基因片段含量浮动巨 择不仅要与其测序方法相匹配ꎬ而且还应考虑测
大ꎬ从 0.3%[欧洲云杉( Picea abies)] 到接近 40% 序质量的好坏、质体结构的复杂多变、组装结果的
[叙 利 亚 马 利 筋 ( Asclepias syriaca)] ( Twyford & 片段化、不同细胞器片段错配等问题ꎮ 二代测序
Nessꎬ 2017)ꎮ 因此ꎬ开发一种具有广泛高兼容性 的数据多为短片段测序ꎬ对应的组装策略可分为
的试剂盒ꎬ使其提取所需数量的质体基因组片段 有参组装( reference ̄guided assembly) 和从头组装
进行测序是非常有必要的ꎮ (de novo assembly)2 种ꎮ 有参组装将测序数据映
标本材料的 DNA 由于储藏时间、组织特性、干 射到参考质体基因组序列获得一致性序列为组装
燥条件等因素的影响ꎬ标本 DNA 高度降解的 DNA 结果ꎬ通常需要较少的计算时间和虚拟内存ꎬ适合
提取浓度低ꎬ并且易受外源 DNA 污染ꎬ因此标本 于已有近缘参考基因组的类群组装( 常为同属植
的质体全基因组不易获得ꎮ Zeng 等 (2018) 开发 物)ꎮ 但是ꎬ若无参考质体基因组ꎬ或是质体基因
了适合馆藏标本材料的基因组浅层测序的实用流 组结构变异较大的类群ꎬ又或是质体基因大量缺
程ꎬ仅以 500 pg 的起始 DNA 量ꎬ通过模板分子不 失的类群ꎬ如果采用有参组装就会产生很多错配ꎬ
打断、不作片段选择、不少于 8 个 PCR 循环富集 只有采用从头组装才能获得准确的组装结果ꎮ 优

