Page 94 - 《广西植物》2025年第3期

P. 94

４７４广西植物４５卷
切酶法且克隆测序烟草( Ｎｉｃｏｔｉａｎａｔａｂａｃｕｍ)ꎬ获得ｂａｒｃｏｄｅ文库ꎬ便可获得完整或几近完整的质体基
首条质体基因组序列ꎮ 随后该方法被ＰＣＲ扩增和因组序列ꎬ这为基于馆藏标本遗传信息的生物学
双脱氧核苷酸末端终止法(或称Ｓａｎｇｅｒ测序法) 替研究带来了新的机遇ꎮ Ａｌｓｏｓ等(２０２０) 对上千份
代( Ｔａｂａｒｌｅｔｅｔａｌ.ꎬ １９９１)ꎮ 如今ꎬ 借助二代测序馆藏标本和硅胶干燥材料进行比较研究ꎬ发现硅
(ｎｅｘｔ￣ｇｅｎｅｒａｔｉｏｎｓｅｑｕｅｎｃｉｎｇꎬ ＮＧＳ)的全基因组浅层胶干燥材料的质体基因组组装成功率大于馆藏标
测序 ( ｇｅｎｏｍｅｓｋｉｍｍｉｎｇ) 技术ꎬ 获得全基因组本ꎬ表明植物野外科考调查除标本和种子收集以
(ｇＤＮＡ)较低测序深度的基因组数据ꎬ便能组装出外ꎬ还应留有硅胶干燥的分子材料ꎮ
完整的质体全基因组、线粒体全基因组和部分核目前ꎬＮＧＳ平台的读长为３５ ~ ７００ｂｐꎬ尽管这
基因序列ꎮ ３套基因组组装效率差异主要是由于比Ｓａｎｇｅｒ测序长度要短ꎬ但足以用于质体基因组
植物细胞中包含了大量质体ꎬ单个细胞的质体基的从头组装ꎮ ＮＧＳ测序通常选择短片段测序或双
因组数量超过核基因组的１００倍ꎬ因此使用相对端测序ꎬ即２ × １５０ｂｐꎮ 测序时应注意ꎬ质体片段
较低的测序深度便可获得足够的数据来组装质体的覆盖度(ｃｏｖｅｒａｇｅ) 应大于３０ｘꎬ但覆盖度并非越
全基因组(Ｓｔｒａｕｂｅｔａｌ.ꎬ ２０１２)ꎮ 全基因组浅层测大越好ꎬ １００ｘ ~ ２００ｘ为最佳 ( Ｔｗｙｆｏｒｄ＆Ｎｅｓｓꎬ
序因无需事先富集或者分离纯化质体ꎬ可直接使２０１７)ꎮ 测序后的数据大于５００Ｍｂ就足以组装出
用较低测序深度(０.１ｘ ~ １０ｘ) 的优点ꎬ被认为是目质体全基因组ꎬ但根据类群的质体基因组大小和
前获得质体基因组最直接且成本最低的方法结构复杂性的区别ꎬ一般需要２ ~ ５Ｇｂ数据ꎬ除能
(Ｄｏｄｓｗｏｒｔｈꎬ ２０１５ꎻ Ｔｗｙｆｏｒｄ＆Ｎｅｓｓꎬ ２０１７)ꎮ 相比提取出质体基因组以外ꎬ还能组装ｎｒＤＮＡ和线粒
较之下ꎬ尽管质体分离纯化富集法易从头组装ꎬ但体基因(Ｔｗｙｆｏｒｄ＆Ｎｅｓｓꎬ ２０１７)ꎮ 对于个别复杂类
因其耗时、耗力、耗钱且仅能获得质体基因组而被群ꎬ如寄生植物质体拷贝数低或ＧＣ含量异常ꎬ卷
淘汰ꎮ 柏科质体基因组存在同向重复( ｄｉｒｅｃｔｒｅｐｅａｔꎬ ＤＲ)
ＮＧＳ文库核心步骤为基因组打断－末端修复－结构和重排ꎬ可考虑长片段测序或结合三代测序
加接头－ＰＣＲ￣测序前信号放大ꎬ根据是否进行ＰＣＲ技术ꎬ这能有效克服质体全基因组重复和结构变
可以分为２类ꎬ依赖ＰＣＲ的ＮＧＳ文库和ＰＣＲ￣ｆｒｅｅ异等问题( Ｂｌｅｉｄｏｒｎꎬ ２０１６ꎻ Ｈｕｅｔａｌ.ꎬ ２０２１)ꎮ 不
的ＮＧＳ文库ꎮ 尽管后者因避免扩增错误和偏向过ꎬ三代测序仪较高的错误率和成本较高且通量
性ꎬ以及高保真性和高数据利用率而备受研究人较低ꎬ使其不能完全取代第二代测序平台ꎮ 因此ꎬ
员的青睐ꎬ但必需的起始ＤＮＡ量是前者的１００倍质体基因组结构复杂类群的研究需要组合二代和
(为１ｕｇＤＮＡ)ꎮ 常用的建库试剂盒有用酶切法的三代的测序方法ꎮ
ＩｌｌｕｍｉｎａＤＮＡＰｒｅｐ、片段化的ＩｌｌｕｍｉｎａＴｒｕＳｅｑ、兼容２.２植物质体基因组组装策略和方法
型的ＮＥＢＵｌｔｒａ和磁珠型ＤＮＡｓｅｌｅｃｔｉｏｎｂｅａｄｓꎮ 维基因组组装策略和方法的选取直接影响质体
管植物的质体基因组大小和测序的组织类型存在基因组数据的完整性和准确性ꎬ而组装策略的选
差异ꎬ其ｇＤＮＡ中所含的质体基因片段含量浮动巨择不仅要与其测序方法相匹配ꎬ而且还应考虑测

大ꎬ从０.３％[欧洲云杉( Ｐｉｃｅａａｂｉｅｓ)] 到接近４０％序质量的好坏、质体结构的复杂多变、组装结果的
[叙利亚马利筋 ( Ａｓｃｌｅｐｉａｓｓｙｒｉａｃａ)] ( Ｔｗｙｆｏｒｄ＆片段化、不同细胞器片段错配等问题ꎮ 二代测序
Ｎｅｓｓꎬ ２０１７)ꎮ 因此ꎬ开发一种具有广泛高兼容性的数据多为短片段测序ꎬ对应的组装策略可分为
的试剂盒ꎬ使其提取所需数量的质体基因组片段有参组装( ｒｅｆｅｒｅｎｃｅ￣ｇｕｉｄｅｄａｓｓｅｍｂｌｙ) 和从头组装

进行测序是非常有必要的ꎮ (ｄｅｎｏｖｏａｓｓｅｍｂｌｙ)２种ꎮ 有参组装将测序数据映
标本材料的ＤＮＡ由于储藏时间、组织特性、干射到参考质体基因组序列获得一致性序列为组装

燥条件等因素的影响ꎬ标本ＤＮＡ高度降解的ＤＮＡ结果ꎬ通常需要较少的计算时间和虚拟内存ꎬ适合
提取浓度低ꎬ并且易受外源ＤＮＡ污染ꎬ因此标本于已有近缘参考基因组的类群组装( 常为同属植
的质体全基因组不易获得ꎮ Ｚｅｎｇ等 (２０１８) 开发物)ꎮ 但是ꎬ若无参考质体基因组ꎬ或是质体基因
了适合馆藏标本材料的基因组浅层测序的实用流组结构变异较大的类群ꎬ又或是质体基因大量缺
程ꎬ仅以５００ｐｇ的起始ＤＮＡ量ꎬ通过模板分子不失的类群ꎬ如果采用有参组装就会产生很多错配ꎬ
打断、不作片段选择、不少于８个ＰＣＲ循环富集只有采用从头组装才能获得准确的组装结果ꎮ 优

89 90 91 92 93 94 95 96 97 98 99