Page 97 - 《广西植物》2025年第3期
P. 97
3 期 陈丽琼等: 维管植物质体基因组多样性及其获取与应用研究进展 4 7 7
用 82 个质体编码基因解析了金虎尾目内部的系 因间显著的演化速率差异易引起长枝吸引ꎬ若使
统发育关系ꎻLi HT 等(2021)基于质体全基因组数 用质体基因串联法会将该属误认为旋花亚科的基
据集构建了被子植物科级水平的叶绿体系统发育 部类群(Chen et al.ꎬ 2024)ꎮ 因此ꎬ演化速率快的
树 2.0 ( PPA Ⅱ)ꎬ其 中 75% 以 上 的 目 间 关 系 和 特殊类群系统发育关系的解析还需要结合溯祖法
78%科级关系得到大于 90%的统计支持ꎮ 除质体 是综合考虑不同基因的进化历史ꎬ并使用合适的
基因组以外ꎬ线粒体基因组也被用于维管植物的 模 型 如 IQ ̄tree 的 Ghost 模 型 来 推 断 系 统 发 育
系统发育分析ꎮ 由于线粒体基因演化速率慢ꎬ不 关系ꎮ
易受长枝吸引的影响ꎬ因此常用于科级及以上高 目前ꎬ 系 统 发 育 树 的 构 建 常 面 临 系 统 误 差
分类 阶 元 和 异 养 植 物 的 系 统 学 研 究ꎮ Lin 等 (systematic error)的问题ꎬ系统误差的主要来源包
(2022)利用线粒体基因组有效解决含真菌异养的 括碱基突变率不同 ( heterotachy)、序列组成异质
单子叶植物和杜鹃花科的系统发育关系ꎬ明确杜 性(compositional heterogeneity)、 速 率 异 质 性 ( rate
鹃花科并非单系ꎮ 但是ꎬ线粒体基因组高度富集 heterogeneity)ꎮ 因此ꎬ仅增加物种取样密度ꎬ既不
的重复序列和频繁的重组ꎬ同时受限于浅层测序 能改变系统发育树框架的拓扑结构ꎬ也不能给之
的读取长度ꎬ导致难以获得完整且准确的线粒体 前存在问题的节点增加支持率ꎻ相较而言ꎬ填补基
基因组ꎮ 此外ꎬ获取线粒体基因组数据通常还需 因数据量、模型优化法、增加的近缘外类群取样、
要整合 Hi ̄C 文库与 PacBio 长读测序ꎮ 去除分类群中进化速率较快的长枝分类元和具有
3.2 质体基因组系统发育分析 非常高演化速率的基因或区段ꎬ使用多种建树方
目前ꎬ构建质体基因组系统发育关系的数据 法(相较于 ML 和 BIꎬMP 更易出现 LBA)、采用基
主要有 3 类ꎬ即质体全基因组、质体编码基因和分 于氨基酸翻译的多序列比对方法ꎬ并考虑了帧移
区数据( LSC、IR 和 SSC)ꎮ 质体基因组建树的流 和终止密码子有助于解决一些快速演化的复杂类
程较为简单ꎬ原始测序数据经组装后ꎬ先进行序列 群系统发育关系( Gitzendanner et al.ꎬ 2018aꎻ Li et
比对、构建矩阵ꎬ剔除矩阵中不可靠区段ꎬ再用于 al.ꎬ 2019ꎻ Sarker & Sutherlꎬ 2022)ꎮ 由于质体基
系统发育树的构建(图 5)(Jiang et al.ꎬ 2022)ꎮ 值 因组并未包含植物所有的遗传信息ꎬ因此仅依靠
得注意的是ꎬ使用质体编码基因数据建树时ꎬ需先 质体基因组数据无法解决一些快速演化支系间的
将每个基因单独进行多序列比对避免不同的基因 关系ꎬ需结合其他基因组数据ꎬ如核基因组数据或
错配ꎬ再进行系统发育树构建ꎮ 质体基因组系统 线粒体基因组数据ꎮ 若是利用所有基因组数据也
发 育 分 析 方 法 大 致 上 可 以 分 为 串 联 法 无法解决ꎬ不同基因组推断的系统发育结果之间
( concatenation ) 和 溯 祖 法 ( coalescence ) 2 种 常存 在 明 显 冲 突ꎬ 则 可 能 为 杂 交 和 渐 渗 起 源
(Huelsenbeck et al.ꎬ 1996ꎻ Liu et al.ꎬ 2009ꎻ Sarker (Soltis & Kuzoffꎬ 1995ꎻ 邹新慧和葛颂ꎬ 2008ꎻ Yu
& Sutherlꎬ 2022 )ꎮ 串 联 法 又 叫 超 级 矩 阵 et al.ꎬ 2013)ꎮ 质体基因组、核基因组和线粒体基
(supermatrix)法ꎬ即先将比对后的质体基因矩阵首 因组之间的基因交换和共享亦会导致系统发育关
尾相连ꎬ构成质体基因串联矩阵ꎬ再将串联矩阵用 系冲突的出现(Straub et al.ꎬ 2013)ꎮ
于系统发育树的构建ꎮ 溯祖法则是先利用单个质 3.3 质体基因组超级条形码和物种鉴定
体基因比对矩阵构建单基因树ꎬ再根据所有基因 DNA 条形码( DNA barcoding) 是指基因组中
树进行溯祖分析ꎬ最后推断最有可能的系统发育 普遍存在的、较短的、标准化的且能用于物种鉴定
树ꎮ 质体基因串联法或称多基因组联合建树尽管 的基因序列(Hebert et al.ꎬ 2003ꎻ Mark & Michaelꎬ
是质体基因组系统发育分析的首选ꎬ但不适合寄 2009)ꎮ 因其可鉴别破损标本或加工后组织样品
生植物这种特殊类群ꎮ 这主要是该类群质体基因 而广泛应用于物种资源调查分类、食品安全、中药
组的演化速率快、种间演化速率和不同家族基因 质控和海关检查等方面ꎬ为准确处理生物分类地
的碱基替换率差异大ꎬ若直接将所有质体基因串 位提供了科学依据ꎬ从而促进合理有效地保护、开
联在一起ꎬ推断出的系统发育树可能是由部分高 发和利用自然生物资源、保护生物多样性和环境
突变的“主效” 基因所决定ꎮ 例如ꎬ全寄生植物菟 保护(Chac & Thinhꎬ 2023)ꎮ 截至 2024 年 3 月ꎬ生命
丝子属ꎬ其亚属间的演化速率差异大ꎬ并且质体基 条形码数据库(BOLDꎬhttp:/ / www.boldsystems.org/ )

