Page 97 - 《广西植物》2025年第3期
P. 97

3 期                陈丽琼等: 维管植物质体基因组多样性及其获取与应用研究进展                                            4 7 7

            用 82 个质体编码基因解析了金虎尾目内部的系                            因间显著的演化速率差异易引起长枝吸引ꎬ若使
            统发育关系ꎻLi HT 等(2021)基于质体全基因组数                       用质体基因串联法会将该属误认为旋花亚科的基
            据集构建了被子植物科级水平的叶绿体系统发育                              部类群(Chen et al.ꎬ 2024)ꎮ 因此ꎬ演化速率快的
            树 2.0 ( PPA Ⅱ)ꎬ其 中 75% 以 上 的 目 间 关 系 和             特殊类群系统发育关系的解析还需要结合溯祖法
            78%科级关系得到大于 90%的统计支持ꎮ 除质体                          是综合考虑不同基因的进化历史ꎬ并使用合适的
            基因组以外ꎬ线粒体基因组也被用于维管植物的                              模 型 如 IQ ̄tree 的 Ghost 模 型 来 推 断 系 统 发 育
            系统发育分析ꎮ 由于线粒体基因演化速率慢ꎬ不                             关系ꎮ
            易受长枝吸引的影响ꎬ因此常用于科级及以上高                                  目前ꎬ 系 统 发 育 树 的 构 建 常 面 临 系 统 误 差
            分类 阶 元 和 异 养 植 物 的 系 统 学 研 究ꎮ Lin 等                (systematic error)的问题ꎬ系统误差的主要来源包
            (2022)利用线粒体基因组有效解决含真菌异养的                           括碱基突变率不同 ( heterotachy)、序列组成异质
            单子叶植物和杜鹃花科的系统发育关系ꎬ明确杜                              性(compositional heterogeneity)、 速 率 异 质 性 ( rate
            鹃花科并非单系ꎮ 但是ꎬ线粒体基因组高度富集                             heterogeneity)ꎮ 因此ꎬ仅增加物种取样密度ꎬ既不
            的重复序列和频繁的重组ꎬ同时受限于浅层测序                              能改变系统发育树框架的拓扑结构ꎬ也不能给之
            的读取长度ꎬ导致难以获得完整且准确的线粒体                              前存在问题的节点增加支持率ꎻ相较而言ꎬ填补基
            基因组ꎮ 此外ꎬ获取线粒体基因组数据通常还需                             因数据量、模型优化法、增加的近缘外类群取样、
            要整合 Hi ̄C 文库与 PacBio 长读测序ꎮ                          去除分类群中进化速率较快的长枝分类元和具有
            3.2 质体基因组系统发育分析                                    非常高演化速率的基因或区段ꎬ使用多种建树方
                 目前ꎬ构建质体基因组系统发育关系的数据                           法(相较于 ML 和 BIꎬMP 更易出现 LBA)、采用基
            主要有 3 类ꎬ即质体全基因组、质体编码基因和分                           于氨基酸翻译的多序列比对方法ꎬ并考虑了帧移
            区数据( LSC、IR 和 SSC)ꎮ 质体基因组建树的流                      和终止密码子有助于解决一些快速演化的复杂类
            程较为简单ꎬ原始测序数据经组装后ꎬ先进行序列                             群系统发育关系( Gitzendanner et al.ꎬ 2018aꎻ Li et
            比对、构建矩阵ꎬ剔除矩阵中不可靠区段ꎬ再用于                             al.ꎬ 2019ꎻ Sarker & Sutherlꎬ 2022)ꎮ 由于质体基
            系统发育树的构建(图 5)(Jiang et al.ꎬ 2022)ꎮ 值               因组并未包含植物所有的遗传信息ꎬ因此仅依靠
            得注意的是ꎬ使用质体编码基因数据建树时ꎬ需先                             质体基因组数据无法解决一些快速演化支系间的
            将每个基因单独进行多序列比对避免不同的基因                              关系ꎬ需结合其他基因组数据ꎬ如核基因组数据或
            错配ꎬ再进行系统发育树构建ꎮ 质体基因组系统                             线粒体基因组数据ꎮ 若是利用所有基因组数据也
            发 育 分 析 方 法 大 致 上 可 以 分 为 串 联 法                    无法解决ꎬ不同基因组推断的系统发育结果之间
            ( concatenation ) 和 溯 祖 法 ( coalescence ) 2 种      常存 在 明 显 冲 突ꎬ 则 可 能 为 杂 交 和 渐 渗 起 源
            (Huelsenbeck et al.ꎬ 1996ꎻ Liu et al.ꎬ 2009ꎻ Sarker  (Soltis & Kuzoffꎬ 1995ꎻ 邹新慧和葛颂ꎬ 2008ꎻ Yu
            & Sutherlꎬ 2022 )ꎮ 串 联 法 又 叫 超 级 矩 阵               et al.ꎬ 2013)ꎮ 质体基因组、核基因组和线粒体基
            (supermatrix)法ꎬ即先将比对后的质体基因矩阵首                      因组之间的基因交换和共享亦会导致系统发育关
            尾相连ꎬ构成质体基因串联矩阵ꎬ再将串联矩阵用                             系冲突的出现(Straub et al.ꎬ 2013)ꎮ
            于系统发育树的构建ꎮ 溯祖法则是先利用单个质                             3.3 质体基因组超级条形码和物种鉴定
            体基因比对矩阵构建单基因树ꎬ再根据所有基因                                  DNA 条形码( DNA barcoding) 是指基因组中
            树进行溯祖分析ꎬ最后推断最有可能的系统发育                              普遍存在的、较短的、标准化的且能用于物种鉴定
            树ꎮ 质体基因串联法或称多基因组联合建树尽管                             的基因序列(Hebert et al.ꎬ 2003ꎻ Mark & Michaelꎬ
            是质体基因组系统发育分析的首选ꎬ但不适合寄                              2009)ꎮ 因其可鉴别破损标本或加工后组织样品
            生植物这种特殊类群ꎮ 这主要是该类群质体基因                             而广泛应用于物种资源调查分类、食品安全、中药
            组的演化速率快、种间演化速率和不同家族基因                              质控和海关检查等方面ꎬ为准确处理生物分类地
            的碱基替换率差异大ꎬ若直接将所有质体基因串                              位提供了科学依据ꎬ从而促进合理有效地保护、开
            联在一起ꎬ推断出的系统发育树可能是由部分高                              发和利用自然生物资源、保护生物多样性和环境
            突变的“主效” 基因所决定ꎮ 例如ꎬ全寄生植物菟                           保护(Chac & Thinhꎬ 2023)ꎮ 截至 2024 年 3 月ꎬ生命
            丝子属ꎬ其亚属间的演化速率差异大ꎬ并且质体基                             条形码数据库(BOLDꎬhttp:/ / www.boldsystems.org/ )
   92   93   94   95   96   97   98   99   100   101   102