Page 103 - 《广西植物》2025年第12期
P. 103

12 期             雷翰霖等: 锦葵科 Malvatheca 分支的质体基因组演化及系统发育分析                                   2 2 4 5

            线工具(Beier et al.ꎬ 2017) 识别ꎬ参数设置为重复                 因组均呈现典型四分体结构ꎬ即由大单拷贝( LSC)
            单元 / 最 低 重 复 次 数 = 1 / 10、 2 / 5、 3 / 4、 4 / 3、 5 / 3、  区、小单拷贝( SSC) 区及 2 个反向重复( IR) 区组
            6 / 3ꎬ即单核苷酸( mononucleotide) 重复次数≥10、              成ꎮ 质体基因组大小变异在 156 701 ~ 163 741 bp
            二核苷 酸 ( dinucleotide) 重 复 次 数 ≥5、 三 核 苷 酸          之间ꎬ其中 LSC 区长 86 817 ~ 90 500 bp、SSC 区长

            (trinucleotide)≥4、四至六核苷酸( tetranucleotide、         18 647 ~ 22 478 bp、IR 区长 18 162 ~ 24 170 bpꎮ 不
            pentanucleotide、hexanucleotide)重复次数≥3ꎮ             同分类群比较显示ꎬ锦葵亚科基因组大小变异为
                 基于 Kruskal ̄Wallis( K ̄W) 非参数检验ꎬ利用              156 701 ~ 163 741 bp、 木 棉 亚 科 为 157 688 ~
            R 语言 ggplot2 包分别对 Malvatheca 分支各族的基                160 664 bp、轻木属为 161 305 ~ 161 375 bp、绵绒
            因组特征 [基因组大小、LSC / IR 区长度、基因间隔                      树属为 160 409 ~ 160 831 bp( 附 表 2ꎬLei et al.ꎬ
            区( intergenic spaceꎬIGS) 长 度ꎬ以 及 DRS / SSR 数       2025)ꎮ Malvatheca 分支物种质体基因组的基因含
            量]进行组间差异显著性分析ꎬ并通过局部加权回                             量、基因次序及 GC 含量上呈现高度保守性ꎬ即含
            归模型评估基因组大小与各特征的相关性ꎬ绘制                              有 112 个不重复基因( 78 个蛋白编码基因、4 个

            箱线图与散点图ꎮ                                           tRNA 基因和 30 个 rRNA 基因)ꎬGC 含量整体为
                 使用 DnaSP 6.12.03( Rozas et al.ꎬ 2017) 分别      36.50% ~ 37.40%(LSC 区为 34.10% ~ 35.40%、SSC
            计算锦葵亚科与木棉亚科[ 包括轻木属( Ochroma                        区为30.80% ~ 32.50%、IR 区为41.90% ~ 43.10%)ꎮ
            Sw.) 和绵绒树属( Fremontodendron Coville)] 的质           重复序列分析显示:77 个新组装的质体基因组共
            体基 因 组 的 核 苷 酸 多 态 性 ( nucleotide diversityꎬ       鉴定出 7 272 个简单重复序列(SSR)ꎬ其中单核苷
            π)ꎬ参数设置滑动窗口长度( window length) = 600                酸重 复 占 主 导 ( 4 982 个ꎬ 68. 51%)ꎬ 二 核 苷 酸
            bpꎬ步长(step size)= 200 bpꎬ即每间隔 200 bp 计算            (1 062个ꎬ14.60%) 和四核苷酸(613 个ꎬ8.43%)
            一次 长 度 为 600 bp 序 列 的 π 值ꎮ 通 过 R 语 言               次之ꎻ同时检测到 5 512 个散在重复序列( DRS)ꎬ
            ggplot2 包绘制 π 值分布曲线ꎬ筛选锦葵亚科( π =                    以正向重复(2 551 个ꎬ46.28%)和回文重复(2 109
            0.036 ) 与 木 棉 亚 科 ( π = 0. 017 ) 的 高 变 区 段         个ꎬ38.26%)为主要类型(图 1)ꎮ
            (hypervariable regions)ꎬ利用 Geneious 定位提取目              Kruskal ̄Wallis 检验表明ꎬMalvatheca 分支各族
            标区段序列ꎮ 为评估高变区片段的系统发育解析                             的质体基因组大小、IR / LSC 区长度及 SSR / DRS 数
            潜力ꎬ同步纳入以往锦葵科系统发育研究中常用                              量上存在显著性差异(P < 0.01)ꎬ但 IGS 长度无统
            的 6 个片段( atpB、ndhF、rbcL、matK、trnH     GUG  - psbA  计学差异(P = 0.49)ꎮ 木槿族(Hibisceae) 在质体
            及 trnL UAA -trnF  GAA )并进行分析比较ꎮ 所有基因片              基因组大小、IR / LSC 区长度及 SSR / DRS 数量等指
            段经 MAFFT 进行多序列比对后ꎬ采用 RAxML 构                       标均 高 于 Malvatheca 分 支 的 平 均 值ꎬ 而 锦 葵 族
            建最大似然树ꎬ以支持率高于 90 且能有效区分主                           (Malveae) 呈 现 相 反 趋 势 ( 附 图 1ꎬ Lei et al.ꎬ
            要分支作为判定基因片段具有系统发育解析潜力                              2025)ꎮ 相关性分析表明ꎬMalvatheca 分支物种的
                                                               质体基因组大小与 IR 区长度( r = 0.82)、LSC 区
            的标准ꎮ
                 利 用 IRscope 在 线 工 具 ( Amiryousefi et al.ꎬ     长度(r = 0.69)、SSR 数量(r = 0.34)和 DRS 数量
            2018)解析 Malvatheca 分支质体基因组 IR / SC 边               (r = 0.67)呈显著正相关(P < 0.01)ꎬ但与 IGS 长
            界动态ꎬ根据边界基因差异将 IR 结构划分为 4 种                         度无明显相关性(r = -0.076ꎬP = 0.48)ꎮ
            类型ꎮ 使用 δ 检验(Borges et al.ꎬ 2019)评估 IR 类            2.2 质体基因组系统发育分析
            型表型性状的系统发育信号强度ꎬ并基于 R 软件                                WGM 数 据 集 矩 阵 长 度 为 125 555 bpꎬ 包 含
                                                               19 063个变异位点( 其中有 11 095 个简约信号位
            包 phytools 的 ER ( equal rates) 模 型 ( Schluter et
            al.ꎬ 1997)进行祖先性状重建ꎮ                                点)ꎻCDS 数据集矩阵长度为 68 174 bpꎬ包含 9 880
                                                               个变异位点( 其中有 6 250 个简约信号位点)ꎮ 2
            2  结果与分析                                           个数据集构建的最大似然树( ML) 和贝叶斯推断
                                                               树(BI)的拓扑结构高度一致ꎬ仅部分分支节点支
            2.1 质体基因组基本特征                                      持率略有差异( 图 2)ꎮ 系统 发 育 分 析 强 烈 支 持
                 本研究新组装的 Malvatheca 分支 77 个质体基                 Malvatheca 分支为 1 个单系群 ( BS / PP     WGM  = 100 /
   98   99   100   101   102   103   104   105   106   107   108