Page 103 - 《广西植物》2025年第12期
P. 103
12 期 雷翰霖等: 锦葵科 Malvatheca 分支的质体基因组演化及系统发育分析 2 2 4 5
线工具(Beier et al.ꎬ 2017) 识别ꎬ参数设置为重复 因组均呈现典型四分体结构ꎬ即由大单拷贝( LSC)
单元 / 最 低 重 复 次 数 = 1 / 10、 2 / 5、 3 / 4、 4 / 3、 5 / 3、 区、小单拷贝( SSC) 区及 2 个反向重复( IR) 区组
6 / 3ꎬ即单核苷酸( mononucleotide) 重复次数≥10、 成ꎮ 质体基因组大小变异在 156 701 ~ 163 741 bp
二核苷 酸 ( dinucleotide) 重 复 次 数 ≥5、 三 核 苷 酸 之间ꎬ其中 LSC 区长 86 817 ~ 90 500 bp、SSC 区长
(trinucleotide)≥4、四至六核苷酸( tetranucleotide、 18 647 ~ 22 478 bp、IR 区长 18 162 ~ 24 170 bpꎮ 不
pentanucleotide、hexanucleotide)重复次数≥3ꎮ 同分类群比较显示ꎬ锦葵亚科基因组大小变异为
基于 Kruskal ̄Wallis( K ̄W) 非参数检验ꎬ利用 156 701 ~ 163 741 bp、 木 棉 亚 科 为 157 688 ~
R 语言 ggplot2 包分别对 Malvatheca 分支各族的基 160 664 bp、轻木属为 161 305 ~ 161 375 bp、绵绒
因组特征 [基因组大小、LSC / IR 区长度、基因间隔 树属为 160 409 ~ 160 831 bp( 附 表 2ꎬLei et al.ꎬ
区( intergenic spaceꎬIGS) 长 度ꎬ以 及 DRS / SSR 数 2025)ꎮ Malvatheca 分支物种质体基因组的基因含
量]进行组间差异显著性分析ꎬ并通过局部加权回 量、基因次序及 GC 含量上呈现高度保守性ꎬ即含
归模型评估基因组大小与各特征的相关性ꎬ绘制 有 112 个不重复基因( 78 个蛋白编码基因、4 个
箱线图与散点图ꎮ tRNA 基因和 30 个 rRNA 基因)ꎬGC 含量整体为
使用 DnaSP 6.12.03( Rozas et al.ꎬ 2017) 分别 36.50% ~ 37.40%(LSC 区为 34.10% ~ 35.40%、SSC
计算锦葵亚科与木棉亚科[ 包括轻木属( Ochroma 区为30.80% ~ 32.50%、IR 区为41.90% ~ 43.10%)ꎮ
Sw.) 和绵绒树属( Fremontodendron Coville)] 的质 重复序列分析显示:77 个新组装的质体基因组共
体基 因 组 的 核 苷 酸 多 态 性 ( nucleotide diversityꎬ 鉴定出 7 272 个简单重复序列(SSR)ꎬ其中单核苷
π)ꎬ参数设置滑动窗口长度( window length) = 600 酸重 复 占 主 导 ( 4 982 个ꎬ 68. 51%)ꎬ 二 核 苷 酸
bpꎬ步长(step size)= 200 bpꎬ即每间隔 200 bp 计算 (1 062个ꎬ14.60%) 和四核苷酸(613 个ꎬ8.43%)
一次 长 度 为 600 bp 序 列 的 π 值ꎮ 通 过 R 语 言 次之ꎻ同时检测到 5 512 个散在重复序列( DRS)ꎬ
ggplot2 包绘制 π 值分布曲线ꎬ筛选锦葵亚科( π = 以正向重复(2 551 个ꎬ46.28%)和回文重复(2 109
0.036 ) 与 木 棉 亚 科 ( π = 0. 017 ) 的 高 变 区 段 个ꎬ38.26%)为主要类型(图 1)ꎮ
(hypervariable regions)ꎬ利用 Geneious 定位提取目 Kruskal ̄Wallis 检验表明ꎬMalvatheca 分支各族
标区段序列ꎮ 为评估高变区片段的系统发育解析 的质体基因组大小、IR / LSC 区长度及 SSR / DRS 数
潜力ꎬ同步纳入以往锦葵科系统发育研究中常用 量上存在显著性差异(P < 0.01)ꎬ但 IGS 长度无统
的 6 个片段( atpB、ndhF、rbcL、matK、trnH GUG - psbA 计学差异(P = 0.49)ꎮ 木槿族(Hibisceae) 在质体
及 trnL UAA -trnF GAA )并进行分析比较ꎮ 所有基因片 基因组大小、IR / LSC 区长度及 SSR / DRS 数量等指
段经 MAFFT 进行多序列比对后ꎬ采用 RAxML 构 标均 高 于 Malvatheca 分 支 的 平 均 值ꎬ 而 锦 葵 族
建最大似然树ꎬ以支持率高于 90 且能有效区分主 (Malveae) 呈 现 相 反 趋 势 ( 附 图 1ꎬ Lei et al.ꎬ
要分支作为判定基因片段具有系统发育解析潜力 2025)ꎮ 相关性分析表明ꎬMalvatheca 分支物种的
质体基因组大小与 IR 区长度( r = 0.82)、LSC 区
的标准ꎮ
利 用 IRscope 在 线 工 具 ( Amiryousefi et al.ꎬ 长度(r = 0.69)、SSR 数量(r = 0.34)和 DRS 数量
2018)解析 Malvatheca 分支质体基因组 IR / SC 边 (r = 0.67)呈显著正相关(P < 0.01)ꎬ但与 IGS 长
界动态ꎬ根据边界基因差异将 IR 结构划分为 4 种 度无明显相关性(r = -0.076ꎬP = 0.48)ꎮ
类型ꎮ 使用 δ 检验(Borges et al.ꎬ 2019)评估 IR 类 2.2 质体基因组系统发育分析
型表型性状的系统发育信号强度ꎬ并基于 R 软件 WGM 数 据 集 矩 阵 长 度 为 125 555 bpꎬ 包 含
19 063个变异位点( 其中有 11 095 个简约信号位
包 phytools 的 ER ( equal rates) 模 型 ( Schluter et
al.ꎬ 1997)进行祖先性状重建ꎮ 点)ꎻCDS 数据集矩阵长度为 68 174 bpꎬ包含 9 880
个变异位点( 其中有 6 250 个简约信号位点)ꎮ 2
2 结果与分析 个数据集构建的最大似然树( ML) 和贝叶斯推断
树(BI)的拓扑结构高度一致ꎬ仅部分分支节点支
2.1 质体基因组基本特征 持率略有差异( 图 2)ꎮ 系统 发 育 分 析 强 烈 支 持
本研究新组装的 Malvatheca 分支 77 个质体基 Malvatheca 分支为 1 个单系群 ( BS / PP WGM = 100 /

