Page 135 - 《广西植物》2022年第10期
P. 135
10 期 张倩等: 白花刺续断野生居群的叶绿体全基因组特征解析 1 7 5 3
采用了最大似然法( maximum likelihoodꎬ ML)、最 SSC / IRa 的边 界 在 白 花 刺 续 断 基 因 组 中 都 位 于
大简约法(maximum parsimonyꎬ MP)和贝叶斯推论 ycf1 基因内部ꎻIRa / LSC 边界全部位于 trnH ̄GUG
法(Bayesian inferenceꎬ BI)3 种方法ꎮ 核苷酸替代 基因附近ꎮ
模型经 jModelTest V 2.1.7 软件筛选定为 GTR+G 利用 MISA 软件对白花刺续断叶绿体全基因
模型ꎮ 利用 RAxML V.8.2.4 软件构建 ML 系统树ꎬ 组进行分析ꎬ在白花刺续断 10 条序列中分别检测
采用快速靴带算法ꎬ重复 1 000 次ꎮ 利用 MEGA 到 70、68、70、70、74、74、70、70、71、71 个 SSR 位点
V.7.0.26 软 件 构 建 MP 树ꎬ重 复 1 000 次ꎮ 利 用 (图 3:B)ꎮ SSR 最丰富的类型为单核苷酸重复ꎬ
MrBayes V.3.2.6 构建 BI 树ꎬ基于马尔科夫链蒙特 其次是二核苷酸重复、三核苷酸重复、五核苷酸重
卡洛(MCMC) 算法ꎬ计算 100 万代ꎬ每隔 1 000 代 复、四核苷酸重复和六核苷酸重复ꎮ 白花刺续断
取样一次ꎬ舍弃前 25%棵树ꎬ根据剩余的样本构建 叶绿体基因组中的 SSR 主要是由 A 和 T 组成ꎬ其
一致树ꎮ 中大部分是以 A / T 碱基构成的单核苷酸重复ꎬ其
次是由 AT / TA 构 成 的 二 核 苷 酸 重 复 ( 图 3:A)ꎮ
2 结果与分析 进一步分析表明ꎬ大部分 SSR 位于 LSC 区域ꎬ小部
分位于 SSC 和 IR 区域(图 3:C)ꎮ 同时ꎬ基因组中
2.1 基因组结构与基本特征 的 SSR 大部分分布于基因间区( intergenic spacerꎬ
白花刺续断的叶绿体全基因组为常见的四分 IGS)中ꎬ其他少数 SSR 分布在内含子和蛋白编码
体结构ꎬ由两个反向重复区 IRs(inverted repeats)、一 区域(coding sequenceꎬCDS)中(图 3:D)ꎮ
个大单拷贝区 LSC(large single copy)和一个小单拷 2.3 序列差异比较分析
贝区 SSC(small single copy)组成(图 1ꎬ表 2)ꎮ 拼接 将比对好的 5 个地区白花刺续断叶绿体基因
后的白花刺续断叶绿体基因组ꎬ全长为155 335~ 组进行 Sliding window 分析(图 4)ꎮ 结果显示ꎬSSC
156 266 bpꎬGC 含量为 38.1% ~38.2%ꎮ 各区段长度 区域的变异水平最高ꎬIR 区域最低ꎮ 同时ꎬ筛选到
分别为 89 027~89 076 bp(LSC)、17 689~17 842 bp 3 条高变异序列ꎬ分别位于 LSC 区( rpoC1) 和 SSC
(SSC)、24 253~24 666 bp(IRs)ꎮ 4 个区段中 GC 含 区 ( ndhF 和 rpl32 ̄trnL ̄UAG )ꎮ 其 中ꎬ rpl32 ̄trnL ̄
量最高的是 IR 区(42.8% ~ 43.2%)ꎬ其次是 LSC 区 UAG 的变异性最高ꎬ其次是 ndhFꎬ而 rpoC1 最低ꎮ
(36.5%) 和 SSC 区(32.9%)ꎮ 经注释ꎬ得到 113 个 此外ꎬ本研究中以 SD01 作为参考序列ꎬ与其余 9
基因ꎬ包括 72 个编码蛋白基因、30 个 tRNA 基因、4 条白花刺续断叶绿体基因组进行两两比较分析ꎮ
个 rRNA 基因和 7 个假基因( clpP、accD、ycf2、ycf1、 结果显示ꎬ叶绿体基因组序列中非编码区变异高
rps18、rps3 和 ycf3)ꎮ 此外ꎬ白花刺续断叶绿体全基 于蛋白编码区域ꎬ单拷贝区(LSC & SSC)变异明显
因组中有 16 个基因含有内含子(intron)ꎬ且均只含 大于反向重复区( IR)ꎮ 5 个地区白花刺续断叶绿
有一个内含子(表 3)ꎮ 体基因组序列整体上高度相似ꎬ变异较大的基因
2.2 IR / SC 边界收缩扩张及 SSR 分析 有 rpoC2、psbC、rrn23 和 ycf1ꎬ其他基因保守程度非
叶绿体基因组由两个反向重复的 IR 区、LSC 常高ꎮ 基因间区的变异大于基因区ꎬ如 atpF ̄atpH、
区与 SSC 区 构 成ꎬ 因 此 存 在 LSC / IRb、 IRb / SSC、 psaB ̄psaA、 psaA ̄ycf3、 trnM ̄CAU ̄atpE、 psbF ̄psbE、
SSC / IRa 和 IRa / LSC 4 个边界ꎮ 在基因组进化过 psbE ̄petL、 rrn5 ̄trnN ̄ACG、 trnR ̄ACG ̄trnN ̄GUU、
程中ꎬ4 个边界会发生扩张与收缩ꎬ使某些基因进 trnL ̄UAG ̄ccsA( 图 5)ꎮ 从这些区域中ꎬ可开发特
入 IR 区或单拷贝区ꎮ 不同地点白花刺续断的叶 异性片段ꎬ用于该属种间及种下水平的系统进化
绿体基因组的 4 个边界相对保守( 图 2)ꎮ LSC / 与发育研究ꎮ
IRb 边界在白花刺续断中位于 rpl23 基因内部ꎬ且 2.4 系统发育分析
位于 LSC 区域的差异不大ꎬ为 185 ~ 186 bpꎻSD01、 本研究利用 P ̄distance 种间遗传变异及核苷
YD01、YD02、LT01、LT02、KD01、KD02 的 IRb / SSC 酸替换比较了 10 条白花刺续断的叶绿体全基因
边界基 因 完 全 相 同ꎬ 位 于 IRb 区 trnN ̄GUU 基 因 组进 化 差 异ꎬ 研 究 结 果 表 明ꎬ P ̄distance 为 0 ~
138 bp 处ꎬ而 SD02、DF01、DF02 的 trnN ̄GUU 基因 0.000 7ꎬ核苷酸差异值为 0 ~ 1 515ꎬ且大部分序列
扩张到 SSC 内部ꎬ距离 IRb / SSC 边界 48 ~ 223 bpꎻ 间地理位置越远ꎬ 其相互间 P ̄distance 和核苷酸差