Page 135 - 《广西植物》2022年第10期
P. 135

10 期                  张倩等: 白花刺续断野生居群的叶绿体全基因组特征解析                                          1 7 5 3

   采用了最大似然法( maximum likelihoodꎬ ML)、最               SSC / IRa 的边 界 在 白 花 刺 续 断 基 因 组 中 都 位 于
   大简约法(maximum parsimonyꎬ MP)和贝叶斯推论                 ycf1 基因内部ꎻIRa / LSC 边界全部位于 trnH ̄GUG
   法(Bayesian inferenceꎬ BI)3 种方法ꎮ 核苷酸替代             基因附近ꎮ
   模型经 jModelTest V 2.1.7 软件筛选定为 GTR+G                   利用 MISA 软件对白花刺续断叶绿体全基因
   模型ꎮ 利用 RAxML V.8.2.4 软件构建 ML 系统树ꎬ                 组进行分析ꎬ在白花刺续断 10 条序列中分别检测
   采用快速靴带算法ꎬ重复 1 000 次ꎮ 利用 MEGA                      到 70、68、70、70、74、74、70、70、71、71 个 SSR 位点
   V.7.0.26 软 件 构 建 MP 树ꎬ重 复 1 000 次ꎮ 利 用            (图 3:B)ꎮ SSR 最丰富的类型为单核苷酸重复ꎬ
   MrBayes V.3.2.6 构建 BI 树ꎬ基于马尔科夫链蒙特                 其次是二核苷酸重复、三核苷酸重复、五核苷酸重
   卡洛(MCMC) 算法ꎬ计算 100 万代ꎬ每隔 1 000 代                  复、四核苷酸重复和六核苷酸重复ꎮ 白花刺续断
   取样一次ꎬ舍弃前 25%棵树ꎬ根据剩余的样本构建                          叶绿体基因组中的 SSR 主要是由 A 和 T 组成ꎬ其
   一致树ꎮ                                              中大部分是以 A / T 碱基构成的单核苷酸重复ꎬ其
                                                     次是由 AT / TA 构 成 的 二 核 苷 酸 重 复 ( 图 3:A)ꎮ
   2  结果与分析                                          进一步分析表明ꎬ大部分 SSR 位于 LSC 区域ꎬ小部
                                                     分位于 SSC 和 IR 区域(图 3:C)ꎮ 同时ꎬ基因组中
   2.1 基因组结构与基本特征                                    的 SSR 大部分分布于基因间区( intergenic spacerꎬ
       白花刺续断的叶绿体全基因组为常见的四分                           IGS)中ꎬ其他少数 SSR 分布在内含子和蛋白编码
   体结构ꎬ由两个反向重复区 IRs(inverted repeats)、一              区域(coding sequenceꎬCDS)中(图 3:D)ꎮ
   个大单拷贝区 LSC(large single copy)和一个小单拷               2.3 序列差异比较分析
   贝区 SSC(small single copy)组成(图 1ꎬ表 2)ꎮ 拼接              将比对好的 5 个地区白花刺续断叶绿体基因
   后的白花刺续断叶绿体基因组ꎬ全长为155 335~                         组进行 Sliding window 分析(图 4)ꎮ 结果显示ꎬSSC
   156 266 bpꎬGC 含量为 38.1% ~38.2%ꎮ 各区段长度             区域的变异水平最高ꎬIR 区域最低ꎮ 同时ꎬ筛选到
   分别为 89 027~89 076 bp(LSC)、17 689~17 842 bp        3 条高变异序列ꎬ分别位于 LSC 区( rpoC1) 和 SSC
   (SSC)、24 253~24 666 bp(IRs)ꎮ 4 个区段中 GC 含          区 ( ndhF 和 rpl32 ̄trnL ̄UAG )ꎮ 其 中ꎬ rpl32 ̄trnL ̄
   量最高的是 IR 区(42.8% ~ 43.2%)ꎬ其次是 LSC 区               UAG 的变异性最高ꎬ其次是 ndhFꎬ而 rpoC1 最低ꎮ
   (36.5%) 和 SSC 区(32.9%)ꎮ 经注释ꎬ得到 113 个              此外ꎬ本研究中以 SD01 作为参考序列ꎬ与其余 9
   基因ꎬ包括 72 个编码蛋白基因、30 个 tRNA 基因、4                   条白花刺续断叶绿体基因组进行两两比较分析ꎮ
   个 rRNA 基因和 7 个假基因( clpP、accD、ycf2、ycf1、           结果显示ꎬ叶绿体基因组序列中非编码区变异高
   rps18、rps3 和 ycf3)ꎮ 此外ꎬ白花刺续断叶绿体全基                 于蛋白编码区域ꎬ单拷贝区(LSC & SSC)变异明显
   因组中有 16 个基因含有内含子(intron)ꎬ且均只含                     大于反向重复区( IR)ꎮ 5 个地区白花刺续断叶绿
   有一个内含子(表 3)ꎮ                                      体基因组序列整体上高度相似ꎬ变异较大的基因
   2.2 IR / SC 边界收缩扩张及 SSR 分析                        有 rpoC2、psbC、rrn23 和 ycf1ꎬ其他基因保守程度非

       叶绿体基因组由两个反向重复的 IR 区、LSC                       常高ꎮ 基因间区的变异大于基因区ꎬ如 atpF ̄atpH、
   区与 SSC 区 构 成ꎬ 因 此 存 在 LSC / IRb、 IRb / SSC、       psaB ̄psaA、 psaA ̄ycf3、 trnM ̄CAU ̄atpE、 psbF ̄psbE、
   SSC / IRa 和 IRa / LSC 4 个边界ꎮ 在基因组进化过              psbE ̄petL、 rrn5 ̄trnN ̄ACG、 trnR ̄ACG ̄trnN ̄GUU、
   程中ꎬ4 个边界会发生扩张与收缩ꎬ使某些基因进                           trnL ̄UAG ̄ccsA( 图 5)ꎮ 从这些区域中ꎬ可开发特
   入 IR 区或单拷贝区ꎮ 不同地点白花刺续断的叶                          异性片段ꎬ用于该属种间及种下水平的系统进化

   绿体基因组的 4 个边界相对保守( 图 2)ꎮ LSC /                     与发育研究ꎮ
   IRb 边界在白花刺续断中位于 rpl23 基因内部ꎬ且                      2.4 系统发育分析

   位于 LSC 区域的差异不大ꎬ为 185 ~ 186 bpꎻSD01、                   本研究利用 P ̄distance 种间遗传变异及核苷
   YD01、YD02、LT01、LT02、KD01、KD02 的 IRb / SSC         酸替换比较了 10 条白花刺续断的叶绿体全基因
   边界基 因 完 全 相 同ꎬ 位 于 IRb 区 trnN ̄GUU 基 因             组进 化 差 异ꎬ 研 究 结 果 表 明ꎬ P ̄distance 为 0 ~
   138 bp 处ꎬ而 SD02、DF01、DF02 的 trnN ̄GUU 基因           0.000 7ꎬ核苷酸差异值为 0 ~ 1 515ꎬ且大部分序列
   扩张到 SSC 内部ꎬ距离 IRb / SSC 边界 48 ~ 223 bpꎻ           间地理位置越远ꎬ 其相互间 P ̄distance 和核苷酸差
   130   131   132   133   134   135   136   137   138   139   140