Page 56 - 《广西植物》2025年第5期
P. 56
8 6 0 广 西 植 物 45 卷
表 1 三脉水丝梨叶绿体基因组不同位置的 GC 含量
Table 1 GC contents at different locations in the chloroplast genome of Sycopsis triplinervia
名称 大小 开始位置 结束位置 GC 含量
Name Size (bp) Start position End position GC content (%)
大单拷贝区 LSC 88 067 1 88067 36.2
小单拷贝区 SSC 18 808 114318 133125 32.5
反向重复区 A IRA 26 250 159375 133126 43.1
反向重复区 B IRB 26 250 88068 114317 43.1
Leu)的密码子ꎬ仅有 243 个(1.14%) 密码子编码 2.4 叶绿体基因组的比较分析
半胱氨酸(cysteineꎬ Cys)ꎬ表明在三脉水丝梨叶绿 通过在线网站 CPJSdraw 比较分析了三脉水丝
体基因组中使用最多的是亮氨酸ꎬ使用最少的是 梨及其近缘物种的 LSC、SSC 和 IR 区的边界位置ꎬ
半 胱 氨 酸ꎮ 在 所 有 密 码 子 中ꎬ 异 亮 氨 酸 结果如 图 4 所 示ꎬ7 个 物 种 的 IR 区 长 度 较 保 守
(isoleucineꎬ Ile)中的 AUU 使用次数最多ꎬ次数为 (26 218 ~ 26 258 bp)ꎮ 除三脉水丝梨、樟叶假蚊
885ꎬ使用次数最少的是半胱氨酸中的 UGCꎬ次数 母和波斯铁木以外ꎬ其余 4 个物种的 LSC / IRB 边
为 54ꎮ 3 个终止密码子中 UAA 的使用频率最高 界均在 rps19 基因内部ꎮ 樟叶假蚊母的 ndhF 基因
横跨 IRB / SSC 边界ꎬ而其余 6 个物种的 ndhF 基因
(UAA: 50.94%ꎻ UAG: 24.53%ꎻ UGA: 24.53%)ꎮ
三脉水丝梨叶绿体基因密码子中ꎬRSCU 值最高的 距边界 10 ~ 16 bpꎮ 7 个物种的 SSC / IRA 边界都位
为丙氨酸中的 GCU(1.88)ꎬ最低的为丝氨酸中的 于 ycf1 基 因 上 且 ycf1 基 因 在 IRA 的 长 度 均 为
1 017 bpꎮ 三脉水丝梨和樟叶假蚊母的 ycf1 基因
AGC(0.33)ꎮ 有 30 个密码子 RSCU 值大于 1ꎬ除
朝 SSC 区分别进入了 4 581 bp 和 4 554 bpꎬ其余 5
Leu(UUG)对应的密码子以外ꎬ其余 29 个均以 A /
个物种均朝 SSC 区进入了 4 560 bpꎮ 三脉水丝梨
U 结尾ꎬ说明三脉水丝梨叶绿体基因组密码子更
的 trnH 基因距离 IRA / LSC 边界最远ꎬ为 122 bpꎬ
偏向以 A / U 结尾ꎮ
其余 6 个物种 trnH 基因与 IRA / LSC 边界的距离
基于 ENC 值建立高、低表达基因库后ꎬ计算出
差异相对较小(7 ~ 25 bp)ꎮ
ΔRSCU 值ꎬ得到 28 个三脉水丝梨叶绿体基因组的
使用 Mauve 插件对三脉水丝梨及 6 个近缘物
高表达密码子ꎬ其中有 3 / 7 的密码子以 A / U 结尾ꎮ
种的叶绿体基因组进行共线性分析ꎬ结果( 图 5)
结合筛选得到的高表达密码子和高频密码子ꎬ最
显示 7 个物种基因组具有较高的共线性ꎬ基本不
终得到 9 个最优密码子( 表 3 中带∗的密码子)ꎮ
存在大片段基因重排和倒置现象ꎬ结构比较保守ꎮ
其中ꎬ所有的最优密码子均以 A / U 结尾ꎮ
以蚊母树为参照序列ꎬ通过 mVISTA 软件对三脉水
对三脉水丝梨叶绿体基因组密码子第 3 位碱
丝梨及其 6 个近缘物种进行基因组比对ꎬ结果显
基进行 PR2 ̄plot 分析ꎬ结果( 图 3:A) 表明坐标点
示编码区和 IR 区都更为保守( 图 6)ꎮ 总体而言ꎬ
主要分布在 A / (A +T ) <0.5 和 G / (G +C ) >0.5
3 3 3 3 3 3 这 7 个物种的叶绿体基因组不存在大片段缺失的
的区域ꎬ总体表现出密码子第 3 位碱基 G 和 T 的
现象ꎬ具有较高的相似性ꎮ
使用频率大于 C 和 Aꎬ说明三脉水丝梨叶绿体基 2.5 核苷酸多态性分析
因组密码子偏好受到碱基突变和自然选择的影 为确定水丝梨属植物的高突变区域ꎬ本研究
响ꎮ 从图 3:B 可以看出ꎬ基因基本上落在期望曲 使用 DnaSP v6.0 软件对水丝梨属三脉水丝梨和水
线下方ꎬ说明突变对三脉水丝梨叶绿体基因组密 丝梨的 4 条叶绿体基因组的蛋白编码区域和非编
码子偏好性的影响较小ꎮ 中性绘图分析结果( 图 码区域分别进行核苷酸多态性( P ) 分析ꎮ 对 79
i
3:C) 显 示ꎬ GC 与 GC 成 负 相 关ꎬ 相 关 系 数 为 个蛋白编码区(重复基因仅计算一次) 的分析显示
12 3
-0.034ꎬ相关性不显著ꎮ 回归系数为- 0.049 4ꎬ接 (图 7:A)ꎬP 值最高的编码区为 psaJ(0.007 41)ꎬ
i
近于 0ꎬ这表明自然选择对三脉水丝梨叶绿体基因 其次为 petL(0.005 21)ꎮ 在蛋白编码区中共发现
35 处 P = 0 的高度保守区域ꎮ 以 P = 0.003 0为阈
组密码子偏好性的影响最大ꎮ i i

