Page 38 - 《广西植物》2020年第2期
P. 38
2 期 陆奇丰等: 两种梧桐叶绿体基因组密码子使用偏性分析 1 7 5
选:基因长度大于 300 bpꎬ以 ATG 为起始密码子ꎬ以 义密码子间的相对使用概率( 杨国锋等ꎬ2015)ꎮ
TAA、TAG、TGA 为终止密码子ꎬ并剔除重复的编码 当 RSCU>1 时ꎬ表示该密码子使用频率较高ꎬ偏好
基因ꎬ最终获得各 52 条编码基因进行后续分析ꎮ 性较强ꎻ当 RSCU<1 时ꎬ表示该密码子使用频率较
1.2 方法 低ꎬ偏好 性 较 弱ꎻ 当 RSCU = 1 时ꎬ 该 密 码 子 无 偏
1.2.1 密 码 子 相 关 参 数 的 计 算 分 别 利 用 软 件 好性ꎮ
CodonW( http: / / codonw. sourceforge. net/ ) 和 CUSP 1.2.6 最优密码子分析 对 CDS 的 ENC 值进行排
(http: / / imed.med.ucm. es/ EMBOSS / ) 分析 CDS 的 序ꎬ从两极各选出 5 个基因作为高、低表达组ꎬ分
有效密码子数( ENC)、密码子第 3 位碱基组成特 别计算对应的密码子 RSCU 值ꎬ筛选高低表达组内
性ꎬ以 C 、C 、C 、C 表示ꎬ统计密码子第 1 位、 对应密码子△RSCU 之差大于 0.08 作为优越高表
T3 C3 A3 G3
第 2 位、第 3 位碱基的 GC 含量及 52 个基因总 GC 达密码子ꎬ并与整体密码子 RSCU 进行结合比较ꎬ
含量ꎬ分别用 C 、C 、C 、GC 表示ꎮ 将△RSCU≥0.08ꎬ且整体 RSCU>1 的密码子定义
GC1 GC2 GC3
1.2.2 中性绘图分析 计算各 CDS 的 C 、C 的 为最优密码子(秦政等ꎬ2018ꎻ石元豹等ꎬ2018 )ꎮ
GC1 GC2
平均值ꎬ记为 C ꎬ以此为纵坐标ꎬ以 C 为横坐
GC12 GC3
标绘制散点图ꎬ分析 C 与 C 的相关性ꎬ并推测 2 结果与分析
GC3 GC12
影响密码子偏性的因素ꎮ 若 C 与 C 呈显著相
GC3 GC12
关ꎬ表明密码子对碱基使用无差异ꎬ突变是密码子 2.1 密码子组成分析
偏性的主要影响因素ꎻ若 C 与 C 相关性不显 通过 CodonW 和在线 CUSP 对美丽梧桐、云南
GC3 GC12
著ꎬ且斜率接近 0ꎬ表明密码子第 1 位、第 2 位碱基 梧桐叶绿体编码基因组的 52 条 CDS 进行分析ꎬ结
与第 3 位碱基使用存在差异ꎬ密码子偏性与第 3 位 果如表 1 所示ꎬ美丽梧桐、云南梧桐叶绿体编码基
碱基显著相关ꎬ选择压力对密码子偏性的影响较 因密码子 C 和 C 的含量分别为 46.56%、46.67%
T3 A3
强(尚明照等ꎬ2011ꎻ 秦政等ꎬ2018)ꎮ 与 43.04%、43.17%ꎬ表明两种梧桐叶绿体编码基
1.2.3 PR2 ̄plot 绘图分析 PR2 ̄plot 分析是考察突 因第 3 位碱基以 A / T 结尾为主ꎮ 密码子上不同位
变和自然选择对密码子偏性影响的方法之一( 尚 置碱基 GC 含量有所差异ꎬ第 1 位碱基的 GC 含量
明照等ꎬ2011ꎻ刘慧等ꎬ2017)ꎮ 为避免密码子第 3 最高ꎬ分别为 46.10%、46.17%ꎻ其次为第 2 位ꎬ分
位碱基上的 A / T 和 G / C 突变的不平衡ꎬ通过统计 别为 38.14%、38.06%ꎻ最低为第 3 位碱基ꎬ分别为
两种梧桐叶绿体 52 条基因中编码丙氨酸、甘氨 30.11%、29.92%ꎬ且两种梧桐叶绿体基因组 GC 含
酸、亮氨酸(CTT、CTC、CTA、CTG)、脯氨酸、精氨酸 量分别为 38.12%、38.05%ꎬ表明叶绿体编码基因
(CGT、CGC、CGA、CGG)、丝氨酸( TCT、TCC、TCA、 富含 A / T 碱基ꎮ ENC 值可反映密码子偏性程度ꎬ
TCG)、苏氨酸、缬氨酸的密码子第 3 位碱基的 T 、 其取值范围为 20 ~ 61ꎬENC 值越小表明偏性越强ꎬ
3
C 、A 、G 的组成情况ꎬ并以 A / ( A + T ) 为纵坐 ENC 值越大则密码子偏性越弱ꎬ一般以 ENC 的值
3 3 3 3 3 3
标ꎬ以 G / (G +C )为横坐标绘制散点图ꎮ 为 35 时区分密码子偏性强弱( Jiang et al.ꎬ2008)ꎮ
3 3 3
1.2.4 ENC ̄plot 绘图分析 为进一步了解两种梧桐 本研究中ꎬ两种梧桐叶绿体基因组的 ENC 值为 50
碱基组成对密码子偏性的影响ꎬ以两种梧桐叶绿 左右ꎬ大于 35 表明其密码子偏性较弱ꎮ
体中各基因的 ENC、GC 值为纵、横 坐 标 做 散 点 利用在线 CUSP 对各基因密码子不同位置碱
3
2
图ꎬ并与 ENC 期望值(ENC = 2+GC +29 / ([ GC + 基的 GC 含量进行分析ꎬ结果如表 2 所示ꎬ不同基
3 3
(1-GC ) ]) 进行比较ꎬ期望值代表密码子偏性仅 因的 GC 含量存在一定的差异ꎬC 、C 与 C 差
2
3 GC1 GC2 CG3
受碱基组成的影响ꎮ 若基因分布于期望值曲线的 异较大ꎬ两种梧桐叶绿体编码基因 ENC 范围分别
上方ꎬ其密码子偏性仅受突变影响ꎻ若基因分布于 为 36.91 ~ 56.46、36.55 ~ 58.04ꎬ且大部分基因的
曲线下方较远位置ꎬ表明选择是影响密码子偏性 ENC 大于 44ꎬ表明叶绿体编码基因密码子偏性较
的主要因素(牛元等ꎬ2018)ꎮ 弱ꎮ 美丽梧桐、云南梧桐中 atpE 基因的 ENC 值最
1.2.5 相对同义密码子使用度分析 为考察同义 大ꎬ分别为 56.46 和 58.04ꎬ说明美丽梧桐中编码
密码子 偏 好 性 情 况ꎬ 以 相 对 同 义 密 码 子 使 用 度 atpE 基因密码子偏性强于云南梧桐ꎬ同时两种梧
(RSCU)表示特定密码子在编码对应氨基酸的同 桐叶绿体编码基因 GC 含量、ENC 值之间也存在差