Page 38 - 《广西植物》2020年第2期
P. 38

2 期                    陆奇丰等: 两种梧桐叶绿体基因组密码子使用偏性分析                                           1 7 5

   选:基因长度大于 300 bpꎬ以 ATG 为起始密码子ꎬ以                    义密码子间的相对使用概率( 杨国锋等ꎬ2015)ꎮ
   TAA、TAG、TGA 为终止密码子ꎬ并剔除重复的编码                       当 RSCU>1 时ꎬ表示该密码子使用频率较高ꎬ偏好
   基因ꎬ最终获得各 52 条编码基因进行后续分析ꎮ                          性较强ꎻ当 RSCU<1 时ꎬ表示该密码子使用频率较
   1.2 方法                                            低ꎬ偏好 性 较 弱ꎻ 当 RSCU = 1 时ꎬ 该 密 码 子 无 偏
   1.2.1 密 码 子 相 关 参 数 的 计 算   分 别 利 用 软 件           好性ꎮ
   CodonW( http: / / codonw. sourceforge. net/ ) 和 CUSP  1.2.6 最优密码子分析  对 CDS 的 ENC 值进行排
   (http: / / imed.med.ucm. es/ EMBOSS / ) 分析 CDS 的  序ꎬ从两极各选出 5 个基因作为高、低表达组ꎬ分
   有效密码子数( ENC)、密码子第 3 位碱基组成特                        别计算对应的密码子 RSCU 值ꎬ筛选高低表达组内
   性ꎬ以 C 、C 、C 、C 表示ꎬ统计密码子第 1 位、                     对应密码子△RSCU 之差大于 0.08 作为优越高表
          T3  C3  A3   G3
   第 2 位、第 3 位碱基的 GC 含量及 52 个基因总 GC                  达密码子ꎬ并与整体密码子 RSCU 进行结合比较ꎬ
   含量ꎬ分别用 C        、C   、C   、GC 表示ꎮ                 将△RSCU≥0.08ꎬ且整体 RSCU>1 的密码子定义
                 GC1  GC2  GC3
   1.2.2 中性绘图分析  计算各 CDS 的 C              、C   的     为最优密码子(秦政等ꎬ2018ꎻ石元豹等ꎬ2018 )ꎮ
                                        GC1  GC2
   平均值ꎬ记为 C         ꎬ以此为纵坐标ꎬ以 C           为横坐
                 GC12                   GC3
   标绘制散点图ꎬ分析 C            与 C    的相关性ꎬ并推测            2  结果与分析
                       GC3    GC12
   影响密码子偏性的因素ꎮ 若 C               与 C    呈显著相
                               GC3   GC12
   关ꎬ表明密码子对碱基使用无差异ꎬ突变是密码子                            2.1 密码子组成分析
   偏性的主要影响因素ꎻ若 C               与 C    相关性不显              通过 CodonW 和在线 CUSP 对美丽梧桐、云南
                            GC3    GC12
   著ꎬ且斜率接近 0ꎬ表明密码子第 1 位、第 2 位碱基                      梧桐叶绿体编码基因组的 52 条 CDS 进行分析ꎬ结
   与第 3 位碱基使用存在差异ꎬ密码子偏性与第 3 位                        果如表 1 所示ꎬ美丽梧桐、云南梧桐叶绿体编码基
   碱基显著相关ꎬ选择压力对密码子偏性的影响较                             因密码子 C 和 C 的含量分别为 46.56%、46.67%
                                                                T3   A3
   强(尚明照等ꎬ2011ꎻ 秦政等ꎬ2018)ꎮ                           与 43.04%、43.17%ꎬ表明两种梧桐叶绿体编码基
   1.2.3 PR2 ̄plot 绘图分析  PR2 ̄plot 分析是考察突              因第 3 位碱基以 A / T 结尾为主ꎮ 密码子上不同位
   变和自然选择对密码子偏性影响的方法之一( 尚                            置碱基 GC 含量有所差异ꎬ第 1 位碱基的 GC 含量
   明照等ꎬ2011ꎻ刘慧等ꎬ2017)ꎮ 为避免密码子第 3                     最高ꎬ分别为 46.10%、46.17%ꎻ其次为第 2 位ꎬ分
   位碱基上的 A / T 和 G / C 突变的不平衡ꎬ通过统计                   别为 38.14%、38.06%ꎻ最低为第 3 位碱基ꎬ分别为
   两种梧桐叶绿体 52 条基因中编码丙氨酸、甘氨                           30.11%、29.92%ꎬ且两种梧桐叶绿体基因组 GC 含
   酸、亮氨酸(CTT、CTC、CTA、CTG)、脯氨酸、精氨酸                    量分别为 38.12%、38.05%ꎬ表明叶绿体编码基因
   (CGT、CGC、CGA、CGG)、丝氨酸( TCT、TCC、TCA、               富含 A / T 碱基ꎮ ENC 值可反映密码子偏性程度ꎬ
   TCG)、苏氨酸、缬氨酸的密码子第 3 位碱基的 T 、                      其取值范围为 20 ~ 61ꎬENC 值越小表明偏性越强ꎬ
                                               3
   C 、A 、G 的组成情况ꎬ并以 A / ( A + T ) 为纵坐                ENC 值越大则密码子偏性越弱ꎬ一般以 ENC 的值
    3   3  3                   3    3   3
   标ꎬ以 G / (G +C )为横坐标绘制散点图ꎮ                         为 35 时区分密码子偏性强弱( Jiang et al.ꎬ2008)ꎮ
          3    3  3
   1.2.4 ENC ̄plot 绘图分析  为进一步了解两种梧桐                   本研究中ꎬ两种梧桐叶绿体基因组的 ENC 值为 50
   碱基组成对密码子偏性的影响ꎬ以两种梧桐叶绿                             左右ꎬ大于 35 表明其密码子偏性较弱ꎮ
   体中各基因的 ENC、GC 值为纵、横 坐 标 做 散 点                         利用在线 CUSP 对各基因密码子不同位置碱
                         3
                                               2
   图ꎬ并与 ENC 期望值(ENC = 2+GC +29 / ([ GC +             基的 GC 含量进行分析ꎬ结果如表 2 所示ꎬ不同基
                                   3          3
   (1-GC ) ]) 进行比较ꎬ期望值代表密码子偏性仅                       因的 GC 含量存在一定的差异ꎬC                、C   与 C   差
            2
         3                                                                         GC1  GC2    CG3
   受碱基组成的影响ꎮ 若基因分布于期望值曲线的                            异较大ꎬ两种梧桐叶绿体编码基因 ENC 范围分别
   上方ꎬ其密码子偏性仅受突变影响ꎻ若基因分布于                            为 36.91 ~ 56.46、36.55 ~ 58.04ꎬ且大部分基因的
   曲线下方较远位置ꎬ表明选择是影响密码子偏性                             ENC 大于 44ꎬ表明叶绿体编码基因密码子偏性较
   的主要因素(牛元等ꎬ2018)ꎮ                                  弱ꎮ 美丽梧桐、云南梧桐中 atpE 基因的 ENC 值最
   1.2.5 相对同义密码子使用度分析  为考察同义                         大ꎬ分别为 56.46 和 58.04ꎬ说明美丽梧桐中编码
   密码子 偏 好 性 情 况ꎬ 以 相 对 同 义 密 码 子 使 用 度              atpE 基因密码子偏性强于云南梧桐ꎬ同时两种梧
   (RSCU)表示特定密码子在编码对应氨基酸的同                           桐叶绿体编码基因 GC 含量、ENC 值之间也存在差
   33   34   35   36   37   38   39   40   41   42   43