Page 32 - 《广西植物》2020年第7期
P. 32

9 2 8                                 广  西  植  物                                         40 卷
   放阅读框研判ꎬ符合条件的余下编码序列用于本                             面散点图展示各基因碱基组成ꎮ 中心点代表 C = G
   研究的偏性分析ꎮ                                          且 A = Tꎬ由中心点向坐标点发出的矢量则表示偏
   1.2 方法                                            倚程度和方向(Sueokaꎬ 1999)ꎮ
   1.2.1 中性绘图分析  分别统计野生大豆和栽培                         1.2.5 最优密码子分析  以 CDS 的 Nc 值为偏性标

   大豆线粒体基因组各 CDS 在密码子第 1 位、第 2                       准ꎬ将大豆线粒体基因组编码基因中 Nc 值居于最
   位和 3 位的 GC 含量ꎬ以 GC3( 第 3 位 GC 含量) 为               低和最高两极的 10%基因分别构成高、低表达组ꎬ
   横坐标ꎬ以 GC2(第 2 位 GC 含量) 和 GC1( 第 1 位               统计两组的 RSCU 值ꎮ 当两组间 ΔRSCU( 高表达
   GC 含量)的平均值为纵坐标( 计为 GC12) 绘制二                      组 RSCU 值-低表达组 RSCU 值)大于 0.08 密码子

   维散点图ꎬ以分析三联体密码子三个位置碱基组                             定义为高表达密码子ꎮ 将整体 RSCU >1 的密码子
   成的相关性( Sueokaꎬ 1988)ꎮ 若 GC12 与 GC3 的              确定为高频率密码子ꎮ 同时满足上述两种条件的
   相关性不显著ꎬ则表明密码子第 1 位、第 2 位与第                        密码子定义为最优密码子(Wang et al.ꎬ 2018)ꎮ
   3 位碱基使用存在差异ꎬ选择压力对密码子偏性影
   响较大ꎻ若 GC12 与 GC3 显著相关ꎬ表明密码子第                      2  结果与分析
   1 位、第 2 位与第 3 位碱基使用无差异ꎬ密码子偏

   性的形成受突变的影响大ꎮ                                      2.1 密码子使用特征
   1.2.2 相对同义密码子使用度分析  应用 CodonW                         栽培大豆和野生大豆在线粒体基因组编码区
   软件计算 获 得 各 编 码 基 因 的 有 效 密 码 子 数 ( Nc             的碱基组成上基本一致ꎬ其总体 GC 含量分别为
   值)、密码子偏爱指数( codon bias indexꎬ CBI)、最
                                                     44.56%和 44.58%ꎮ 它们的整个线粒体基因组 GC
   优密码 子 使 用 频 率 ( frequency of optimal codonsꎬ      含量均为 45.03%ꎮ 栽培大豆和野生大豆的线粒
   Fop)ꎮ 利用 CAIcal 在线服务器对大豆线粒体基因                     体编码基因在密码子三个不同位置的碱基 GC 含
   组编 码 序 列 的 相 对 同 义 密 码 子 使 用 度 ( relative         量也有所差异ꎬ密码子第 1 位碱基的 GC 含量最
   synonymous codon usageꎬRSCU) 进行 分 析 ( Puigbo      高ꎬ 分 别 为 48. 27%、 48. 31%ꎬ 第 2 位 分 别 为
   et al.ꎬ 2008)ꎮ 若 RSCU = 1ꎬ表明该密码子的使用
                                                     43.76%、43.52%ꎬ第 3 位分别为 41.64%、41.92%ꎬ
   无偏好性ꎻ若 RSCU>1ꎬ表明该密码子的使用频率                         呈现出 GC1>GC2> GC3 的趋势(表 1)ꎮ 这表明两
   大于同义密码子使用的平均频率ꎻ若 RSCU<1ꎬ则
                                                     个物种线粒体编码基因富含 A、T 碱基ꎮ
   表明低于平均频率ꎮ
   1.2.3 Nc ̄plot 绘图分析  以 GC3s 为横坐标ꎬNc 值                   表 1  野生大豆和栽培大豆线粒体基因组
   为纵坐标ꎬ作散点图ꎬ以探讨碱基组成对密码子偏                                   密码子不同位置 GC 含量 (单位:%)
   好性的影响ꎻ以仅由碱基组成决定密码子偏好性                              Table 1  GC contents of different positions of codon in
   时的理论值作标准曲线ꎬ标准曲线反映了在突变                                       Glycine mitogenome (Unit: %)

   压力下的 Nc 和 GC3s 的函数关系( Wright et al.ꎬ                   物种
                                                                   GCall  GCcds  GC1   GC2    GC3
                                                         Species
   1990)ꎮ 理论 Nc 值计算公式为 Nc = 2 +GC3s+ 29 /
                                                        栽培大豆      45.03  44.56  48.27  43.76  41.64
         2          2
   [GC3s +(1-GC3s) ]ꎮ                                    G. max
   1.2.4 奇偶偏好分析  PR2( parity rule 2ꎬPR2) 分              野生大豆      45.03  44.58  48.31  43.52  41.92
                                                         G. soja
   析ꎬ为避免由密码子第 3 位碱基的 A / T 或 T / A 和
   G / C 或 C / G 的突变不均衡ꎬ仅选择 4 种密码子编
   码的氨基酸ꎬ即丙氨酸、亮氨酸、脯氨酸、丝氨酸、                               栽培大豆和野生大豆的 Nc 与 GC3 分别呈显
   苏氨酸、缬氨酸、精氨酸和甘氨酸ꎬ进行密码子第 3                          著相关和极显著相关ꎬ与 GC1 和 GC2 的相关性均
   位上 4 种碱基组成的分析ꎮ 以每个基因 A3 / ( A3+                   未达显著水平ꎬ说明其线粒体编码基因密码子第 3
   T3)值作纵坐标ꎬG3 / ( G3 +C3) 值作横坐标ꎬ以平                  位上的碱基组成对密码子偏性影响较大ꎮ 线粒体
   27   28   29   30   31   32   33   34   35   36   37