Page 32 - 《广西植物》2020年第7期
P. 32
9 2 8 广 西 植 物 40 卷
放阅读框研判ꎬ符合条件的余下编码序列用于本 面散点图展示各基因碱基组成ꎮ 中心点代表 C = G
研究的偏性分析ꎮ 且 A = Tꎬ由中心点向坐标点发出的矢量则表示偏
1.2 方法 倚程度和方向(Sueokaꎬ 1999)ꎮ
1.2.1 中性绘图分析 分别统计野生大豆和栽培 1.2.5 最优密码子分析 以 CDS 的 Nc 值为偏性标
大豆线粒体基因组各 CDS 在密码子第 1 位、第 2 准ꎬ将大豆线粒体基因组编码基因中 Nc 值居于最
位和 3 位的 GC 含量ꎬ以 GC3( 第 3 位 GC 含量) 为 低和最高两极的 10%基因分别构成高、低表达组ꎬ
横坐标ꎬ以 GC2(第 2 位 GC 含量) 和 GC1( 第 1 位 统计两组的 RSCU 值ꎮ 当两组间 ΔRSCU( 高表达
GC 含量)的平均值为纵坐标( 计为 GC12) 绘制二 组 RSCU 值-低表达组 RSCU 值)大于 0.08 密码子
维散点图ꎬ以分析三联体密码子三个位置碱基组 定义为高表达密码子ꎮ 将整体 RSCU >1 的密码子
成的相关性( Sueokaꎬ 1988)ꎮ 若 GC12 与 GC3 的 确定为高频率密码子ꎮ 同时满足上述两种条件的
相关性不显著ꎬ则表明密码子第 1 位、第 2 位与第 密码子定义为最优密码子(Wang et al.ꎬ 2018)ꎮ
3 位碱基使用存在差异ꎬ选择压力对密码子偏性影
响较大ꎻ若 GC12 与 GC3 显著相关ꎬ表明密码子第 2 结果与分析
1 位、第 2 位与第 3 位碱基使用无差异ꎬ密码子偏
性的形成受突变的影响大ꎮ 2.1 密码子使用特征
1.2.2 相对同义密码子使用度分析 应用 CodonW 栽培大豆和野生大豆在线粒体基因组编码区
软件计算 获 得 各 编 码 基 因 的 有 效 密 码 子 数 ( Nc 的碱基组成上基本一致ꎬ其总体 GC 含量分别为
值)、密码子偏爱指数( codon bias indexꎬ CBI)、最
44.56%和 44.58%ꎮ 它们的整个线粒体基因组 GC
优密码 子 使 用 频 率 ( frequency of optimal codonsꎬ 含量均为 45.03%ꎮ 栽培大豆和野生大豆的线粒
Fop)ꎮ 利用 CAIcal 在线服务器对大豆线粒体基因 体编码基因在密码子三个不同位置的碱基 GC 含
组编 码 序 列 的 相 对 同 义 密 码 子 使 用 度 ( relative 量也有所差异ꎬ密码子第 1 位碱基的 GC 含量最
synonymous codon usageꎬRSCU) 进行 分 析 ( Puigbo 高ꎬ 分 别 为 48. 27%、 48. 31%ꎬ 第 2 位 分 别 为
et al.ꎬ 2008)ꎮ 若 RSCU = 1ꎬ表明该密码子的使用
43.76%、43.52%ꎬ第 3 位分别为 41.64%、41.92%ꎬ
无偏好性ꎻ若 RSCU>1ꎬ表明该密码子的使用频率 呈现出 GC1>GC2> GC3 的趋势(表 1)ꎮ 这表明两
大于同义密码子使用的平均频率ꎻ若 RSCU<1ꎬ则
个物种线粒体编码基因富含 A、T 碱基ꎮ
表明低于平均频率ꎮ
1.2.3 Nc ̄plot 绘图分析 以 GC3s 为横坐标ꎬNc 值 表 1 野生大豆和栽培大豆线粒体基因组
为纵坐标ꎬ作散点图ꎬ以探讨碱基组成对密码子偏 密码子不同位置 GC 含量 (单位:%)
好性的影响ꎻ以仅由碱基组成决定密码子偏好性 Table 1 GC contents of different positions of codon in
时的理论值作标准曲线ꎬ标准曲线反映了在突变 Glycine mitogenome (Unit: %)
压力下的 Nc 和 GC3s 的函数关系( Wright et al.ꎬ 物种
GCall GCcds GC1 GC2 GC3
Species
1990)ꎮ 理论 Nc 值计算公式为 Nc = 2 +GC3s+ 29 /
栽培大豆 45.03 44.56 48.27 43.76 41.64
2 2
[GC3s +(1-GC3s) ]ꎮ G. max
1.2.4 奇偶偏好分析 PR2( parity rule 2ꎬPR2) 分 野生大豆 45.03 44.58 48.31 43.52 41.92
G. soja
析ꎬ为避免由密码子第 3 位碱基的 A / T 或 T / A 和
G / C 或 C / G 的突变不均衡ꎬ仅选择 4 种密码子编
码的氨基酸ꎬ即丙氨酸、亮氨酸、脯氨酸、丝氨酸、 栽培大豆和野生大豆的 Nc 与 GC3 分别呈显
苏氨酸、缬氨酸、精氨酸和甘氨酸ꎬ进行密码子第 3 著相关和极显著相关ꎬ与 GC1 和 GC2 的相关性均
位上 4 种碱基组成的分析ꎮ 以每个基因 A3 / ( A3+ 未达显著水平ꎬ说明其线粒体编码基因密码子第 3
T3)值作纵坐标ꎬG3 / ( G3 +C3) 值作横坐标ꎬ以平 位上的碱基组成对密码子偏性影响较大ꎮ 线粒体