Page 135 - 《广西植物》2021年第12期
P. 135
ϟ 期 梁晓静等᧥ 香樟转录组基因密码子偏好性分析 ԡ Ꭾ ँ
库和低表达库ᖔ并以高表达库的 ୩ऊВ 与低表达库 ᥈ऊሕ 越低ᤥ 基因长度与 ऊዶ᧧ 无显著相关ଫ尽管基
的对应的 ୩ऊВ 的差值为 ᪵୩ऊВᖔ以 ᪵୩ऊВ 大于 因长度与密码子偏好性参数 ऊା᧧ܦèᆍᡱܦጶશऊ 为极显
ԡԡऐ 且 ୩ऊВ 大于 ϟ 的密码子为最优密码子ᤥ 著相关ᖔ但其相关系数极低ᖔ说明基因长度对密码
子偏好影响不大ᤥ
জ 结果与分析 ୩ऊВ 分析结果ྉ 表 ሕɯ 表明ᖔ୩ऊВ 值大于 ϟ
的密码子数目为 Ꭾ 个ᖔ其中以 В 结尾的有 ϟ࿗ 个ᖔ
ԣॹϓ 香樟转录组选取 以 ዶ 结尾的有 ऐ 个ᖔ以 ᥈ 结尾的有 ጢ 个ଫ以 ዶ 或 В
为了 准确分析香樟密码 子 偏 好 性ᖔ 本文从 结尾的密码子占 ऐϟ࿗ऐᠮᤥ
શऊା᧧ 中下载了 ᤃ 个香樟转录组测序的结果ᤥ 但由 ԣॹᇺ 中性绘图
于许多转录组没有明确注明转录组的组织ᖔ或者 香樟叶片转录组基因中性绘图结果ྉ图 ϟɯ 表
对转录测序质量比较差的结果进行剔除ᖔ最后只 明ᖔ᥈ऊϟ 的变化范围为 ԡᎮϟ ጲ ԡᎮጢँᖔ᥈ऊሕ 变化范
剩下 ୩ᤃ࿗ሕᤃϟጢጢ 一个转录组用作本文的实验数 围为 ԡϟԡऐጲԡँሕँᤥ 图 ϟ 中代表基因的点有一些落
据ᤥ 该转录组数据量为 ँᎮ ᥈ᤥ 利用 ఋʢᔽႿᔽᡷᢃ 组装 在对角线上ᖔ有更多的点偏离对角线ᖔ᥈ऊϟ 与 ᥈ऊሕ
转录组后得到 ሕԡጢ ᥘᤦ 序列ᖔ利用 ዹʛ᥋ၤᔽᡷ᥋ᔀ༁ᡷ 命令以 的相关性不显著ᤥ 上述结果综合表明香樟转录组
默认参数进一步延伸得到 ँ ᥘᤦᤥ 在此基础上ᖔ 基因密码子偏好性同时受到突变和选择的作用ᤥ
利用 ఋʢᑕႿ༁᧕ᔀዹᆍʛᔀʢ 将 转 录组序列与 ୩औᔽ༁༁ᡱʢᆍᡷ 和 ԣॹ ጛટࣷᡓᤀᅳᡙ 绘图
ᡱᑕቝ᥋ዶ 数据库同源比对后得到 ጢ࿗ ᥘᤦ 数据ᤥ 利用 以 ጶશऊ 作为 ᡥ 轴ᖔ 以 ᥈ऊሕ༁ 作为 ଝ 轴ᖔ 开展
自编 ᡱᔀʢ 脚本提取以 ዶВ᥈ 开头的 ሕᎮ ᥘᤦ 基因序列 ጶશऊ᥋ᡱᆍᡷ 绘图ᤥ 将参试基因都布置于该坐标系ᖔ
用于后续分析ᤥ ᥈ऊሕ༁ 分布于 ԡԡᎮᎮጲԡँሕᎮ 之间ᖔ代表基因的点有的
ԣॹԣ 密码子偏好性参数 着落在标准曲线的上方ᖔ有的着落在标准曲线的下
本文利用 ऊᆍʛᆍႿۼ 软件ྉၤᡷᡷᡱ༁᧥ᣰ ᣰ ༁ᆍࣼʢዹᔀᆍʢ੫ᔀႿᔀᡷᣰ 方及另外一部分在标准曲线上ྉ图 ɯᤥ 为了进一步
ᡱʢᆍᢼᔀዹᡷ༁ᣰ ዹᆍʛᆍႿऔᣰ ɯ计算所有参试基因密码子偏好性 分析基因分布的具体情况ᖔ本文分析了 ጶશऊ 比值的
参数ᤥ 由表 ϟ 可知ᖔ密码子不同位置碱基的 ᥈ऊ 含 频率分布ྉ表 ࿗ɯᖔሕᠮ的基因分布于ͱԡԡጢ ጲ ԡԡጢ 之
量差异较大ᖔ第一位ܦ第二位和第三位密码子 ᥈ऊ 间ᖔጢ࿗ँँᠮ的基因分布于 ԡԡጢ ጲ ԡϟጢ 之间ᖔϟᤃᤃᠮ分
含量 的变化范围分别为 ԡ ࿗ጢ ጲ ԡ ँϟሕܦԡ ϟᎮँ ጲ 布于ͱԡϟጢጲ ͱԡԡጢ 之间ᖔँᤃᠮ分布于 ԡϟጢ ጲԡጢ 之
ԡऐጢऐ和 ԡϟԡऐ ጲ ԡँሕँᖔ均值分别为 ԡጢϟϟܦԡ࿗ԡऐ 和 间ᖔϟᤃᎮᠮ分布于ԡጢ ጲ ԡጢ 之间ᤥ 说明突变在香樟
ԡ࿗ሕ࿗ଫ总 ᥈ऊ 含量的变化范围为 ԡᎮሕ ጲ ԡᎮ࿗ᖔ均 叶片转录组基因偏好性形成过程中起重要作用ᖔ而
值为 ԡ࿗ጢଫ ऊዶ᧧ 的范围为ԡԡᤃ࿗ ጲ ԡ ࿗ԡϟᖔ均值为 选择的作用更大ᤥ
ԡ ϟँँଫ ऊା᧧ 的范围为 ͱ ԡ ጢϟሕ ጲ ԡሕᤃ࿗ᖔ 均值为 ԣॹጇ 最优密码子
ͱԡԡጢᤃଫèᆍᡱ 的范围为 ԡϟጢሕ ጲ ԡᤃሕ࿗ᖔ均值为ԡሕऐ࿗ଫ 按照基因密码子偏好性参数 ऊዶ᧧ 数值大小进
᥈ʢᑕᢃ 的范围为ͱᎮ࿗Ꭾ ጲ ϟ࿗ሕᤃᖔ均值为ͱԡጢँଫ其 行排序ᖔ从两端分别取 ϟᠮ的基因分别建立高表达
氨基 酸长度变化范围 ऐᤃ ጲ ࿗Ꭾᤃ ጢᖔ 均值为 ሕᤃᤃଫ 库和低表达库ᖔ再分别计算两个库的 ୩ऊВᖔ进一
ዶʢᆍቝᆍ 的变化范围为 ԡԡԡԡ ጲ ԡሕ࿗ᖔ均值为 ԡԡऐጢᤥ 步计算 ᪵୩ऊВᤥ ᤃ࿗ 个密码子中ᖔ有 ጢ 个密码子
ጶશऊ 的范围为 ᤃ ँ ጲ ᤃϟ ԡԡᖔ 均值 为 ጢᎮᤃᖔ 在 的 ᪵୩ऊВ 大于 ԡԡऐᖔ其中以 ᥈ 结尾的有 ሕ 个ᖔ以
ሕ࿗ ँሕϟ基因中ᖔ有 ऐԡ 个基因的 ጶશऊ 小于 ሕጢྉ ȮᔽᑕႿ੫ ऊ 结尾的有 ϟጢ 个ᖔ以 ዶ 结尾的有 个ᖔ以 В 结尾
ᔀᡷ ᑕᖔ ԡԡऐɯᖔ其余基因的 ጶશऊ 均大于 ሕጢᖔ这说明 的有 ጢ 个ᤥ 结合表 ሕ 中 ୩ऊВ 大于 ϟ 的高频密码
香樟转录组中只有极少数基因偏好性较强ᖔ绝大 子与表 ጢ 中标星号的高表达密码子ᖔ从而确定最
多数基因的偏好性较弱ᖔ甚至有些基因没有密码 优密码子ᤥ 最终确定香樟叶片转录组基因中有 ᤃ
子偏好性ᤥ 个最 优密码子分别为 ᥈ВВܦ ऊዶ᥈ܦ ᥈ዶዶܦ ВऊВܦ
密码子偏好性参数相关性分析结果ྉ 表 ɯ 表 ᥈ऊВܦ᥈᥈Вᖔ其中 ጢ 个密码子以 ዶ 或 В 结尾ᖔ另外 ϟ
明ᖔ᥈ऊϟܦ᥈ऊܦ᥈ऊሕ༁ 与其余参数都呈极显著相关ଫ 个以 ᥈ 结尾ᤥ
᥈ऊሕ 除与 ᥈ʢᑕᢃ 不相关外ᖔ与其他参数均显著相
关ᤥ 上述说明基因的碱基组成对密码子偏好性参 ሕজ 讨论与结论
数存在一定影响ᤥ 基因长度ྉશɯ 与基因不同位置
的碱基含量极显著相关ᖔ᥈ऊϟܦ᥈ऊ 及 ᥈ऊሕ 的相关 本文以测序质量较高转录组数据为材料研究
系数从 ԡϟ࿗ጢ 到ͱԡϟԡሕᖔ说明基因越长ᖔ᥈ऊϟ 越高ᖔ 香樟密码子偏好性ᤥ 在转录组数据组装ܦ 延伸去