Page 75 - 《广西植物》2022年第11期
P. 75
ϟϟ 期 刘营等᧥ 甘蔗 ዞટቴዛ᤹ۗ 基因家族的鉴定与生物信息学分析 ϟ ऐ ᤃ Ꭾ
ఋዶ᧧ 数据库ᖔ甘蔗全基因组和基因注释文件来源 ྉႿᔀᔽ੫ၤᤦᆍʢ ᢼᆍᔽႿᔽႿ੫ɯ构建系统进化树ᖔ其中校验参数
于 ၤᡷᡷᡱ᧥ ᣰ ᣰ औऔऔ ᔽᔀ ᔽᔽႿᆍᔽ༁ ᔀʛࣼ ᣰ ቝᔽႿ੫ ᣰ ʛᆍऔႿᆍᑕʛ༁ᣰ ྉᤦᆍᆍᡷ༁ᡷʢᑕᡱɯ设置为 ϟ ԡԡԡ 次ᖔ其余均设置为默认参
୩ᡱᆍႿᡷᑕႿᔀࣼቝᡸ੫ᔀႿᆍቝᔀ ᣰ ྉԻၤᑕႿ੫ ᔀᡷ ᑕᖔ ԡϟऐɯᤥ 数ଫ 利用在线 ጶᆍᔽᔀऔ 软件 ྉ ၤᡷᡷᡱ༁᧥ ᣰ ᣰ ᔀᆍ੫ᔀႿᔽࣼ༁
ϓॹԣ 方法 ᔽႿᆍ ᣰ ᣰ ᔀᆍᔽᔀऔ᥋ ᣰ ᖛᆍ੫ᔽႿ ɯ对进化树进行绘制编辑ᤥ
ϟϟ 甘蔗 ዞટቴዛ᤹ۗ 基因家族的鉴定জ 以拟南芥 ϟऐ 甘蔗 ዞટቴዛ᤹ۗ 基因的表达分析জ 利用割手
શዶᥘ۪ 蛋白序列作为种子序列ᖔ在 ఋାᡷᆍᆍ༁ྉ版本 密的 શዶ᥋༁ᔀी 转录组表达数据进行甘蔗 ዞટቴዛ᤹ۗ
号为 ϟ ԡँᎮϟᖔ ऊၤᔀႿ ᔀᡷ ᑕᖔ ԡԡ ɯ 进行第一次 基因的表达分析ᤥ 割手密的转录组 શዶ᥋༁ᔀी 表达
ାᑕ༁ᡷᡱᖔ在 શऊା᧧ 进行第二次 ାᑕ༁ᡷᡱଫ 结合 ୩ᥘዶఋ 谱下载自割手密基因组数据库ྉ ᓂᔽ ᔀᡷ ᑕᖔ ԡԡɯᤥ
ྉၤᡷᡷᡱ᧥ ᣰ ᣰ ༁ቝᑕʢᡷ ᔀቝᤦ᥋ၤᔀᔽʛᔀᤦʢᔀ੫ ʛᔀ ᣰ ɯ 对候选基因的 筛选得到 ዞટቴዛ᤹ۗ 基因家族成员在不同时期不
氨基 酸 序 列结构域进行鉴定ᖔ 手动剔除不含 同组织中的表达量ྉè۪ᥘ 值ɯᖔ并用 ఋାᡷᆍᆍ༁ 进行
શዶᥘ۪ 保守结构域的序列ᖔ保留下的即为 甘 蔗 聚类ᖔ绘制热图ᤥ
ዞટቴዛ᤹ۗ 基因家族成员ᤥ
ϟ 编码蛋白理化特性জ 利用 ጶ۪ዶ୩ᢃ 在线软件 জ 结果与分析
ྉ ၤᡷᡷᡱ༁᧥ ᣰ ᣰ ࣼ༁ ᔀᡱᑕ༁ᢃ ᆍʢ੫ ᣰ ᡷᆍᆍ༁ᣰ ᡱʢᆍᡷᡱᑕʢᑕቝ ၤᡷቝᣰ ɯ 对
ዞટቴዛ᤹ۗ 基因家族编码蛋白的等电点ܦ分子量ܦ序 ԣॹϓ 甘蔗 ટቴዛ᤹ۗ 蛋白的理化特性
列长度ܦ总平均疏水性ܦ不稳定系数和脂溶指数等 从甘蔗割手密基因组中共鉴定到 ँ 个甘蔗
理化性质进行分析预测ଫ利用 ୩ᔽ੫Ⴟᑕ۪ ࿗ϟྉၤᡷᡷᡱ᧥ ᣰ ᣰ ዞટቴዛ᤹ۗ 基因家族成员ᖔ其一级结构和理化性质如
औऔऔ ዹᤦ༁ ʛᡷࣼ ʛҴ ᣰ ༁ᔀʢᔽዹᔀ༁ᣰ ୩ᔽ੫Ⴟᑕ۪᥋࿗ ϟ ᣰ ɯ 和 ऊጶᓂᓂᨃ 表 ϟ 所示ᤥ 甘蔗 ዞટቴዛ᤹ۗ 基因家族成员的氨基酸
ጢྉၤᡷᡷᡱ᧥ ᣰ ᣰ ዹᔀᆍᔽᔀႿዹᡷࣼᔀʛࣼᡷऔ ᣰ ɯ分别对 ँ 条蛋 总数在 ሕሕ࿗ጲϟ Ꭾ 个之间ᖔ氨基酸长度平均为 ጢᤃሕᖔ
白序列进行信号肽预测和亚细胞定位分析ᤥ 分子量维持在 ጢጢ ԡԡԡ ᧕ᑕ 左右ଫ等电点跨度较大ᖔ在
ϟሕ 蛋白二级结构和跨膜结构的分析 জ 利用 ࿗ᎮᎮጲँ࿗ሕ 之间ଫ家族成员的不稳定系数大部分低
୩ᨃ۪ᥘዶ ྉ ၤᡷᡷᡱ༁᧥ ᣰ ᣰ Ⴟᡱ༁ᑕ᥋ᡱʢᑕᤦᔽ ᔽᤦዹᡱ ʢ ᣰ ዹ੫ᔽ᥋ᤦᔽႿ ᣰ Ⴟᡱ༁ᑕ ᡸ 于 ࿗ԡᠮᖔ只有 Ꭾ 个成员不稳定系数在 ࿗ԡᠮ ጲ ࿗ऐᠮ之
ᑕࣼᡷᆍቝᑕᡷᡱᥳ ᡱᑕ੫ᔀ ᢉ ᣰ શ۪୩ዶ ᣰ Ⴟᡱ༁ᑕ ᡸ ༁ᆍᡱቝᑕ ၤᡷቝɯ 分析 间ଫ家族成员平均亲水系数在 ԡԡϟጢ ጲԡँ࿗ँ 之间ଫँ
શዶᥘ۪ 蛋 白 的二级结构ᖔ 利用 ఋᥘ̀ᥘᥘ ୩ᔀʢᔀʢ 个甘蔗 ୩ዹશዶᥘ۪ 蛋白均无信号肽ᖔ亚细胞定位分
ԡ ྉ ၤᡷᡷᡱ᧥ ᣰ ᣰ औऔऔ ዹᤦ༁ ʛᡷࣼ ʛҴ ᣰ ༁ᔀʢᔽዹᔀ༁ᣰ ఋᥘ̀ᥘᥘ ᣰ ɯ 析表明成员均定位在质膜上ᤥ
分析该蛋白家族的跨膜结构ᤥ ԣॹԣ 蛋白二级结构和跨膜结构分析
ϟ࿗ 甘蔗 ዞટቴዛ᤹ۗ 基因保守基序ܓ结构域及基 甘蔗 શዶᥘ۪ 蛋白二级结构和跨膜结构分析
因结构的分析জ 首先ᖔ利用 ᥘጶᥘጶྉၤᡷᡷᡱ༁᧥ᣰ ᣰ ቝᔀቝᔀ᥋ 如表 所示ᤥ ዞટቴዛ᤹ۗ 基因家族的二级结构主要
༁ࣼᔽᡷᔀ ᆍʢ੫ ᣰ ቝᔀቝᔀ ᣰ ɯ 和 શऊା᧧᥋ऊ᧕᧕ ྉ ၤᡷᡷᡱ༁᧥ᣰ ᣰ औऔऔ 由 ም᥋螺旋ܦ无规则卷曲ܦ延伸链和 Ꮗ᥋转角组成ᖔ其
ႿዹᤦᔽႿቝႿᔽၤ੫ᆍ ᣰ ୩ᡷʢࣼዹᡷࣼʢᔀ ᣰ ዹʛʛ ᣰ औʢᡱ༁ᤦዹ੫ᔽɯ 检测甘蔗 中 ም᥋螺旋比例最高ᖔ为 ሕᤃᎮϟᠮ ጲ ᤃ࿗ሕᠮᖔᏇ᥋转角
ዞટቴዛ᤹ۗ 家族基因中所存在相似度较高的基序 所占比例最小ᖔ为 ϟᤃᠮ ጲ ጢԡᤃᠮଫ蛋白家族的二
ྉቝᆍᡷᔽɯ和保守结构域ྉʛᆍቝᑕᔽႿɯଫ然后ᖔ利用基因组 级结构较为整齐ᖔ 除在 ୩༁ᡱᆍႿ ԡሕ᥈ԡԡ࿗ሕϟԡ᥋ା 和
注释文件ᖔ获得家族成员内含子及外显子分布情 ୩༁ᡱᆍႿԡሕ᥈ԡԡ࿗ሕϟԡ᥋ϟዶ 中所占比例是无规则卷曲ᢦ
况ଫ最后ᖔ利用 ఋାᡷᆍᆍ༁ 软件对其进行可视化分析ᤥ ም᥋螺旋ᢦ延伸链ᢦᏇ᥋转角外ᖔ其余家族成员均为 ም᥋
ϟጢ 甘蔗 ዞટቴዛ᤹ۗ 基因家族顺式作用元件的分 螺旋ᢦ 无规则卷曲 ᢦ 延伸链 ᢦᏇ᥋转角ଫँ 个甘蔗
析জ 提取 ዞટቴዛ᤹ۗ 基因上游 ሕ ԡԡԡ ᤦᡱ 序列作为甘 શዶᥘ۪ 家族成员均有跨膜结构ᖔ其数量为 ᤃጲϟ
蔗 ટቴዛ᤹ۗ 基因的启动子ଫ利用 ۪ᑕႿᡷऊዶጶྉၤᡷᡷᡱ᧥ᣰ ᣰ 个不等ᤥ 这表明甘蔗 શዶᥘ۪ 蛋白为跨膜蛋白ᖔ可
ᤦᔽᆍᔽႿᆍʢቝᑕᡷᔽዹ༁ ᡱ༁ᤦ ࣼ੫ᔀႿᡷ ᤦᔀ ᣰ औᔀᤦᡷᆍᆍ༁ᣰ ᡱᑕႿᡷዹᑕʢᔀ ᣰ 能与其转运重金属离子的功能相适应ᤥ
ၤᡷቝᣰ ɯ对启动子区域顺式作用元件进行分析ᤥ ԣॹᇺ 甘蔗 ዞટቴዛ᤹ۗ 基因保守基序ܓ结构域及基因
ϟᤃ 甘蔗 ዞટቴዛ᤹ۗ 基因的染色体定位 জ 运用 结构分析
ఋାᡷᆍᆍ༁ 软件ᖔ结合甘蔗基因组注释文件和家族成 对甘蔗 ዞટቴዛ᤹ۗ 基因的保守基序ܦ结构域及
员 ᧧᧕ᔽ༁ᡷᖔ将结果可视化ᤥ 基因结构分析如图 ϟ 所示ᤥ 通过对保守基序分析
ϟᎮ 甘蔗 ዞટቴዛ᤹ۗ 家族进化树的构建জ 使用本 发现 ቝᆍᡷᔽ ϟ 基序高度保守ᖔ 在割手密 ँ 个
地软件 ᥘጶ᥈ዶᣮ 完成多序列比对并采用邻接法 શዶዶᥘ۪ 家族成员中均存在ଫ 个别家族成员存在