Page 83 - 《广西植物》2020年第7期
P. 83
7 期 周丽霞等: 油棕 WRKY 转录因子的全基因组鉴定与分析 9 7 9
tools/ protparam.html)分析 EgWRKY 蛋白的基本性
1 材料与方法 质ꎬ预测结果如表 2 所示ꎮ 95 个 WRKY 蛋白中ꎬ
56 个蛋白的理论等电点( pI) 小于 7ꎬ39 个蛋白的
1.1 EgWRKY 序列获取与鉴定 pI 大于 7ꎬpI 最小值为 4.74( EgWRKY73)ꎬ最大值
油棕全基因组序列从 NCBI 下载获得ꎬ拟南芥 为 10.18 ( EgWRKY84 )ꎬ 平 均 pI 为 7.15ꎻ
WRKY 基因序列从 The Arabidopsis Information Re ̄ EgWRKY25 和 EgWRKY56 蛋白质的不稳 定 系 数
source(TAIR)数据库中下载获得( http: / / www.ara ̄ 小于 40ꎬ为稳定蛋白ꎬ其余 93 个 EgWRKY 蛋白的
bidopsis.org)ꎬ以拟南芥 WRKY 序列为探针ꎬ阈值 不稳定系数大于 40ꎬ为不稳定蛋白ꎬ该结果表明
设定为 e ꎬ在油棕基因组数据库中进行同源序列 EgWRKY 转录因子家族大多为不稳定蛋白ꎮ 利用
 ̄10
比对分析得到油棕 WRKY 基因序列ꎬ将得到的油 NetPhos 3. 1 Server 在 线 软 件 ( http: / / www. cbs.
棕 WRKY 基因序列在美国麻省理工学院在线基因 dtu.dk / services/ NetPhos/ ) 预 测 氨 基 酸 序 列 磷 酸
扫描服务器(The GENSCAN Web Server at MIT) 搜 化ꎻ利用 DictyOGlyc 1. 1 Server 在线软件( http: / /
索以获得 WRKY 蛋白序列ꎬ通过 NCBI 在线工具 www.cbs.dtu.dk / services/ DictyOGlyc / ) 预测氨基酸
CDD( http: / / www. ncbi. nlm. nih. gov / cdd) 和 PFAM 序列的 O ̄糖基化修饰情况ꎬ发现平均磷酸化位点
数据库(http: / / pfam.xfam.org / )进行蛋白结构域分 有 37.8 个ꎬO ̄糖基化位点有 1.6 个ꎻ利用 ProtScale
析ꎬ剔除无 WRKY 保守结构域的蛋白序列ꎮ 在线软件( https: / / web.expasy.org / protscale / ) 分析
1.2 方法 蛋白质的亲 / 疏水性ꎬ从 EgWRKY 蛋白的脂肪系数
1. 2. 1 EgWRKY 蛋 白 理 化 性 质 分 析 利 用 来看ꎬ该 95 个 EgWRKY 蛋白的脂肪系数均小于
ProtParam 分析 EgWRKY 蛋 白 的 理 化 性 质ꎬ 利 用 100ꎬ该结果表明其均为亲水性蛋白ꎻ利用 SignalP
NetPhos 3.1 Server 和 DictyOGlyc 1.1 Server 预测氨 5.0 在线软件( http: / / www.cbs.dtu.dk / services/ Sig ̄
基酸 序 列 磷 酸 化 及 O ̄糖 基 化 修 饰 情 况ꎬ 利 用 nalP / )预测蛋白的信号肽ꎬ发现 5 个 EgWRKY 蛋
ProtScale 分析蛋白质的亲 / 疏水性ꎬ利用 SignalP 和 白 存 在 信 号 肽 ( EgWRKY29、 EgWRKY38、
ProtComp 预测蛋白的信号肽和亚细胞定位预测ꎬ EgWRKY45、EgWRKY63 及 EgWRKY87)ꎬ 为 分 泌
应用 SOPMA 预测蛋白的二级结构ꎮ 蛋白ꎻ 利 用 ProtComp 9. 0 ( http: / / linux1. softberry.
1.2.2 EgWRKY 的进化树、外显子及内含子分析 com / berry. phtml? topic = protcomppl&group =
应用 MEGA 6.06 软件构建 EgWRKY 进化树ꎬ执行 programs&subgroup = proloc) 在线软件预测蛋白亚
参数为 Neighbor ̄JoiningꎬBootstrap 重复 1 000 次ꎮ 细胞定位ꎬ结果表明 95 个 EgWRKY 蛋白中有 84
个定位在细胞核中ꎬ占总蛋白的 88.3%ꎬ11 个在细
2 结果与分析 胞质中ꎬ推测可能参与细胞质基因的转录调控ꎻ应
用 SOPMA 在 线 软 件 ( https: / / npsa ̄prabi. ibcp. fr /
2.1 EgWRKY 转录因子家族成员基本信息 cgi ̄bin / np sa_automat.pl? page = npsa_sopma.html)
基于油棕全基因组数据及拟南芥 WRKY 基因 预测蛋白的二级结构ꎬ发现所有 EgWRKY 蛋白的
序列ꎬ通过 BLAST 搜索同源序列和 WRKY 蛋白保 二级结构均有 4 种ꎬ即 α ̄螺旋、β ̄转角、无规卷曲
守结构域鉴定ꎬ共挖掘 95 个油棕 WRKY 转录因子 及延伸链ꎬ其中 60 个 EgWRKY 蛋白以 α ̄螺旋为主
成员ꎮ 由表 1 可知ꎬ该 95 个蛋白质所含氨基酸大 要结构ꎬ无规卷曲为次要结构ꎬ35 个以无规卷曲为
小为 116 ~ 1 303 bpꎬ其中蛋白氨基酸数目小于 300 主要结构ꎬα ̄螺旋为次要结构ꎬβ ̄转角及延伸链所
aa 的基因序列占 35.8%ꎬ介于 300 ~ 700 aa 的基因 占比例较少ꎮ
序列占 57.9%ꎬ大于 700 aa 的基因序列占 6.3%ꎮ 2.3 EgWRKY 的进化树分析
2.2 EgWRKY 蛋白理化性质分析 利用 MEGA 6.06 对油棕 95 个 WRKY 转录因
利用 ProtParam 在线软件( http: / / expasy. org / 子蛋白的保守结构域进行系统进化树分析ꎬ 结果如