Page 83 - 《广西植物》2020年第7期
P. 83

7 期                    周丽霞等: 油棕 WRKY 转录因子的全基因组鉴定与分析                                        9 7 9

                                                     tools/ protparam.html)分析 EgWRKY 蛋白的基本性
   1  材料与方法                                          质ꎬ预测结果如表 2 所示ꎮ 95 个 WRKY 蛋白中ꎬ
                                                     56 个蛋白的理论等电点( pI) 小于 7ꎬ39 个蛋白的
   1.1 EgWRKY 序列获取与鉴定                                pI 大于 7ꎬpI 最小值为 4.74( EgWRKY73)ꎬ最大值
       油棕全基因组序列从 NCBI 下载获得ꎬ拟南芥                       为 10.18 ( EgWRKY84 )ꎬ 平 均 pI 为 7.15ꎻ

   WRKY 基因序列从 The Arabidopsis Information Re ̄        EgWRKY25 和 EgWRKY56 蛋白质的不稳 定 系 数
   source(TAIR)数据库中下载获得( http: / / www.ara ̄          小于 40ꎬ为稳定蛋白ꎬ其余 93 个 EgWRKY 蛋白的
   bidopsis.org)ꎬ以拟南芥 WRKY 序列为探针ꎬ阈值                  不稳定系数大于 40ꎬ为不稳定蛋白ꎬ该结果表明

   设定为 e ꎬ在油棕基因组数据库中进行同源序列                           EgWRKY 转录因子家族大多为不稳定蛋白ꎮ 利用
            ̄10
   比对分析得到油棕 WRKY 基因序列ꎬ将得到的油                          NetPhos 3. 1 Server 在 线 软 件 ( http: / / www. cbs.
   棕 WRKY 基因序列在美国麻省理工学院在线基因                          dtu.dk / services/ NetPhos/ ) 预 测 氨 基 酸 序 列 磷 酸
   扫描服务器(The GENSCAN Web Server at MIT) 搜            化ꎻ利用 DictyOGlyc 1. 1 Server 在线软件( http: / /
   索以获得 WRKY 蛋白序列ꎬ通过 NCBI 在线工具                       www.cbs.dtu.dk / services/ DictyOGlyc / ) 预测氨基酸

   CDD( http: / / www. ncbi. nlm. nih. gov / cdd) 和 PFAM  序列的 O ̄糖基化修饰情况ꎬ发现平均磷酸化位点
   数据库(http: / / pfam.xfam.org / )进行蛋白结构域分           有 37.8 个ꎬO ̄糖基化位点有 1.6 个ꎻ利用 ProtScale

   析ꎬ剔除无 WRKY 保守结构域的蛋白序列ꎮ                            在线软件( https: / / web.expasy.org / protscale / ) 分析
   1.2 方法                                            蛋白质的亲 / 疏水性ꎬ从 EgWRKY 蛋白的脂肪系数
   1. 2. 1 EgWRKY 蛋 白 理 化 性 质 分 析           利 用      来看ꎬ该 95 个 EgWRKY 蛋白的脂肪系数均小于
   ProtParam 分析 EgWRKY 蛋 白 的 理 化 性 质ꎬ 利 用            100ꎬ该结果表明其均为亲水性蛋白ꎻ利用 SignalP
   NetPhos 3.1 Server 和 DictyOGlyc 1.1 Server 预测氨    5.0 在线软件( http: / / www.cbs.dtu.dk / services/ Sig ̄
   基酸 序 列 磷 酸 化 及 O ̄糖 基 化 修 饰 情 况ꎬ 利 用               nalP / )预测蛋白的信号肽ꎬ发现 5 个 EgWRKY 蛋
   ProtScale 分析蛋白质的亲 / 疏水性ꎬ利用 SignalP 和              白 存 在 信 号 肽 ( EgWRKY29、 EgWRKY38、

   ProtComp 预测蛋白的信号肽和亚细胞定位预测ꎬ                        EgWRKY45、EgWRKY63 及 EgWRKY87)ꎬ 为 分 泌
   应用 SOPMA 预测蛋白的二级结构ꎮ                               蛋白ꎻ 利 用 ProtComp 9. 0 ( http: / / linux1. softberry.
   1.2.2 EgWRKY 的进化树、外显子及内含子分析                       com / berry. phtml? topic = protcomppl&group =
   应用 MEGA 6.06 软件构建 EgWRKY 进化树ꎬ执行                   programs&subgroup = proloc) 在线软件预测蛋白亚

   参数为 Neighbor ̄JoiningꎬBootstrap 重复 1 000 次ꎮ        细胞定位ꎬ结果表明 95 个 EgWRKY 蛋白中有 84
                                                     个定位在细胞核中ꎬ占总蛋白的 88.3%ꎬ11 个在细
   2  结果与分析                                          胞质中ꎬ推测可能参与细胞质基因的转录调控ꎻ应
                                                     用 SOPMA 在 线 软 件 ( https: / / npsa ̄prabi. ibcp. fr /
   2.1 EgWRKY 转录因子家族成员基本信息                           cgi ̄bin / np sa_automat.pl? page = npsa_sopma.html)
       基于油棕全基因组数据及拟南芥 WRKY 基因                        预测蛋白的二级结构ꎬ发现所有 EgWRKY 蛋白的
   序列ꎬ通过 BLAST 搜索同源序列和 WRKY 蛋白保                      二级结构均有 4 种ꎬ即 α ̄螺旋、β ̄转角、无规卷曲
   守结构域鉴定ꎬ共挖掘 95 个油棕 WRKY 转录因子                       及延伸链ꎬ其中 60 个 EgWRKY 蛋白以 α ̄螺旋为主

   成员ꎮ 由表 1 可知ꎬ该 95 个蛋白质所含氨基酸大                       要结构ꎬ无规卷曲为次要结构ꎬ35 个以无规卷曲为
   小为 116 ~ 1 303 bpꎬ其中蛋白氨基酸数目小于 300                 主要结构ꎬα ̄螺旋为次要结构ꎬβ ̄转角及延伸链所
   aa 的基因序列占 35.8%ꎬ介于 300 ~ 700 aa 的基因               占比例较少ꎮ
   序列占 57.9%ꎬ大于 700 aa 的基因序列占 6.3%ꎮ                  2.3 EgWRKY 的进化树分析
   2.2 EgWRKY 蛋白理化性质分析                                   利用 MEGA 6.06 对油棕 95 个 WRKY 转录因
       利用 ProtParam 在线软件( http: / / expasy. org /    子蛋白的保守结构域进行系统进化树分析ꎬ 结果如
   78   79   80   81   82   83   84   85   86   87   88