Page 100 - 《广西植物》2020年第4期
P. 100

5 3 8                                 广  西  植  物                                         40 卷
   等ꎬ2008ꎻ阮君山ꎬ2002)ꎮ 目前ꎬ对阴地蕨的研究                      1.3 De novo(从头) 组装
   较少ꎬ主要集中在化学成分、临床及药理作用、分                                将测序得到的原始序列( raw reads) 去除低质
   类及分布调查等方面ꎬ分子生物学相关的信息较                             量、接头污染以及未知碱基 N 含量过高的序列得

   少ꎬ限制了更深入的研究ꎮ 转录组( transcriptome)                  到干 净 序 列 ( clean reads )ꎬ 使 用 Trinity 软 件
   是指某一生理条件下ꎬ细胞内所有转录产物的集                             (v2.0.6) ( Grabherr et al.ꎬ2011 ) 对 clean reads 进

   合ꎬ包括信使 RNA(mRNA)、核糖体 RNA( rRNA)、                  行 De novo 组装ꎬ 使用 Tgicl 软件( v2.0.6) ( Pertea
   转运 RNA ( tRNA) 及 非 编 码 RNA ( none coding          et al.ꎬ 2003)将组装的转录本进行聚类去冗余ꎬ得
   RNA)ꎮ 随着测序技术的发展和普及ꎬ转录组测序                          到单一基因(Unigene)用于后续分析ꎮ
   (RNA ̄seq)已经成为从分子水平研究生物基因及                         1.4 Unigene 功能注释及分析
   其调控的重要方法ꎮ 本研究通过高通量测序获得                                为了解 Unigene 的 功 能ꎬ用 生 信 分 析 软 件 将
   阴地蕨全转录组ꎬ通过生物信息学方法对其进行                             Unigene 在七大功能数据库中进行注释:用 Blast

   分析ꎬ得到阴地蕨转录组的整体注释信息、筛选出                            (v2. 2. 23 ) 进 行 NT、 NR、 COG、 KEGG 注 释ꎻ 用
   植物激素信号转导相关的潜在基因及其单核苷酸                             SwissProt 注 释ꎻ 用 Blast2GO ( v2. 5. 0) ( Conesa et
   多态性( single nucleotide polymorphismꎬ SNP) 和短      al.ꎬ 2005) 以及 NR 注释结果进行 GO 注释ꎻ用 In ̄
   序 列 重 复 多 态 性 ( short sequence repeat polymor ̄    terProScan5 (v5.11-51.0) (Quevillon et al.ꎬ 2005)
   phismꎬ SSR)等信息ꎬ为进一步从分子水平开展阴                       进 行 InterPro 注 释ꎮ 根 据 KEGG 信 号 途 径
   地蕨生 长 发 育、 品 种 鉴 定 等 研 究 提 供 了 有 用 的              map04075ꎬ将经注释的相关基因进行归类ꎬ即得植

   资源ꎮ                                               物激素信号转导相关基因ꎮ
                                                     1.5 转录组结构分析
   1  材料与方法                                          1.5.1 编码序列( coding sequencesꎬCDS) 预测  根

                                                     据功能注释结果ꎬ按照 NR、SwissProt、KEGG、COG
   1.1 材料                                            的数据库优先顺序ꎬ挑选 Unigene 的最佳比对片段

       新鲜、成熟阴地蕨植物全株 3 株(包含根、茎、                       作为该 Unigene 的 CDS ꎮ 未能注释上的 Unigene
   叶及孢子ꎬ于 2016 年 7 月采于贵州省黔南州都匀                       使用预测得到的 CDS 作为模型进行建模ꎬ然后使
   市郊斗篷山地区(107°20′—107°27′ E、26°12′—                 用 ESTScan (v3.0.2) (Iseli et al.ꎬ 1999)进行 CDS
   26°16′ Nꎬ海拔约 1 500 m)ꎬ经黔南医学高等专科                   预测ꎮ
   学校王传明副教授鉴定为阴地蕨( Botrychium ter ̄                   1.5.2 转录因子(transcript factorꎬTF)编码能力预测
   natum)ꎮ 样品采集后ꎬ立即用清水冲洗干净ꎬ吸水                          首先ꎬ用 getorf( EMBOSS:6.5.7.0) ( Rice et al.ꎬ

   纸吸干后放入干冰盒中带回ꎬ以备提取 RNAꎮ                            2000) 检 测 Unigene 的 开 放 阅 读 框 ( open reading
   1.2 cDNA 文库制备及测序                                  frameꎬORF)ꎻ然后ꎬ使用 hmmsearch( v3.0) ( Mistry
       将植物全株用液氮研磨成粉末ꎬ用 RNA 提取                        et al.ꎬ 2013) 将 ORF 比对到转录因子蛋白结构域
   试剂盒(艾德莱公司ꎬ北京)提取总 RNA 并将 DNA                       (数据来源于 PlantTFDB)ꎻ最 后ꎬ根 据 PlantTFDB
   消化ꎬ用带有寡聚脱氧胸腺嘧啶( Oligo dT) 的磁珠                     描述的转录因子家族特征对 Unigene 进行 TF 编码
   富集 mRNAꎬ 经 琼 脂 糖 电 泳 及 微 量 核 酸 检 测 仪              能力鉴定(Jin et al.ꎬ 2017)ꎮ
   NanoDrop 检测合格后用试剂盒依次合成 cDNA、纯                     1.5. 3 SSR 和 SNP 检 测   首 先ꎬ用 MISA ( v1. 0)

   化、修复粘性末端、在 3′末端加上碱基“ A” 并连接                       (Thiel et al.ꎬ 2003) 对 Unigene 进行 SSR 检测ꎻ然
   接头ꎬ然后进行片段大小选择ꎬ最后进行 PCR 扩                          后ꎬ用 HISAT( v0.1.6 ̄beta) ( Kim et al.ꎬ 2015) 把
   增构建 cDNA 文库ꎻ构建好的文库经检验合格后上                         clean reads 比 对 到 Unigeneꎻ 最 后ꎬ 使 用 GATK
   Illumina HiSeq 2500 平台进行测序ꎮ                       (v3.4 ̄0)(McKenna et al.ꎬ 2010) 检测 SNPꎮ
   95   96   97   98   99   100   101   102   103   104   105