Page 100 - 《广西植物》2020年第4期
P. 100
5 3 8 广 西 植 物 40 卷
等ꎬ2008ꎻ阮君山ꎬ2002)ꎮ 目前ꎬ对阴地蕨的研究 1.3 De novo(从头) 组装
较少ꎬ主要集中在化学成分、临床及药理作用、分 将测序得到的原始序列( raw reads) 去除低质
类及分布调查等方面ꎬ分子生物学相关的信息较 量、接头污染以及未知碱基 N 含量过高的序列得
少ꎬ限制了更深入的研究ꎮ 转录组( transcriptome) 到干 净 序 列 ( clean reads )ꎬ 使 用 Trinity 软 件
是指某一生理条件下ꎬ细胞内所有转录产物的集 (v2.0.6) ( Grabherr et al.ꎬ2011 ) 对 clean reads 进
合ꎬ包括信使 RNA(mRNA)、核糖体 RNA( rRNA)、 行 De novo 组装ꎬ 使用 Tgicl 软件( v2.0.6) ( Pertea
转运 RNA ( tRNA) 及 非 编 码 RNA ( none coding et al.ꎬ 2003)将组装的转录本进行聚类去冗余ꎬ得
RNA)ꎮ 随着测序技术的发展和普及ꎬ转录组测序 到单一基因(Unigene)用于后续分析ꎮ
(RNA ̄seq)已经成为从分子水平研究生物基因及 1.4 Unigene 功能注释及分析
其调控的重要方法ꎮ 本研究通过高通量测序获得 为了解 Unigene 的 功 能ꎬ用 生 信 分 析 软 件 将
阴地蕨全转录组ꎬ通过生物信息学方法对其进行 Unigene 在七大功能数据库中进行注释:用 Blast
分析ꎬ得到阴地蕨转录组的整体注释信息、筛选出 (v2. 2. 23 ) 进 行 NT、 NR、 COG、 KEGG 注 释ꎻ 用
植物激素信号转导相关的潜在基因及其单核苷酸 SwissProt 注 释ꎻ 用 Blast2GO ( v2. 5. 0) ( Conesa et
多态性( single nucleotide polymorphismꎬ SNP) 和短 al.ꎬ 2005) 以及 NR 注释结果进行 GO 注释ꎻ用 In ̄
序 列 重 复 多 态 性 ( short sequence repeat polymor ̄ terProScan5 (v5.11-51.0) (Quevillon et al.ꎬ 2005)
phismꎬ SSR)等信息ꎬ为进一步从分子水平开展阴 进 行 InterPro 注 释ꎮ 根 据 KEGG 信 号 途 径
地蕨生 长 发 育、 品 种 鉴 定 等 研 究 提 供 了 有 用 的 map04075ꎬ将经注释的相关基因进行归类ꎬ即得植
资源ꎮ 物激素信号转导相关基因ꎮ
1.5 转录组结构分析
1 材料与方法 1.5.1 编码序列( coding sequencesꎬCDS) 预测 根
据功能注释结果ꎬ按照 NR、SwissProt、KEGG、COG
1.1 材料 的数据库优先顺序ꎬ挑选 Unigene 的最佳比对片段
新鲜、成熟阴地蕨植物全株 3 株(包含根、茎、 作为该 Unigene 的 CDS ꎮ 未能注释上的 Unigene
叶及孢子ꎬ于 2016 年 7 月采于贵州省黔南州都匀 使用预测得到的 CDS 作为模型进行建模ꎬ然后使
市郊斗篷山地区(107°20′—107°27′ E、26°12′— 用 ESTScan (v3.0.2) (Iseli et al.ꎬ 1999)进行 CDS
26°16′ Nꎬ海拔约 1 500 m)ꎬ经黔南医学高等专科 预测ꎮ
学校王传明副教授鉴定为阴地蕨( Botrychium ter ̄ 1.5.2 转录因子(transcript factorꎬTF)编码能力预测
natum)ꎮ 样品采集后ꎬ立即用清水冲洗干净ꎬ吸水 首先ꎬ用 getorf( EMBOSS:6.5.7.0) ( Rice et al.ꎬ
纸吸干后放入干冰盒中带回ꎬ以备提取 RNAꎮ 2000) 检 测 Unigene 的 开 放 阅 读 框 ( open reading
1.2 cDNA 文库制备及测序 frameꎬORF)ꎻ然后ꎬ使用 hmmsearch( v3.0) ( Mistry
将植物全株用液氮研磨成粉末ꎬ用 RNA 提取 et al.ꎬ 2013) 将 ORF 比对到转录因子蛋白结构域
试剂盒(艾德莱公司ꎬ北京)提取总 RNA 并将 DNA (数据来源于 PlantTFDB)ꎻ最 后ꎬ根 据 PlantTFDB
消化ꎬ用带有寡聚脱氧胸腺嘧啶( Oligo dT) 的磁珠 描述的转录因子家族特征对 Unigene 进行 TF 编码
富集 mRNAꎬ 经 琼 脂 糖 电 泳 及 微 量 核 酸 检 测 仪 能力鉴定(Jin et al.ꎬ 2017)ꎮ
NanoDrop 检测合格后用试剂盒依次合成 cDNA、纯 1.5. 3 SSR 和 SNP 检 测 首 先ꎬ用 MISA ( v1. 0)
化、修复粘性末端、在 3′末端加上碱基“ A” 并连接 (Thiel et al.ꎬ 2003) 对 Unigene 进行 SSR 检测ꎻ然
接头ꎬ然后进行片段大小选择ꎬ最后进行 PCR 扩 后ꎬ用 HISAT( v0.1.6 ̄beta) ( Kim et al.ꎬ 2015) 把
增构建 cDNA 文库ꎻ构建好的文库经检验合格后上 clean reads 比 对 到 Unigeneꎻ 最 后ꎬ 使 用 GATK
Illumina HiSeq 2500 平台进行测序ꎮ (v3.4 ̄0)(McKenna et al.ꎬ 2010) 检测 SNPꎮ