Page 101 - 《广西植物》2020年第4期
P. 101
4 期 张林甦等: 阴地蕨全转录组分析及植物激素信号转导相关基因筛选 5 3 9
80.6%ꎬ测序深度属“深度”(high deepꎬ>15 Mb) 测
2 结果与分析 序ꎮ 得到 干 净 总 碱 基 数 6. 67 Gb ꎬ 组 装 后 得 到
58 646 个 Unigeneꎬ平均 长 度 1 023 bpꎬN50、N70
2.1 测序及组装结果 均大于 1 000 bp (表 1) ꎮ 所有 Unigene 的长度均
使用 Illumina Hiseq 平台一共测得总原始序列 大于 300 bpꎬ 分 布 在 300 ~ 400 bp 的 最 多ꎬ 占
(raw reads) 数据量为 55.52 Mbꎬ过滤后得到干净 25.5%ꎬ大于 1 000 bp 的累计占 39%( 图 1)ꎬ说明
序列(clean reads)44.45 Mbꎬ clean reads 比率达到 测序连续性和组装效果较好ꎮ
表 1 Unigene 的质量指标
Table 1 Quality metrics of Unigene assemble
样本 总数 平均长度
N50 N70 N90 GC (%)
Sample Total number Mean length
阴地蕨 Botrychium ternatum 58 646 1 023 1 762 1 102 399 44.64
注: N50. 按 Unigene 长度从大到小排序后逐个累加至所有 Unigeneꎬ总长度的 50%时ꎬ最后一个累加的数值大小即为 N50ꎻ N70、
N90 以此类推ꎮ GC(%). 碱基 G 和 C 的比例ꎮ
Note: N50. A weighted median statistic that 50% of the total length is contained in Unigenes great than or equal to this value. The same of
N70 and N90. GC(%). Percentage of G and C bases in all Unigenes.
图 1 阴地蕨单一基因的长度分布
Fig. 1 Length distribution of Botrychium ternatum Unigene
表 2 阴地蕨单一基因功能注释结果统计
Table 2 Statistic of function annotation of Botrychium ternatum Unigene
项目 总 Unigene NR 注释 NT 注释 Swissprot 注释 KEGG 注释 COG 注释 Interpro GO 注释 总体注释
注释
Total NR NT Swissprot KEGG COG GO Overall
Item Interpro
Unigene annotation annotation annotation annotation annotation annotation annotation
annotation
数目 Number 58 646 38 352 23 391 27 049 29 241 16 678 30 375 15 905 40 610
占比 Percentage 100 65.40 39.89 46.12 49.86 28.44 51.79 27.12 69.25
注: 总体注释为被七大数据库中任意一个数据库注释上的 Unigene 总数ꎮ
Note: Overall annotation is the total Unigene which is annotated by either of the seven databases.