Page 57 - 《广西植物》2020年第9期
P. 57

1 2 7 2                               广  西  植  物                                         40 卷

                                         表 3  SNP 位点统计表
                                        Table 3  SNP loci statistics

                                    基因区          基因间区        转换型 SNP      颠换型 SNP       杂合型 SNP
        样品           SNP 数目
                                  SNP 位点数        SNP 位点数     Transition SNP  Transversion SNP  Heterozygosity SNP
        Sample      SNP number
                                   Genic SNP    Intergenic SNP  (%)         (%)            (%)
      叶 1 Leaf 1     540 707        428 327       112 380      66.07        33.93         51.38
      叶 2 Leaf 2     541 852        413 786       128 066      66.25        33.75         34.86
      叶 3 Leaf 3     583 002        448 343       134 659      66.33        33.67         45.95
      茎 1 Stem 1     489 642        393 947       95 695       65.46        34.54         49.63
      茎 2 Stem 2     504 670        394 472       110 198      65.89        34.11         35.85
      茎 3 Stem 3     638 706        496 194       142 512      65.90        34.10         50.79
      根 1 Root 1     521 166        409 410       111 756      65.74        34.26         50.91

      根 2 Root 2     523 515        396 706       126 809      66.22        33.78         34.70
      根 3 Root 3     582 747        447 260       135 487      66.14        33.86         48.58


                                           表 4  优化的基因
                                     Table 4  Gene structure optimized
                                                                原来注释的第一个            优化后第一个或
                                                       优化位置     或最后一个外显子            最后一个外显子
         基因 ID                基因座              正负链
                                                       Optimized    起止坐标              起止坐标
         Gene ID               Locus            Strand
                                                         site     Original first or  Optimized first or
                                                                 termination region  termination region
     TEA004484.1_gene  Scaffold1014:163897-231030  +      5′      205536-205536     163897-205536
     TEA000973.1_gene  Scaffold1019:1350887-1371675  +    3′     1371277-1371277   1371277-1371675
     TEA016708.1_gene  Scaffold1045:1434954-1455906  +    5′     1435240-1435240   1434954-1435240
     TEA004051.1_gene  Scaffold1054:303905-308542  +      3′      308318-308318     308318-308542
     TEA000171.1_gene  Scaffold1058:112241-129629  -      5′      129534-129534     129534-129629
     TEA007140.1_gene  Scaffold1067:122675-156025  -      3′      123878-123878     122675-123878
     TEA020092.1_gene  Scaffold1093:635489-640729  +      3′      640607-640607     640607-640729
     TEA020094.1_gene  Scaffold1093:532337-549457  -      5′      549397-549397     549397-549457

     TEA020098.1_gene  Scaffold1093:1162317-1191258  -    3′     1162515-1162515   1162317-1162515
     TEA001055.1_gene  Scaffold1099:848040-870252  -      3′      848142-848142     848040-848142


   2.2 转录组与中国种茶树基因组比对                                al.ꎬ 2010)软件对 Hisat2 比对结果中的 SNP 位点

   2.2.1 比对效率  本研究利用 Hisat2( Kim et al.ꎬ             和 InDel 进行识别ꎬ进而分析基因表达水平和基因
   2015)对测 序 数 据 与 中 国 种 茶 树 基 因 组 ( Wei et          功能ꎬSNP 分析表明基因区 SNP 位点数多于基因
   al.ꎬ 2018) 进行比对ꎬ利用 StringTie( Pertea et al.ꎬ      间区ꎬ转换型 SNP 多于颠换型 SNP( 表 3)ꎮ InDel
   2015)对比对上的 Reads 进行组装和定量ꎬ比对到                      主要存在于内含子区和基因间区(图 1)ꎮ
   参考基因组上的 Reads 占 Clean Reads 的百分比为                 2.2.3 可 变 剪 接 预 测   基 因 通 过 转 录 生 成 前 体
                                                     mRNAꎬ再 经 过 不 同 的 剪 接ꎬ 产 生 不 同 的 成 熟
   87.83% ~ 91.14%(表 2)ꎮ
   2.2. 2 SNP / InDel 分 析   利 用 GATK ( Mckenna et    mRNAꎬ翻译为不同的蛋白质ꎮ 利用 Asprofil(Florea
   52   53   54   55   56   57   58   59   60   61   62