Page 31 - 《广西植物》2025年第4期
P. 31

4 期                      徐梦阳等: 南酸枣转录组特征分析及 SSR 标记开发                                         6 4 5

                                            表 2  南酸枣转录组测序质量和数量
                               Table 2  Statistical data of the transcriptome of Choerospondias axillaris

               样品名称          原始数据             有效数据            有效序列
                                                                           Q20 (%)      Q30 (%)     GC (%)
              Sample name   Raw data (G)    Clean data (G)   Clean reads
               Female ̄1        6.67             6.63         44 329 038     97.42        92.63       42.81
               Female ̄2        6.27             6.23         41 676 510     96.64        90.97       42.63
               Female ̄3        6.03             6.01         40 128 104     97.28        92.15       42.64
                Male ̄1         5.53             5.50         36 771 300     97.30        92.28       42.98
                Male ̄2         5.50             5.47         36 540 830     96.90        91.52       42.90
                Male ̄3         5.60             5.56         37 214 014     96.79        91.28       42.88


            度为 201 ~ 500 bp 的占 38.38%ꎬ有15 482条ꎻ长度              基因ꎬ其中上调基因和下调基因分别有 1 052 个和
            为 501 ~ 1 000 bp 的占20.75%ꎬ有 8 371 条ꎻ长度为            897 个(图 1)ꎮ
            1 001 ~ 2 000 bp 的占17.62%ꎬ有 7 109 条ꎻ长度大            2.3 转录组 SSR 数量与分布

            于 2 000 bp 的占 23.25%ꎬ有 9 379 条ꎮ                        使 用 MISA 软 件 对 南 酸 枣 的 40 341 条
                 将组装后的 Unigenes 作为参考ꎬ统计每个样                     Unigenes 序列进行检索后ꎬ共检测到 5 251 个 SSR
            本中基因检测的情况( 表 3)ꎮ 6 个雌雄样品中共                         位点ꎮ 这些 SSR 位点分布在 4 511 条 Unigenes 序
            检测到 40 341 个基因ꎬ其中雌株可以比对总基因                         列上ꎬSSR 的出现频率( 检测到的 SSR 位点总数与
                                                               Unigenes 序列总数之比) 为 13.02%ꎬ发生频率( 含
            的比例在 72%以上ꎬ而雄株的比例只占 70%左右ꎮ
                                                               SSR 位 点 的 Unigenes 数 与 Unigenes 序 列 总 数 之
                     表 3  南酸枣雌雄样品基因数量                          比)为 11.18%ꎮ 在这些 Unigenes 序列中ꎬ含有单
                  Table 3  Gene number of male and female      个 SSR 位点的有3 892条ꎬ含有 2 个及以上 SSR 位
                     samples of Choerospondias axillaris       点的有 619 条ꎬ含有复合 SSR 位点的有 386 条ꎮ
                                                               此外ꎬ有 18 条 Unigenes 序列中复合 SSR 位置出现
                                           测序总基因
                    样品名称
                                        Sequenced total genes  重叠(表 4)ꎮ
                   Sample name
                                       (占比 Proportion:%)
                                                                   由表 5 可知ꎬ除单核苷酸重复外ꎬ二核苷酸重复
                                                               类型最为常见ꎬ占 SSR 位点总数的 42.93%ꎬ平均分
                     Female ̄1            30 402 (75.36%)
                                                               布距离为 23.43 kbꎻ其次是三核苷酸和四核苷酸重
                     Female ̄2            30 256 (75.00%)
                                                               复类型ꎬ分别占 31.06%和 11.52%ꎬ平均分布距离分
                     Female ̄3            29 167 (72.30%)
                                                               别占 32.38 kb 和 87.28 kbꎻ五核苷酸和六核苷酸重
                     Male ̄1              28 353 (70.28%)
                                                               复类型占比较小ꎬ分别为 3.52%和3.28%ꎬ平均分布
                     Male ̄2              28 531 (70.72%)
                                                               距离分别为 285.44 kb 和 307.01 kbꎮ 各种核苷酸重
                     Male ̄3              28 531 (70.72%)       复类型的平均分布距离存在较大差异ꎮ
                                                                   在 Unigenes 序列中ꎬ二核苷酸重复出现频率
                     全部 All             40 341 (100.00%)
                                                               最高ꎬ 达 到 5. 59%ꎬ 其 次 是 三 核 苷 酸 重 复ꎬ 为
                                                               4.04%ꎻ四核苷酸、五核苷和六核苷酸重复类型的
            2.2 差异基因表达分析                                       出现频率较低ꎬ分别为 1.50%、0.46%和 0.43%ꎻ复
                 采用以 log (FPKM + 1)值为基础的聚类分析
                          10                                   合型核苷酸和位置有重叠的复合型核苷酸重复的
            方法ꎬ利用转录组测序结果进行表达量分析ꎮ 将 6                           占比(7.35%、0.34%)与出现频率(0.96%、0.04%)
            个样 品 按 雌 雄 分 为 两 组ꎬ 以 错 误 发 现 率 P 值                均较低(表 5)ꎮ
            (P value) < 0. 05 和 差 异 倍 数 的 对 数 的 绝 对 值              SSR 位点序列长度总长为 117 134.87 bpꎬ其中
             | log FoldChange | >1 为筛选标准在南酸枣雌株和                二核苷酸重复类型的 SSR 长度最长ꎬ为41 248.20
                2
            雄株叶片组间对比ꎬ最终筛选到 1 949 个差异表达                         bpꎬ其次是三核苷酸重复类型(29 472.17 bp)ꎬ四核
   26   27   28   29   30   31   32   33   34   35   36