Page 119 - 《广西植物》2025年第4期
P. 119

4 期                 李金梅等: 基于 SLAF ̄seq 的广西八角种质资源遗传多样性分析                                      7 3 3

                                           表 1  53 份八角地方居群样本基本信息
                                     Table 1  Basic information of 53 Illicium verum accessions
                  样本编号              采集地或引种地                分组                 经纬度                  样本数
                Sample number   Collection or introduction place  Group  Longitude and latitude  Number of samples
                  QZPB1-7                PB                 GS         109°37′98″ E、 22°18′27″ N     7

                  FCG1-10                FCG                GS         102°28′74″ E、 21°68′10″ N     10
                  NNSL1-8                SL                GM          108°60′84″ E、 23°43′71″ N     8
                  HCFS1-8                FS                GW          107°03′04″ E、 24°53′80″ N     8
                   BS1-8                 BS                GW          105°84′84″ E、 23°26′72″ N     8
                   GL1-6                 GL                GN          110°28′14″ E、 25°07′74″ N     6
                 WZTX1-6                 TX                 GE         110°89′59″ E、 23°68′22″ N     6



            GATK 软件进行局部重比对ꎮ 为确保变异检测结                           的测序数据测序质量高ꎬ测序结果可靠ꎬ满足后续
            果准确ꎬ使用 samtools 和 GATK 进行检测ꎬ获取一                    分析需要ꎮ
            致性 SNP 位点(完整性>0.8 和 MAF>0.05)进行后                   2.2 SLAF 标签和 SNP 统计

            续分析ꎮ                                                   通过生物信息学分析ꎬ从 95 份八角种质资源
            1.5 数据分析                                           中获得了 643 690 个 SLAF 标签( 平均测序深度为
                 通过数据挖掘和 SNP 检出后ꎬ将 SNPs 信息用                    9.71X)ꎬ其中有 74 434 个为多态性 SLAF 标签ꎬ产
            于遗传进化分析ꎮ 使用 MEGA X 软件和邻接算法                         生了 2 690 564 个群体 SNPꎮ 这些 SNP 的完整度

            (Kimura 2 ̄parameter 模型ꎬ1 000 次 bootstrap 重复)       最高为 47. 67%ꎬ最 低 为 14. 33%ꎬ 平 均 完 整 度 为
            构建系统发育树ꎮ 基于最大似然法和 K 值范围为                           29.35%ꎻ杂合率最高为 7.78%ꎬ最低为 2.06%ꎬ平
            1 ~ 10ꎬ使用 Admixture 软件进行群体结构分析ꎬ并                   均杂合率为 4.46%( 表 2)ꎮ 为研究不同八角种质
            分析 K 值 的 交 叉 验 证 误 差 率ꎮ 使 用 聚 类 软 件                间遗传关系ꎬ基于上述群体 SNP 结果ꎬ筛选出了
            EIGENSOFT 对 95 份 八 角 材 料 进 行 主 成 分 分 析             229 017 个高质量 SNP 标记ꎮ
            (principal component analysisꎬPCA)ꎮ 遗传多样性          2.3 主成分分析和系统发育分析
            分析根据每个居群的 SNP 信息ꎬ利用百迈客生物                               为明确广西不同地区八角居群样本以及经过

            科技有限公司编写好的 perl 脚本进行计算ꎮ                            人工筛选的优良种质之间的亲缘进化关系ꎬ本研
                                                               究基于筛选出的高度一致性的有效 SNP 变异位
            2  结果与分析                                           点ꎬ对 95 份八角种质进行了主成分分析( PCA) 和
                                                               系统发育分析ꎮ 如图 1 所示ꎬPCA 分析将 95 份八
            2.1 酶切方案评估和测序结果                                    角种质分为 2 个类群( 类群Ⅰ和类群Ⅱ)ꎬPC1 和
                 鉴于目前尚无八角的参考基因组ꎬ本研究选                           PC2 的积累方差贡献率为 8.49%ꎮ 类群 I 中的样

            择了与八角亲缘关系较近的鹅掌楸基因组( Chen                           本材料为桂北、桂西及部分桂中部地区八角居群
            et al.ꎬ 2019)作为参考ꎮ 根据电子酶切预测ꎬ选择                     样本ꎬ分布于主成分坐标轴的右侧ꎬ并且这些样本
            了限制性内切酶 HaeⅢ和 HinCⅡꎬ并确定酶切片                         的分布较为聚拢ꎻ类群Ⅱ中的样本材料为桂南、桂
            段的长度为 364 ~ 464 bpꎬ以此 作 为 SLAF 标 签ꎮ                东和部分桂中部地区八角居群样本ꎬ以及 42 份经
            为了评估测序数据的质量ꎬ将 95 个八角个体的测                           过人工筛选的优良种质ꎬ分布于主成分坐标轴的
            序数据 ( Reads 数 量、 GC 含 量 和 Q ) 进 行 统 计ꎮ             左侧ꎮ 相较于类群Ⅰꎬ类群Ⅱ的样本在 PCA 分布
                                             30
            统计结果显示ꎬ从 95 份测序样品中共获得 1 588                        空间上表现出较为分离的趋势ꎬ表明该类群八角
            Mb Reads 数据ꎬ测序 Q 范围为 88.97% ~ 96.62%ꎬ              种质来源多样ꎬ遗传多样性较高ꎮ
                                 30
            平均 Q 为 92.88%ꎬGC 范围为 43.22% ~ 45.61%ꎬ                  与 PCA 分析结果类似ꎬ系统进化树( 图 2) 分
                   30
            平均 GC 含量为 44.29%ꎮ 综上表明ꎬ本研究获得                       析将 95 份八角种质分成 2 大类群: 类群Ⅰ为来源
   114   115   116   117   118   119   120   121   122   123   124