Page 20 - 《广西植物》2022年第12期
P. 20

2 0 1 0                                广  西  植  物                                         42 卷
            制备实验流程构建插入片段大小( insert size) 为                     参数设置:单核苷酸( mono ̄)、双核苷酸 ( di ̄)、三
            400 bp 的 DNA 文库ꎮ 应用 Illumina NovaSeq 平台            核 苷 酸 ( tri ̄)、 四 核 苷 酸 ( tetra ̄)、 五 核 苷 酸
            对 DNA 文 库 进 行 二 代 测 序 ( paired ̄endꎬ 2 × 150        (penta ̄)、六核苷酸 ( hexa ̄) SSR 的最小重复次数
            bp)ꎮ DNA 提取及测序均在南京派森诺基因科技                          分别为 10、5、4、3、3、3ꎮ 利用 REPuter(Kurtz et al.ꎬ
            有限公司完成ꎮ                                            2001)来分析木芙蓉 3 个品种和台湾芙蓉 cpDNA
            1.3 cpDNA 的组装和注释                                   中的重复类型( Hamming 距离设置为 3ꎬ重复序列

                 每个 物 种 得 到 了 至 少 5G 的 原 始 数 据 ( raw           的 最 小 长 度 限 制 为 30 )ꎮ 借 助 IRscope
            data)ꎬ 经 过 数 据 过 滤 后ꎬ 使 用 NOVOPlasty               (Amiryousefi et al.ꎬ 2018) 绘制木芙蓉 3 个品种即
            (Dierckxsens et al.ꎬ 2017) 软件 ( k ̄mer = 39) 进      台湾芙蓉、木槿和朱槿 cpDNAIR 边界的扩张和收
            行组装拼接ꎬ选择台湾芙蓉的 rbcL 基因作为种子                          缩ꎮ 使 用 mVISTA ( Mayor et al.ꎬ 2000 ) 中 的

            序列 ( seed sequence )ꎮ 利 用 在 线 程 序 GeSeq            Shuffle ̄LANGAN 模式对木芙蓉 3 个品种即台湾芙
            ( Tillich et al.ꎬ 2017 ) 注 释 cpDNA 序 列ꎬ 并 用        蓉、木槿和朱槿的 cpDNA 序列进行全局比对ꎬ以评
            Geneious v9.0.2( Kearse et al.ꎬ 2012) 进行手动校        估序列之间的相似性ꎮ 使用 DNAsp 6( Librado &
            正ꎮ 将带有注释信息的 3 条序列上传至 NCBI 数                        Rozasꎬ 2009)软件计算序列之间的核苷酸多态性ꎮ
            据库ꎬ‘单瓣白’‘金秋颂’ ‘牡丹粉’ 的序列号分别                         使用 Geneious v9.02(Kearse et al.ꎬ 2012)分别提取
            为 MZ846191、MZ846192、MZ855502ꎮ 借助在线程                每个物种的蛋白编码区域( CDS)ꎬ存在多拷贝的
            序 Oranellar Genome DRAW( Greiner et al.ꎬ 2019)     基因 仅 保 留 1 条ꎮ 使 用 Codon W ( Sharp & Liꎬ
            绘制 cpDNA 的物理图谱ꎮ 台湾芙蓉的序列号为                          1987)计算这些 CDS 的同义密码子的相对使用度
            MK937807ꎬ亦为 本 项 目 的 研 究 成 果 ( Xu et al.ꎬ           (related synonymous codon usageꎬ RSCU)ꎮ
            2019)ꎮ 本文中用到的其他 cpDNA 序列均下载于                       1.5 系统发育分析
            NCBIꎬ其详细信息见表 1ꎮ                                        使用 phylosuite(Zhang et al.ꎬ 2020)提取 17 个
                                                               物种 cpDNA 的 CDSꎬ删去重复基因和非共有的基
               表 1  所选用的物种名称和 GenBank 序列编号                     因后ꎬ 使 用 MAFFT 对 序 列 进 行 比 对ꎬ 之 后 使 用
                Table 1  Names and GenBank sequence codes      MACSE 优化序列ꎬ用 Gblock 修剪比对好的序列ꎬ
                        of the plant species selected
                                                               最终 使 用 concatenate 功 能 将 序 列 串 联ꎮ 使 用
                            序列编号                   序列编号        Modeltest 检测最佳核苷酸替代模型为 JC+I+Gꎮ 使
                  物种                      物种
                            Accession               Accession
                 Species                 Species               用 MrBayes 进行贝叶斯( Bayesian inferenceꎬ BI) 分
                              code                   code
                  木槿                      桐棉                   析ꎮ 基于 Markov chain Monte Carlo (MCMC)算法ꎬ
              Hibiscus syriacus  KR259989  Thespesia populnea  NC048518
                                                               运行 1×10 代ꎬ每 1 000 代取 1 棵树ꎬ前 20%的树
                                                                        7
                  朱槿                      苘麻
               H. rosa ̄sinensis  NC042239  Abutilon theophrasti  NC053702  当作老化样本丢弃ꎬ剩余的树用于构建一致树ꎮ
                 大麻槿                      蜀葵                   使用 IQtree 进行最大似然法( maximum likelihoodꎬ
               H. canabinus  NC045873   Alcea rosea  NC053839  ML)分析ꎬ重复次数为1 000ꎮ 将建树结果使用在
                  黄槿                      野葵                   线程序 iTOL(Ivica & Peerꎬ 2021)进行美化ꎮ
                H. tiliaceum  MT644160  Malva verticillata  MT106775
                海滨木槿                     拔毒散
                H. hamabo   NC030195   Sida szechuensis  NC051877  2  结果与分析
                 海岛棉                    美丽异木棉
             Gossypium barbadense  NC008641  Ceiba speciosa  MK820674
                                                               2.1 cpDNA 基本特征
                G. thurberi  GU907100
                                                                   如图 1 所示ꎬ‘ 单瓣白’ 和‘ 金秋颂’ 的长度差
                                                               异较小ꎬ分别为 160 880、160 879 bpꎬ仅相差 1 个
            1.4 cpDNA 比较分析                                     碱基ꎬ而‘牡丹粉’ 的长度与前 2 种则有稍大的差

                 使 用 MISA ( MicroSatellite identification tool)  异ꎬ为 160 920 bpꎮ 三者的 cpDNA 呈现出典型的
            (Beier et al.ꎬ 2017)ꎬ识别木芙蓉 3 个品种即台湾                四分体环状结构ꎬ均由 1 对反向重复区( inverted

            芙蓉、木槿和朱槿基因组中的微卫星序列 ( SSR)ꎮ                         repeatsꎬ IR) (IRa 和 IRbꎬ长度均为 26 300 bp) 以
   15   16   17   18   19   20   21   22   23   24   25