Page 54 - 《广西植物》2025年第5期
P. 54

8 5 8                                  广  西  植  物                                         45 卷
            每条 CDS 序列的 A / (A +T )和 G / (G +C )为坐              先使用 python 脚本提取 65 条序列共有的 78 个
                              3   3   3     3    3  3
            标绘制散点图进行 PR2 ̄plot 分析ꎮ 数据可视化均                       CDSꎬ再 利 用 MAFFT v7. 525 软 件 ( Katoh et al.ꎬ
            由 R 包 ggplot2 v3.4.2 完成ꎮ                           2002)对每个 CDS 进行比对ꎬ最后以蕈树科植物的
            1.5 叶绿体基因组的比较分析                                    叶绿体基因组为外类群ꎬ使用 IQ ̄TREE v2.1.4 软
                 使用在线软件 CPJSdraw(Li et al.ꎬ 2023)比较            件(Nguyen et al.ꎬ 2015)构建金缕梅科叶绿体基因

            以下 7 条金缕梅科植物的叶绿体基因组序列的 IR                          组共有 CDS 系统发育树ꎮ
            边界 信 息ꎬ 即 三 脉 水 丝 梨 ( PP625971)、 水 丝 梨                 叶绿 体 全 基 因 组 建 树ꎬ 将 65 条 序 列 使 用
            ( NC071198 )、 假 蚊 母 ( Distyliopsis      dunniiꎬ    MAFFT v7.525 软件进行比对构建成一个超级矩

            NC071205)、 樟 叶 假 蚊 母 ( Distyliopsis laurifoliaꎬ    阵ꎬ使用 trimAl v1.4 软件( Capella ̄Gutiérrez et al.ꎬ
            NC071202)、 小 叶 蚊 母 树 ( Distylium buxifoliumꎬ       2009)去除 矩 阵 中 较 差 的 区 域ꎬ 参 数 设 置: gt 为
            NC059888 )、 中 华 蚊 母 树 ( Distylium chinenseꎬ        0.75ꎬresoverlap 为 0.90ꎬseqoverlap 为 0.90ꎮ 使用
            NC059885 ) 和 波 斯 铁 木 ( Parrotia persicaꎬ           IQ ̄TREE v2.1.4 软件ꎬ参数设置同上ꎬ基于 TVM+F+
            NC071840)ꎮ 使用 Geneious Prime 2023 软件中的             I+R3 最佳替代模型ꎬ构建系统发育树ꎮ
            Mauve 插件(Darling et al.ꎬ 2004) 分析上述 7 条序               在 IQ ̄TREE v2.1. 4 中构建的金缕梅科叶绿
            列的共线性ꎮ 以蚊母树作为参考ꎬ通过在线软件                             体基因组共有 CDS 系统发育树和叶绿体全基因
            mVISTA(Frazer et al.ꎬ 2004)ꎬ采用 LAGAN 运行模           组系统发育树ꎬ均通过重复测试 10 000 次的 SH
            式分析 7 条叶绿体基因组的序列一致性ꎮ                               近似似然比( SH ̄aLRT) 和超快自展法( UFboot)
            1.6 核苷酸多态性分析                                       评估 各 分 支 的 支 持 度 ( Guindon et al.ꎬ 2010ꎻ
                 使用 DnaSP v6.0( Rozas et al.ꎬ 2017) 对水丝        Hoang et al.ꎬ 2018) ꎮ 建树结果均置于 Fig tree 中
            梨属三脉水丝梨和水丝梨共 4 条叶绿体基因组序                            进行可视化ꎮ
            列 ( Sycopsis triplinervia PP625971、 Sycopsis sinensis
            NC071198、 Sycopsis sinensis MT323104 和 Sycopsis    2  结果与分析
            sinensis MN496080) 的蛋白质编码区和非编码 区
            (包括内含子和基因间隔区) 分别进行核苷酸多态                            2.1 三脉水丝梨叶绿体基因组结构和基本特征
            性分析ꎮ                                                   三脉水丝梨叶绿体基因组全长 159 375 bpꎬ
                 编码区的提取在 Geneious Prime 2023 软件中               GC 总 含 量 为 38% ( 图 1 )ꎮ 其 中ꎬ 大 单 拷 贝 区
            完成ꎮ 非编码区的提取由 perl 脚本 3_extract_bed_                (large single copyꎬ LSC ) 长 88 067 bpꎬ GC 含 量
            coding_and_noncoding 完成ꎬ并手动检查提取结果ꎮ                 36.2%ꎻ 小 单 拷 贝 区 ( small single copyꎬ SSC) 长
            将提取的序列进行 MAFFT 比对ꎬ并将比对好的序                          18 808 bpꎬ GC 含 量 32. 5%ꎻ 单 个 反 向 重 复 区
            列导入 DnaSP v6.0 进行核苷酸多态性分析ꎮ                         (inverse repeatꎬIR) 长 26 250 bpꎬGC 含量 43.1%ꎬ
            1.7 系统发育分析                                         明显高于 LSC 区和 SSC 区( 表 1)ꎮ 此外ꎬ三脉水
                 为阐明三脉水丝梨与金缕梅科其他物种的系                           丝梨叶绿体基因组共编码了 133 个基因ꎬ其中包
            统发育关系ꎬ从 NCBI 数据库中下载了 53 种金缕梅                       括 8 个 rRNA 基因、37 个 tRNA 基因、87 个蛋白编
            科植物的 60 条叶绿体全基因组序列和 3 种蕈树科                         码基因和 1 个假基因(#ycf1)ꎮ 按基因功能主要分
            (Altingiaceae)植物的 4 条叶绿体全基因组序列ꎬ加                   为 4 大类ꎬ即光合作用相关基因、自我复制相关基
            上本次组装所得的三脉水丝梨ꎬ共计 65 条序列用于                          因、其 他 基 因 和 未 知 功 能 基 因 ( 表 2 )ꎮ 其 中ꎬ
            系统发育分析ꎮ 以蕈树科植物的叶绿体基因组为                             ndhB、rpl2、rrn4.5、trnA ̄UGC、ycf15 等 18 个基因有
            外类群ꎬ构建金缕梅科叶绿体基因组共有 CDS 系统                          2 个拷贝ꎬ其余基因均为单拷贝基因ꎮ 此外ꎬ三脉

            发育树和叶绿体全基因组系统发育树ꎮ                                  水丝梨叶绿体基因组中有 18 个含有内含子的基
                 共有 CDS 建树ꎬ以蚊母树和水丝梨为参考基                        因ꎬ其中 15 个基因( atpF、ndhA、ndhB、petB、petD、
            因 组ꎬ 使 用 GeSeq 在 线 软 件 ( https: / / chlorobox.     rpl16、rpl2、rps16、rpoC1、trnA ̄UGC、trnG ̄GCC、trnI ̄
            mpimp ̄golm. mpg. de / geseq. html ) ( Tillich et al.ꎬ  GAU、trnK ̄UUU、trnL ̄UAA、trnV ̄UAC) 存在 1 个内
            2017)对 65 条叶绿体基因组序列进行批量注释ꎮ                         含子ꎬ3 个基因(rps12、clpP、ycf3)存在 2 个内含子ꎮ
   49   50   51   52   53   54   55   56   57   58   59