Page 54 - 《广西植物》2025年第5期
P. 54
8 5 8 广 西 植 物 45 卷
每条 CDS 序列的 A / (A +T )和 G / (G +C )为坐 先使用 python 脚本提取 65 条序列共有的 78 个
3 3 3 3 3 3
标绘制散点图进行 PR2 ̄plot 分析ꎮ 数据可视化均 CDSꎬ再 利 用 MAFFT v7. 525 软 件 ( Katoh et al.ꎬ
由 R 包 ggplot2 v3.4.2 完成ꎮ 2002)对每个 CDS 进行比对ꎬ最后以蕈树科植物的
1.5 叶绿体基因组的比较分析 叶绿体基因组为外类群ꎬ使用 IQ ̄TREE v2.1.4 软
使用在线软件 CPJSdraw(Li et al.ꎬ 2023)比较 件(Nguyen et al.ꎬ 2015)构建金缕梅科叶绿体基因
以下 7 条金缕梅科植物的叶绿体基因组序列的 IR 组共有 CDS 系统发育树ꎮ
边界 信 息ꎬ 即 三 脉 水 丝 梨 ( PP625971)、 水 丝 梨 叶绿 体 全 基 因 组 建 树ꎬ 将 65 条 序 列 使 用
( NC071198 )、 假 蚊 母 ( Distyliopsis dunniiꎬ MAFFT v7.525 软件进行比对构建成一个超级矩
NC071205)、 樟 叶 假 蚊 母 ( Distyliopsis laurifoliaꎬ 阵ꎬ使用 trimAl v1.4 软件( Capella ̄Gutiérrez et al.ꎬ
NC071202)、 小 叶 蚊 母 树 ( Distylium buxifoliumꎬ 2009)去除 矩 阵 中 较 差 的 区 域ꎬ 参 数 设 置: gt 为
NC059888 )、 中 华 蚊 母 树 ( Distylium chinenseꎬ 0.75ꎬresoverlap 为 0.90ꎬseqoverlap 为 0.90ꎮ 使用
NC059885 ) 和 波 斯 铁 木 ( Parrotia persicaꎬ IQ ̄TREE v2.1.4 软件ꎬ参数设置同上ꎬ基于 TVM+F+
NC071840)ꎮ 使用 Geneious Prime 2023 软件中的 I+R3 最佳替代模型ꎬ构建系统发育树ꎮ
Mauve 插件(Darling et al.ꎬ 2004) 分析上述 7 条序 在 IQ ̄TREE v2.1. 4 中构建的金缕梅科叶绿
列的共线性ꎮ 以蚊母树作为参考ꎬ通过在线软件 体基因组共有 CDS 系统发育树和叶绿体全基因
mVISTA(Frazer et al.ꎬ 2004)ꎬ采用 LAGAN 运行模 组系统发育树ꎬ均通过重复测试 10 000 次的 SH
式分析 7 条叶绿体基因组的序列一致性ꎮ 近似似然比( SH ̄aLRT) 和超快自展法( UFboot)
1.6 核苷酸多态性分析 评估 各 分 支 的 支 持 度 ( Guindon et al.ꎬ 2010ꎻ
使用 DnaSP v6.0( Rozas et al.ꎬ 2017) 对水丝 Hoang et al.ꎬ 2018) ꎮ 建树结果均置于 Fig tree 中
梨属三脉水丝梨和水丝梨共 4 条叶绿体基因组序 进行可视化ꎮ
列 ( Sycopsis triplinervia PP625971、 Sycopsis sinensis
NC071198、 Sycopsis sinensis MT323104 和 Sycopsis 2 结果与分析
sinensis MN496080) 的蛋白质编码区和非编码 区
(包括内含子和基因间隔区) 分别进行核苷酸多态 2.1 三脉水丝梨叶绿体基因组结构和基本特征
性分析ꎮ 三脉水丝梨叶绿体基因组全长 159 375 bpꎬ
编码区的提取在 Geneious Prime 2023 软件中 GC 总 含 量 为 38% ( 图 1 )ꎮ 其 中ꎬ 大 单 拷 贝 区
完成ꎮ 非编码区的提取由 perl 脚本 3_extract_bed_ (large single copyꎬ LSC ) 长 88 067 bpꎬ GC 含 量
coding_and_noncoding 完成ꎬ并手动检查提取结果ꎮ 36.2%ꎻ 小 单 拷 贝 区 ( small single copyꎬ SSC) 长
将提取的序列进行 MAFFT 比对ꎬ并将比对好的序 18 808 bpꎬ GC 含 量 32. 5%ꎻ 单 个 反 向 重 复 区
列导入 DnaSP v6.0 进行核苷酸多态性分析ꎮ (inverse repeatꎬIR) 长 26 250 bpꎬGC 含量 43.1%ꎬ
1.7 系统发育分析 明显高于 LSC 区和 SSC 区( 表 1)ꎮ 此外ꎬ三脉水
为阐明三脉水丝梨与金缕梅科其他物种的系 丝梨叶绿体基因组共编码了 133 个基因ꎬ其中包
统发育关系ꎬ从 NCBI 数据库中下载了 53 种金缕梅 括 8 个 rRNA 基因、37 个 tRNA 基因、87 个蛋白编
科植物的 60 条叶绿体全基因组序列和 3 种蕈树科 码基因和 1 个假基因(#ycf1)ꎮ 按基因功能主要分
(Altingiaceae)植物的 4 条叶绿体全基因组序列ꎬ加 为 4 大类ꎬ即光合作用相关基因、自我复制相关基
上本次组装所得的三脉水丝梨ꎬ共计 65 条序列用于 因、其 他 基 因 和 未 知 功 能 基 因 ( 表 2 )ꎮ 其 中ꎬ
系统发育分析ꎮ 以蕈树科植物的叶绿体基因组为 ndhB、rpl2、rrn4.5、trnA ̄UGC、ycf15 等 18 个基因有
外类群ꎬ构建金缕梅科叶绿体基因组共有 CDS 系统 2 个拷贝ꎬ其余基因均为单拷贝基因ꎮ 此外ꎬ三脉
发育树和叶绿体全基因组系统发育树ꎮ 水丝梨叶绿体基因组中有 18 个含有内含子的基
共有 CDS 建树ꎬ以蚊母树和水丝梨为参考基 因ꎬ其中 15 个基因( atpF、ndhA、ndhB、petB、petD、
因 组ꎬ 使 用 GeSeq 在 线 软 件 ( https: / / chlorobox. rpl16、rpl2、rps16、rpoC1、trnA ̄UGC、trnG ̄GCC、trnI ̄
mpimp ̄golm. mpg. de / geseq. html ) ( Tillich et al.ꎬ GAU、trnK ̄UUU、trnL ̄UAA、trnV ̄UAC) 存在 1 个内
2017)对 65 条叶绿体基因组序列进行批量注释ꎮ 含子ꎬ3 个基因(rps12、clpP、ycf3)存在 2 个内含子ꎮ

