Page 20 - 《广西植物》2022年第12期
P. 20
2 0 1 0 广 西 植 物 42 卷
制备实验流程构建插入片段大小( insert size) 为 参数设置:单核苷酸( mono ̄)、双核苷酸 ( di ̄)、三
400 bp 的 DNA 文库ꎮ 应用 Illumina NovaSeq 平台 核 苷 酸 ( tri ̄)、 四 核 苷 酸 ( tetra ̄)、 五 核 苷 酸
对 DNA 文 库 进 行 二 代 测 序 ( paired ̄endꎬ 2 × 150 (penta ̄)、六核苷酸 ( hexa ̄) SSR 的最小重复次数
bp)ꎮ DNA 提取及测序均在南京派森诺基因科技 分别为 10、5、4、3、3、3ꎮ 利用 REPuter(Kurtz et al.ꎬ
有限公司完成ꎮ 2001)来分析木芙蓉 3 个品种和台湾芙蓉 cpDNA
1.3 cpDNA 的组装和注释 中的重复类型( Hamming 距离设置为 3ꎬ重复序列
每个 物 种 得 到 了 至 少 5G 的 原 始 数 据 ( raw 的 最 小 长 度 限 制 为 30 )ꎮ 借 助 IRscope
data)ꎬ 经 过 数 据 过 滤 后ꎬ 使 用 NOVOPlasty (Amiryousefi et al.ꎬ 2018) 绘制木芙蓉 3 个品种即
(Dierckxsens et al.ꎬ 2017) 软件 ( k ̄mer = 39) 进 台湾芙蓉、木槿和朱槿 cpDNAIR 边界的扩张和收
行组装拼接ꎬ选择台湾芙蓉的 rbcL 基因作为种子 缩ꎮ 使 用 mVISTA ( Mayor et al.ꎬ 2000 ) 中 的
序列 ( seed sequence )ꎮ 利 用 在 线 程 序 GeSeq Shuffle ̄LANGAN 模式对木芙蓉 3 个品种即台湾芙
( Tillich et al.ꎬ 2017 ) 注 释 cpDNA 序 列ꎬ 并 用 蓉、木槿和朱槿的 cpDNA 序列进行全局比对ꎬ以评
Geneious v9.0.2( Kearse et al.ꎬ 2012) 进行手动校 估序列之间的相似性ꎮ 使用 DNAsp 6( Librado &
正ꎮ 将带有注释信息的 3 条序列上传至 NCBI 数 Rozasꎬ 2009)软件计算序列之间的核苷酸多态性ꎮ
据库ꎬ‘单瓣白’‘金秋颂’ ‘牡丹粉’ 的序列号分别 使用 Geneious v9.02(Kearse et al.ꎬ 2012)分别提取
为 MZ846191、MZ846192、MZ855502ꎮ 借助在线程 每个物种的蛋白编码区域( CDS)ꎬ存在多拷贝的
序 Oranellar Genome DRAW( Greiner et al.ꎬ 2019) 基因 仅 保 留 1 条ꎮ 使 用 Codon W ( Sharp & Liꎬ
绘制 cpDNA 的物理图谱ꎮ 台湾芙蓉的序列号为 1987)计算这些 CDS 的同义密码子的相对使用度
MK937807ꎬ亦为 本 项 目 的 研 究 成 果 ( Xu et al.ꎬ (related synonymous codon usageꎬ RSCU)ꎮ
2019)ꎮ 本文中用到的其他 cpDNA 序列均下载于 1.5 系统发育分析
NCBIꎬ其详细信息见表 1ꎮ 使用 phylosuite(Zhang et al.ꎬ 2020)提取 17 个
物种 cpDNA 的 CDSꎬ删去重复基因和非共有的基
表 1 所选用的物种名称和 GenBank 序列编号 因后ꎬ 使 用 MAFFT 对 序 列 进 行 比 对ꎬ 之 后 使 用
Table 1 Names and GenBank sequence codes MACSE 优化序列ꎬ用 Gblock 修剪比对好的序列ꎬ
of the plant species selected
最终 使 用 concatenate 功 能 将 序 列 串 联ꎮ 使 用
序列编号 序列编号 Modeltest 检测最佳核苷酸替代模型为 JC+I+Gꎮ 使
物种 物种
Accession Accession
Species Species 用 MrBayes 进行贝叶斯( Bayesian inferenceꎬ BI) 分
code code
木槿 桐棉 析ꎮ 基于 Markov chain Monte Carlo (MCMC)算法ꎬ
Hibiscus syriacus KR259989 Thespesia populnea NC048518
运行 1×10 代ꎬ每 1 000 代取 1 棵树ꎬ前 20%的树
7
朱槿 苘麻
H. rosa ̄sinensis NC042239 Abutilon theophrasti NC053702 当作老化样本丢弃ꎬ剩余的树用于构建一致树ꎮ
大麻槿 蜀葵 使用 IQtree 进行最大似然法( maximum likelihoodꎬ
H. canabinus NC045873 Alcea rosea NC053839 ML)分析ꎬ重复次数为1 000ꎮ 将建树结果使用在
黄槿 野葵 线程序 iTOL(Ivica & Peerꎬ 2021)进行美化ꎮ
H. tiliaceum MT644160 Malva verticillata MT106775
海滨木槿 拔毒散
H. hamabo NC030195 Sida szechuensis NC051877 2 结果与分析
海岛棉 美丽异木棉
Gossypium barbadense NC008641 Ceiba speciosa MK820674
2.1 cpDNA 基本特征
G. thurberi GU907100
如图 1 所示ꎬ‘ 单瓣白’ 和‘ 金秋颂’ 的长度差
异较小ꎬ分别为 160 880、160 879 bpꎬ仅相差 1 个
1.4 cpDNA 比较分析 碱基ꎬ而‘牡丹粉’ 的长度与前 2 种则有稍大的差
使 用 MISA ( MicroSatellite identification tool) 异ꎬ为 160 920 bpꎮ 三者的 cpDNA 呈现出典型的
(Beier et al.ꎬ 2017)ꎬ识别木芙蓉 3 个品种即台湾 四分体环状结构ꎬ均由 1 对反向重复区( inverted
芙蓉、木槿和朱槿基因组中的微卫星序列 ( SSR)ꎮ repeatsꎬ IR) (IRa 和 IRbꎬ长度均为 26 300 bp) 以