Page 104 - 《广西植物》2025年第4期
P. 104
7 1 8 广 西 植 物 45 卷
基因组序列上的分布ꎬ设置单核苷酸重复单元大
1 材料与方法 于等于 10 个ꎬ二核苷酸重复单元大于等于 5 个ꎬ
三核苷酸重复单元大于等于 4 个ꎬ四核苷酸重复
1.1 材料 单元、五核苷酸重复单元、六核苷酸重复单元均大
样品采自广东广州、肇庆、阳江、云浮等地ꎬ经 于等于 3 个ꎮ 应用在线软件 REPuter(Kurtz et al.ꎬ
广州中医药大学吴文如教授鉴定为唇形科刺蕊草 2001) ( https: / / bibiserv. cebitec. uni ̄bielefeld. de /
属植物广藿香( Pogostemon cablin)ꎮ 样品分为两 reputer)检测叶绿体基因组中的散在重复序列ꎬ包
份ꎬ一份扦插ꎬ移栽于广州中医药大学时珍山药 括正向重复序列( F)、反向重复序列( R)、互补重
圃ꎬ另一份置于-20 ℃ 冰箱保存ꎮ 采集的 20 个广 复序列(C)和回文重复序列( P)ꎮ 基因组中的散
藿香叶绿体基因组序列及注释信息已上传至 NCBI 在重复序列识别参数设置:海明距离设置为 3ꎬ最
数据库ꎬ实验样品采集信息和 GenBank 登录号见 小重复 长 度 不 小 于 11 bpꎬ 其 他 为 默 认 值ꎬ 取 e ̄
 ̄5
表 1ꎮ value 不超过 1×10 的重复序列ꎮ
1.2 方法 1.2.4 边界收缩与扩张 使用 JSHY ̄Cloud( http: / /
1.2.1 基因组 DNA 提取及测序 采用 CTAB 法提 cloud. genepioneer. com:9929) 的 CPJSdraw 边 界 绘
取广藿香叶片总 DNAꎬ使用 Qubit Fluorometer 核酸 制工具比较不同来源的广藿香叶绿体基因组与参
蛋白定量仪( 赛默飞世尔科技公司) 和 1%琼脂糖 考序列 NC_042796.1 反向重复区与单拷贝区的边
凝胶电泳检测总 DNA 浓度和质量ꎮ 总 DNA 经检 界(Raubeson et al.ꎬ 2007)ꎬ可视化其结果ꎮ
测合 格 后ꎬ 交 由 华 大 基 因 科 技 有 限 公 司ꎬ 使 用 1.2.5 叶 绿 体 基 因 组 比 较 与 共 线 性 分 析 使 用
DNBSeq 测序平台双末端测序策略构建片段大小 mVISTA( Frazer et al.ꎬ 2004) 在 线 软 件 ( https: / /
为 150 bp 的测序文库进行测序ꎮ genome. lbl. gov / vista / mvista / submit. shtml)ꎬ参数设
1.2.2 叶绿体基因组组装及注释 测序得到原始 定中选择 shuffle ̄LAGAN 模式对 20 个不同来源的
测 序 数 据ꎬ 使 用 SOAPnuke 软 件 ( Chen et al.ꎬ 广藿香叶绿体基因组进行比较分析ꎬ以石牌广藿
2018) 对 低 质 量 数 据 进 行 过 滤ꎬ 去 除 带 接 头 香叶绿体基因组( NC_042796.1) 作为参考ꎮ 使用
(adapter)的 readsꎻ去除长度小于 150 bp 的 readsꎻ mauve(Darling et al.ꎬ 2004) ( version 20150226) 对
去除 N(N 表示无法确定碱基信息)的比例 1.0%以 广藿香叶绿体基因组进行共线性分析ꎮ
上的 readsꎻ去除 read 中 polyX( X 可为 A、T、C 或 1.2.6 多样性位点分析 使用 MAFFT v7.490 软件
G)长度超过 50 bp 的 readsꎻ去除低质量 reads( 质 (Katoh & Standleyꎬ 2013)比对 20 条叶绿体基因组
量值 Q 小于和等于 20 的碱基数占整条 read 长度 序列ꎬ对齐后导出 fasta 格式文件ꎮ 将所得 fasta 文
的 30%以上的 reads)ꎬ将最后得到的 clean data 用 件导入 DnaSP( Rozas et al.ꎬ 2017) v6.12.03 软件ꎬ
于后续分析ꎮ 使用 GetOrganelle( Jin et al.ꎬ 2020) 计算 20 个广藿香叶绿体基因组的核酸多样性水
v1.7.7.0 进行组装ꎬ参考数据库为 embplant_pt( 陆 平ꎬ设 置 窗 口 长 度 ( window length) 为 600ꎬ 步 长
生植物叶绿体)ꎬ最大扩充循环数为 10ꎬ调用 K ̄ (step size)为 200ꎮ
mer 值 为 21、 45、 65、 85ꎻ 拼 接 完 成 后 用 Bandage 1.2.7 同义密码子相对使用度( relative synonymous
v0.8.1 软件可视ꎮ 使用 Genenious v9.0.2 检查并调 codon usageꎬ RSCU) 采用 CodonW v1.4.4 计算各
整 序 列ꎮ 以 广 藿 香 的 叶 绿 体 基 因 组 ( NC _ 基因的 RSCU( Dana & Tullerꎬ 2014)ꎬ并利用在线
042796.1 ) 序 列 为 参 考ꎬ 通 过 CPGAVAS2 网 站 工 具 RSCU - 热 图 ( https: / / www. bioinformatics.
(http: / / 47. 96. 249. 172: 16019 / analyzer / home) 进 com.cn / plot_basic_cluster_heatmap_plot_024) 绘制
行基因组注释ꎬ使用在线工具 OGDRAW( https: / / 广藿香叶绿体基因组的 RSCU 热图ꎮ
chlorobox.mpimp ̄golm. mpg. de / OGDraw. html) 绘 制 1.2.8 遗传距离分析 使用“1.2.6” 项下经 MAFFT
叶绿体基因组图谱ꎮ v7.490 对齐后的 fasta 文件ꎬ导入 MEGA X 软件ꎬ形
1.2.3 简单重复序列与散在重复序列 使用 MISA 成 mega 文件ꎬ设置自展值 Bootstrap method 1 000ꎬ
(Beier et al.ꎬ 2017) 软件的 Perl 脚本探索简单重 选择 p ̄distance 模式ꎬ成对计算不同来源广藿香叶
复序列( simple sequence repeatsꎬSSR) 在叶绿体全 绿体基因组的遗传距离(Kumar et al.ꎬ 2018)ꎮ

