Page 21 - 《广西植物》2025年第1期
P. 21
1 期 王其刚等: 中甸刺玫的叶绿体基因组特征及种内变异 1 7
最大且在 LSC 区的 psbM 和 trnD 之间有一个长为 进行密码子偏好分析ꎬ计算同义密码子相对使用
505 bp 的插入ꎮ 在此基础上ꎬ为了探究中甸刺玫 值(relative synonymous codon usage valuesꎻ RSCU)
种内表型变异的遗传背景ꎬ本研究利用二代测序 并统计 AT 含量ꎮ 用重复序列分析软件 REPuter
技术对 40 个不同表型的中甸刺玫代表性个体的 软 件 ( https: / / bibiserv. cebitec. uni - bielefeld. de /
叶绿体基因组进行了测序、组装和比较分析ꎬ探讨 reputer)(Kurtz et al.ꎬ 2001)ꎬ搜索基因组中的正向
以下问题:(1)中甸刺玫叶绿体基因组的序列特征 重复(forward repeats)和反向重复(reverse repeats)
和密码子偏好性ꎻ(2)中甸刺玫种内不同表型个体 序列ꎮ 软件运行时ꎬ设置搜索的重复序列长度不
在叶绿体基因组上是否存在较大的变异ꎮ 以期为 小于 20 bpꎬ 序 列 一 致 性 大 于 85%ꎮ 此 外ꎬ 利 用
中甸刺玫的物种形成和保护提供更多的遗传信 MISA(Beier et al.ꎬ2017) 软件来鉴定简单重复序
息ꎬ也为探讨其种内表型变异的分子机制提供叶 列ꎬ搜索的阈值设置为单核苷酸、二核苷酸、三核
绿体基因组方面的基础数据ꎮ 苷酸、四核苷酸、五核苷酸和六核苷酸重复次数分
别不小于 10、5、4、3、3 和 3ꎮ
1 材料与方法 1.2.3 种内不同个体的叶绿体基因组序列比较
在 Geneious 软件中调用 Mauve 程序(Darling et al.ꎬ
1.1 研究材料 2004)对中甸刺玫 40 个代表性植株的叶绿体基因
用于叶绿体基因组序列特征分析的中甸刺玫 组进行比对ꎬ分析不同植株的叶绿体基因组间是
植株来源于香格里拉市小中甸镇和平村塘安培组 否存在大片段的逆转或丢失ꎮ 用 DNASP v5.10 软
(99°49′38.1″ E、27°32′16.68″ Nꎬ 3 248 m)ꎬ其原 件(Librado & Rozasꎬ 2009) 计算种内叶绿体基因
始序列已上传至 NCBIꎬ序列号为 MG450565.1ꎮ 其 组的单倍型多样性和核苷酸多态性( P )ꎬ筛选叶
i
余 40 个不同表型的代表性植株的基本信息见表 绿体基因组中的高变区ꎮ
1ꎮ 于 2021 年 6 月底在野外采集当年生成熟健康
叶片ꎬ立即用硅胶进行干燥ꎬ-18 ℃ 低温保存用于 2 结果与分析
后续实验ꎮ
1.2 研究方法 2.1 中甸刺玫叶绿体基因组的结构特征
1.2.1 基因组总 DNA 的提取、测序、组装及注释 中甸刺玫种内不同表型的 40 个代表性植株的
使用改良的 CTAB 法进行中甸刺玫叶片的总 DNA 叶绿体基因组序列的长度、各分区长度、GC 含量、
提取ꎬ达到建库测序要求的 DNA 送到北京诺禾致源 编码基因数目等基本信息见图 1 和表 2ꎮ 中甸刺
科技股份有限公司用 Illumina Hiseq 2000 测序平台 玫的基因组序列全长157 173 ~ 157 261 bpꎬ植株间
进行建库测序ꎬ每个样品得到约 3.5 Gb 的 150 bp 短 相差 88 bpꎮ 基 因 组 最 大 的 是 7 - 1 号 植 株ꎬ 为
片段原始序列(raw data)ꎬ用 NGSQC Toolkit_v2.3.3 157 261 bpꎬ 基 因 组 最 小 的 是 2 - 5 号 植 株ꎬ 为
软件(Patel & Jainꎬ 2012)按照默认参数对原始序列 157 173 bpꎮ LSC 区长为 86 300 ~ 86 353 bpꎬ相差
进行 过 滤 筛 选ꎬ 得 到 高 质 量 的 有 效 序 列 ( clean 53 bpꎬ最长的是 7-1 号植株ꎬ最短的是 2 - 5 号植
data )ꎮ 使 用 GetOrganelle ( https:/ / github. com/ 株ꎻSSC 区长为 18 765 ~ 18 803 bpꎬ相差 38 bpꎻ反
Kinggerm/ GetOrganelle)进行 de novo 从头组装ꎬ得到 向重复 IR 区长度均为 26 054 bpꎬ说明种内基因组
叶绿体全基因组序列ꎮ 将组装好的基因组序列使 大小的差异主要来源于 LSC 区和 SSC 区ꎮ 基因组
用 CpGAVAS( Liu et al.ꎬ 2012) 自动进行注释ꎬ用 的 GC 含量在不同个体间无显著差异ꎬ全基因组的
Genious 9.1(Kearse et al.ꎬ 2012)进行校对和调整每 GC 含 量 均 为 37. 2%ꎬ 其 中 IR 区 的 GC 含 量 为
个注释基因的边界区域ꎬ采用 OGDRAW( Lohse et 42.7%ꎬLSC 区的 GC 含量为 35.2%ꎬSSC 区的 GC
al.ꎬ 2013)绘制叶绿体基因组物理图谱ꎮ 含量为 31.2%ꎮ
1.2.2 叶绿体基因组结构分析 利用 Geneious 软 2.2 中甸刺玫叶绿体基因组的基因构成
件对已上传到 NCBI、序列号为 MG450565.1 的中 由表 3 可知ꎬ中甸刺玫的叶绿体基因组共编码
甸刺玫叶绿体全基因组进行叶绿体全基因组编码 132 个功能基因ꎬ包括 87 个蛋白质编码基因ꎬ37
基因构成统计ꎮ 用 MEGA6( Tamura et al.ꎬ 2013) 个 tRNA 基因和 8 个 rRNA 基因ꎮ 其中ꎬ与光合作