Page 53 - 《广西植物》2025年第5期
P. 53
5 期 熊霜等: 三脉水丝梨叶绿体基因组特征及系统发育分析 8 5 7
需要整合更多的基因或基因组数据ꎮ 随着二代测 Repeat Finder 确定反向重复序列ꎬ再通过 NCBI 中
序技术的发展ꎬ叶绿体全基因组广泛用于研究植 的 blast 查 找 相 似 度 最 高 的 序 列 [ 蚊 母 树
物的系统发育ꎮ 叶绿体基因组大小一般为 107 ~ (Distylium racemosum)] 作为参考ꎬ并使用在线软
218 kbꎬ测序成本低ꎬ较核基因组具有保守性、遗传 件 GeSeq ( https: / / chlorobox. mpimp ̄golm. mpg. de /
稳定性和不存在基因重组等优点ꎬ更适合应用于 geseq.html)对序列进行注释(Tillich et al.ꎬ 2017)ꎮ
植物系统发育和进化研究( Corriveau & Colemanꎬ 将注释好的序列在 Geneious Prime 2023 进行手动
1988ꎻ Grevich & Daniellꎬ 2005ꎻ Ravi et al.ꎬ 2008ꎻ 矫正ꎬ并将注释好的序列上传至 NCBI 数据库( 登
Daniell et al.ꎬ 2016)ꎮ 水丝梨属中水丝梨的叶绿 录号 为 PP625971 )ꎮ 通 过 在 线 软 件 CPGView
体基因组有详细报道( Peng et al.ꎬ 2020)ꎬ而水丝 (http: / / www.1kmpg. cn / / cpgview) 绘制三脉水丝
梨属其余物种叶绿体基因组特征和系统发育相关 梨叶绿体基因组的环形物理图谱ꎮ
分析等尚未见详细报道ꎮ 1.3 叶绿体基因组重复序列与 SSR 分析
本研究对三脉水丝梨叶 绿 体 基 因 组 进 行 测 使用 REPuter(Kurtz et al.ꎬ 2001) 检测三脉水
序、组装和注释ꎬ结合公共数据库已有的金缕梅科 丝梨叶绿体基因组的散在重复序列ꎬ具体参数设
叶绿体基因组数据ꎬ进行了比较基因组和系统发 定如下:最小重复长度为 30 bpꎬ汉明距离为 3ꎮ 使
育分析ꎬ为探讨水丝梨属与假蚊母属、波斯铁木属 用 MISA(Beier et al.ꎬ 2017) 分析三脉水丝梨叶绿
及蚊母树属之间的关系提供新的分子证据ꎮ 本研 体基因组的简单重复序列ꎬ参数设置单核苷酸到
究拟探讨以下科学问题:(1) 三脉水丝梨的叶绿体 六核苷酸的最小重复次数分别为 10、5、4、3、3 和
基因组的分子结构ꎻ(2)三脉水丝梨叶绿体基因组 3ꎮ 此 外ꎬ 串 联 重 复 序 列 通 过 Tandem Repeats
的重复序列、SSRs 位点及密码子偏好性ꎻ(3) 基于 Finder(Bensonꎬ 1999)进行分析ꎮ
叶绿体基因组数据构建金缕梅科系统发育树ꎬ分 1.4 密码子偏好性分析
析三脉水丝梨的系统位置ꎮ 使用 Geneious Prime 2023 提取三脉水丝梨叶
绿体基因组的 CDS 序列ꎬ筛选出序列长度≥300
1 材料与方法 bp 的 CDS 序列ꎬ重复序列只保留一条ꎬ确保序列
中碱基类型仅包含 A、T、C、G 且序列中间没有终
1.1 研究材料及 DNA 提取、测序 止密 码 子ꎮ 运 行 CodonW v1. 4. 2 软 件 ( Pedenꎬ
三脉水丝梨植物分子材料采集于昭通市大关 2005) 计 算 相 对 同 义 密 码 子 使 用 度 ( relative
县三江口林场(103°56′20″ E、28°12′47″ N)ꎬ选取 synonymous of condon usageꎬ RSCU) 和有效密码子
生长状态良好的新鲜叶片ꎬ置于变色硅胶中进行 数( effective number of codonꎬ ENC)ꎮ 用 EMBOSS
干燥处理ꎬ样品编号为 08CS358ꎬ标本保存在中国 ( https: / / www. bioinformatics. nl/ emboss ̄explorer / )
科 学 院 昆 明 植 物 研 究 所 标 本 馆 ( 编 号: 中的 CUSP 程序计算每条 CDS 序列的 GC 总含量
KUN1325573)ꎮ 采用改良的 CTAB 法( Porebski et 以及密码子 3 个位置的 GC 含量(分别记作 GC 、
all
al.ꎬ 1997) 提取干燥叶片的 DNAꎬ并对 DNA 纯度 GC 、GC 和 GC )ꎮ GC 和 GC 的平均值以及同义
2
1
2
1
3
进行分析( OD260 / OD280 为 1.91ꎻ浓度为 160.96 密码子第 3 位的 GC 含量分别记作 GC 和 GC ꎮ
3S
12
ng μL )ꎮ 测 量 合 格 后 通 过 超 声 波 将 提 取 的 对计算出的 ENC 值进行排序ꎬ两端各选出 5
 ̄1
DNA 破碎为 150 bp 片段构建文库来进行高通量 个基因建立高、低 表 达 基 因 库ꎬ计 算 ΔRSCU 值ꎮ
测序ꎬ测序共获得 2.1 G raw dataꎮ 测序产生的原 选取 ΔRSCU>0.08 的密码子作为高表达密码子ꎮ
结合 RSCU>1 的高频率密码子与 ΔRSCU>0.08 高
始 数 据 已 上 传 至 NCBI 数 据 库 ( Submission ID:
SUB14370161ꎻ BioProject ID: PRJNA1098481)ꎮ 表达密码子得到最优密码子ꎮ
1.2 叶绿体基因组的组装与注释 以每条序列的 ENC 和 GC 分别为纵坐标和横
3S
通过 fastp v0. 23. 2 对 原 始 数 据 进 行 质 控 坐标绘制 ENC ̄plot 散点图ꎮ 以每条序列的 GC 和
3
(Chenꎬ 2023)ꎬ随后使用 GetOrganelle v1.7.3.5 软 GC 分别为横坐标和纵坐标绘制散点图及拟合直
12
线ꎬ并计算相关性ꎮ 利用软件 MEGA v7.0.26 计算
件( Jin et al.ꎬ 2020) 对叶绿体基因组进行组装ꎮ
组装好的序列先导入 Geneious Prime 2023 中使用 密码子第 3 位每个碱基的含量(A 、T 、C 、G )ꎬ以
3
3
3
3

