Page 36 - 广西植物2024年1期
P. 36
3 2 广 西 植 物 44 卷
南宁市金花茶公园(108°21′43″ E、 22°49′30″ N)ꎬ 1.4.2 密码子中性绘图、ENC ̄plot 及 PR2 ̄plot 绘图
采集单株新鲜幼嫩的叶片ꎬ装进有硅胶的自封袋 在中性绘图分析中ꎬ以 GC12 和 GC3 做散点图ꎬ
内低温保存ꎬ用于后续提取总 DNAꎬ标本保存在广 研究密码子 3 个位置碱基之间的相关性ꎬ从而分
西壮族自治区中国科学院广西植物研究所标本 析突变压力和自然选择对于密码子偏好性的影响
馆ꎬ标本凭证为 CSF2020003ꎮ (Wei et al.ꎬ 2014)ꎮ GC12 为 GC1 和 GC2 的平均
1.2 DNA 提取和测序 值ꎮ 如果 GC12 和 GC3 之间显著相关ꎬ即 R 越大
2
使用改良的 CTAB 法从越南小花金花茶干燥 且趋于 1 时ꎬGC12 与 GC3 的相关程度越高ꎬ表明
的叶片中提取总 DNAꎬ叶绿体基因组测序服务由 突变压力是密码子使用偏向的决定因素ꎻ相反ꎬ如
北京格致博雅生物科技有限公司提供ꎮ 使用 Fastp 果相关性不显著ꎬ则回归曲线斜率偏低甚至接近
软件处理测序获得的原始数据ꎬ除去过多的 N 序 于 零ꎬ 表 明 密 码 子 偏 好 性 由 自 然 选 择 主 导
列、接头序列和过短序列ꎬ输出大小为 1 005.18 Mb (Sueokaꎬ 1988)ꎮ
的 clean dataꎬ用于后续的叶绿体基因组组装( Gu ENC ̄plot 绘图进一步分析了密码子偏好性受
et al.ꎬ 2018)ꎮ 碱基组成对的影响ꎬ以 GC 为横坐标、有效密码子
3
1.3 基因组组装注释和序列表征 数为 纵 坐 标 进 行 绘 制 散 点 图ꎬ 根 据 下 式 计 算:
使用 getOrganelle v1.7.6.1 组装 clean dataꎬ参 ENC = 2+ GC +29 / [ GC +(1 -GC ) ] ( 杨祥燕
2
2
3 3 3
考数据库为 embplant_pt( 陆生植物叶绿体)ꎬ最大 等ꎬ2021ꎻ辛雅萱等ꎬ2021)ꎮ 当密码子偏好性仅受
扩充循环数为 20ꎬ调用 Spedas 的 K ̄mer 值为 21、 突变影响时ꎬ基因将沿着或接近标准曲线分布ꎬ而
45、65、85、105、127ꎻ拼接完成后用 Bandage 软件 当基因落在标准曲线以下时则说明自然选择等因
可视化(Jian et al.ꎬ 2018)ꎮ 使用叶绿体基因组在 素是影响密码子偏好性的主要因素(Chakraborty et
线注释 网 站 CPGAVAS2 ( http: / / 47. 96. 249. 172: al.ꎬ 2020)ꎮ
16019 / analyzer / home)ꎬ 以 C. parvipetala ( NC _ 奇偶偏好性分析(parity rule 2 plotꎬ PR2 ̄plot)
067089. 1 ) 为 参 照 基 因 组 进 行 注 释ꎮ 使 用 用于计算各密码子第 3 位 A、T、C、G 的含量ꎬ通常
GB2sequin 检查序列分区是否存在颠倒并手动调 用于估计突变压力和自然选择对密码子偏好性的
整准 确 位 置ꎬ 得 到 完 整 的 注 释 结 果 ( Pascal & 影响(Xiang et al.ꎬ 2015)ꎮ 以 A3 / ( A3 +T3) 为 y
Stephanꎬ 2018ꎻ Shi et al.ꎬ 2019)ꎮ 最后使用在线 轴ꎬG3 / (G3 +C3) 为 x 轴绘制 PR2 ̄plot 图ꎮ 中心
网站 CPGview ( http: / / www. 1kmpg. cn / cpgview / ) 点(A = Tꎬ G = C)意味着自然选择和突变压力之间
绘制了叶绿体基因组圈图( Liu et al.ꎬ 2023)ꎮ 注 没有偏差ꎮ 如果基因均匀分布在中心点周围ꎬ则
释完成的叶绿体基因组提交至 GenBank 数据库ꎬ 认为密码子偏好性可能完全是由突变压力造成
登录号为 NC_069310.1ꎬ相应的 SRA、BioProject 和 的ꎬ否则ꎬ密码子的使用可能受到自然选择和其他
BioSample 编号分别为 SRR20648317、PRJNA861872 因素的影响(Xiang et al.ꎬ 2015)ꎮ
和 SAMN29930849ꎮ 1.5 重复序列分析
1.4 密码子使用偏好性分析 使用在线网站 REPuter 对散在重复序列进行
1.4.1 密码子相关参数计算 在剔除重复基因、含 计算ꎮ 参数设置:最大计算重复次数 = 200ꎻ 最小
有终 止 密 码 子 和 长 度 小 于 300 bp 的 编 码 序 列 重复序列>30 bpꎻ重复序列相似度>90%ꎻ汉明距
(coding sequenceꎬ CDS)后ꎬ选取 52 条 CDS 序列进 离( Hamming Distance) = 3 ( Kurtz et al.ꎬ 2001)ꎮ
行密码子分析ꎮ 使用 Codon W 1.4.2 软件对相对 简单重复序列使用在线网站 MISA 进行鉴定和统
同 义 密 码 子 使 用 度 ( relative synonymous codon 计分析ꎮ 各重复单元( unit size) 对应的最少重复
usageꎬRSCU) 进行分析ꎮ 利用 EMBOSS 工具包中 次数分别为 1 ~ 10、2 ~ 5、3 ~ 4、4 ~ 3、5 ~ 3、6 ~ 3ꎬ相
的 CUSP 程序分析总 GC 含量以及第 1、第 2 和第 3 邻 SSR 之间的最小单位间隔距离设置为 100 bp
个碱基位置( GC1、GC2、GC3) 的 GC 含量ꎬCHIPS (Beier et al.ꎬ 2017)ꎮ
程序用于分析有效密码子数( effective number of 1.6 叶绿体基因组 IR 边界分析
codonsꎬENC) ( 朱伟垚等ꎬ2022)ꎮ 采用 R 软件中 基于 系 统 发 育 分 析 的 结 果ꎬ 以 簇 蕊 金 花 茶
的 cor()函数计算相关性ꎮ (C. fascicularis)叶绿体基因组为参考ꎬ使用本地部