Page 36 - 广西植物2024年1期
P. 36

3 2                                    广  西  植  物                                         44 卷
            南宁市金花茶公园(108°21′43″ E、 22°49′30″ N)ꎬ               1.4.2 密码子中性绘图、ENC ̄plot 及 PR2 ̄plot 绘图
            采集单株新鲜幼嫩的叶片ꎬ装进有硅胶的自封袋                                在中性绘图分析中ꎬ以 GC12 和 GC3 做散点图ꎬ
            内低温保存ꎬ用于后续提取总 DNAꎬ标本保存在广                           研究密码子 3 个位置碱基之间的相关性ꎬ从而分
            西壮族自治区中国科学院广西植物研究所标本                               析突变压力和自然选择对于密码子偏好性的影响

            馆ꎬ标本凭证为 CSF2020003ꎮ                                (Wei et al.ꎬ 2014)ꎮ GC12 为 GC1 和 GC2 的平均
            1.2 DNA 提取和测序                                      值ꎮ 如果 GC12 和 GC3 之间显著相关ꎬ即 R 越大
                                                                                                       2
                 使用改良的 CTAB 法从越南小花金花茶干燥                        且趋于 1 时ꎬGC12 与 GC3 的相关程度越高ꎬ表明
            的叶片中提取总 DNAꎬ叶绿体基因组测序服务由                            突变压力是密码子使用偏向的决定因素ꎻ相反ꎬ如

            北京格致博雅生物科技有限公司提供ꎮ 使用 Fastp                         果相关性不显著ꎬ则回归曲线斜率偏低甚至接近
            软件处理测序获得的原始数据ꎬ除去过多的 N 序                            于 零ꎬ 表 明 密 码 子 偏 好 性 由 自 然 选 择 主 导

            列、接头序列和过短序列ꎬ输出大小为 1 005.18 Mb                      (Sueokaꎬ 1988)ꎮ
            的 clean dataꎬ用于后续的叶绿体基因组组装( Gu                         ENC ̄plot 绘图进一步分析了密码子偏好性受
            et al.ꎬ 2018)ꎮ                                     碱基组成对的影响ꎬ以 GC 为横坐标、有效密码子
                                                                                       3
            1.3 基因组组装注释和序列表征                                   数为 纵 坐 标 进 行 绘 制 散 点 图ꎬ 根 据 下 式 计 算:
                 使用 getOrganelle v1.7.6.1 组装 clean dataꎬ参      ENC = 2+ GC +29 / [ GC +(1 -GC ) ] ( 杨祥燕
                                                                                      2
                                                                                                  2
                                                                           3          3        3
            考数据库为 embplant_pt( 陆生植物叶绿体)ꎬ最大                     等ꎬ2021ꎻ辛雅萱等ꎬ2021)ꎮ 当密码子偏好性仅受
            扩充循环数为 20ꎬ调用 Spedas 的 K ̄mer 值为 21、                 突变影响时ꎬ基因将沿着或接近标准曲线分布ꎬ而
            45、65、85、105、127ꎻ拼接完成后用 Bandage 软件                 当基因落在标准曲线以下时则说明自然选择等因
            可视化(Jian et al.ꎬ 2018)ꎮ 使用叶绿体基因组在                  素是影响密码子偏好性的主要因素(Chakraborty et
            线注释 网 站 CPGAVAS2 ( http: / / 47. 96. 249. 172:     al.ꎬ 2020)ꎮ
            16019 / analyzer / home)ꎬ 以 C. parvipetala ( NC _      奇偶偏好性分析(parity rule 2 plotꎬ PR2 ̄plot)
            067089. 1 ) 为 参 照 基 因 组 进 行 注 释ꎮ 使 用               用于计算各密码子第 3 位 A、T、C、G 的含量ꎬ通常
            GB2sequin 检查序列分区是否存在颠倒并手动调                         用于估计突变压力和自然选择对密码子偏好性的
            整准 确 位 置ꎬ 得 到 完 整 的 注 释 结 果 ( Pascal &             影响(Xiang et al.ꎬ 2015)ꎮ 以 A3 / ( A3 +T3) 为 y
            Stephanꎬ 2018ꎻ Shi et al.ꎬ 2019)ꎮ 最后使用在线           轴ꎬG3 / (G3 +C3) 为 x 轴绘制 PR2 ̄plot 图ꎮ 中心
            网站 CPGview ( http: / / www. 1kmpg. cn / cpgview / )  点(A = Tꎬ G = C)意味着自然选择和突变压力之间
            绘制了叶绿体基因组圈图( Liu et al.ꎬ 2023)ꎮ 注                  没有偏差ꎮ 如果基因均匀分布在中心点周围ꎬ则
            释完成的叶绿体基因组提交至 GenBank 数据库ꎬ                         认为密码子偏好性可能完全是由突变压力造成
            登录号为 NC_069310.1ꎬ相应的 SRA、BioProject 和              的ꎬ否则ꎬ密码子的使用可能受到自然选择和其他
            BioSample 编号分别为 SRR20648317、PRJNA861872            因素的影响(Xiang et al.ꎬ 2015)ꎮ
            和 SAMN29930849ꎮ                                    1.5 重复序列分析
            1.4 密码子使用偏好性分析                                         使用在线网站 REPuter 对散在重复序列进行
            1.4.1 密码子相关参数计算  在剔除重复基因、含                         计算ꎮ 参数设置:最大计算重复次数 = 200ꎻ 最小
            有终 止 密 码 子 和 长 度 小 于 300 bp 的 编 码 序 列              重复序列>30 bpꎻ重复序列相似度>90%ꎻ汉明距
            (coding sequenceꎬ CDS)后ꎬ选取 52 条 CDS 序列进            离( Hamming Distance) = 3 ( Kurtz et al.ꎬ 2001)ꎮ
            行密码子分析ꎮ 使用 Codon W 1.4.2 软件对相对                     简单重复序列使用在线网站 MISA 进行鉴定和统

            同 义 密 码 子 使 用 度 ( relative synonymous codon        计分析ꎮ 各重复单元( unit size) 对应的最少重复
            usageꎬRSCU) 进行分析ꎮ 利用 EMBOSS 工具包中                   次数分别为 1 ~ 10、2 ~ 5、3 ~ 4、4 ~ 3、5 ~ 3、6 ~ 3ꎬ相

            的 CUSP 程序分析总 GC 含量以及第 1、第 2 和第 3                   邻 SSR 之间的最小单位间隔距离设置为 100 bp
            个碱基位置( GC1、GC2、GC3) 的 GC 含量ꎬCHIPS                  (Beier et al.ꎬ 2017)ꎮ
            程序用于分析有效密码子数( effective number of                  1.6 叶绿体基因组 IR 边界分析
            codonsꎬENC) ( 朱伟垚等ꎬ2022)ꎮ 采用 R 软件中                     基于 系 统 发 育 分 析 的 结 果ꎬ 以 簇 蕊 金 花 茶
            的 cor()函数计算相关性ꎮ                                    (C. fascicularis)叶绿体基因组为参考ꎬ使用本地部
   31   32   33   34   35   36   37   38   39   40   41