Page 53 - 《广西植物》2025年第5期
P. 53

5 期                     熊霜等: 三脉水丝梨叶绿体基因组特征及系统发育分析                                           8 5 7

            需要整合更多的基因或基因组数据ꎮ 随着二代测                             Repeat Finder 确定反向重复序列ꎬ再通过 NCBI 中
            序技术的发展ꎬ叶绿体全基因组广泛用于研究植                              的 blast 查 找 相 似 度 最 高 的 序 列 [ 蚊 母 树
            物的系统发育ꎮ 叶绿体基因组大小一般为 107 ~                          (Distylium racemosum)] 作为参考ꎬ并使用在线软
            218 kbꎬ测序成本低ꎬ较核基因组具有保守性、遗传                         件 GeSeq ( https: / / chlorobox. mpimp ̄golm. mpg. de /
            稳定性和不存在基因重组等优点ꎬ更适合应用于                              geseq.html)对序列进行注释(Tillich et al.ꎬ 2017)ꎮ

            植物系统发育和进化研究( Corriveau & Colemanꎬ                  将注释好的序列在 Geneious Prime 2023 进行手动
            1988ꎻ Grevich & Daniellꎬ 2005ꎻ Ravi et al.ꎬ 2008ꎻ  矫正ꎬ并将注释好的序列上传至 NCBI 数据库( 登
            Daniell et al.ꎬ 2016)ꎮ 水丝梨属中水丝梨的叶绿                 录号 为 PP625971 )ꎮ 通 过 在 线 软 件 CPGView
            体基因组有详细报道( Peng et al.ꎬ 2020)ꎬ而水丝                  (http: / / www.1kmpg. cn / / cpgview) 绘制三脉水丝
            梨属其余物种叶绿体基因组特征和系统发育相关                              梨叶绿体基因组的环形物理图谱ꎮ

            分析等尚未见详细报道ꎮ                                        1.3 叶绿体基因组重复序列与 SSR 分析
                 本研究对三脉水丝梨叶 绿 体 基 因 组 进 行 测                        使用 REPuter(Kurtz et al.ꎬ 2001) 检测三脉水
            序、组装和注释ꎬ结合公共数据库已有的金缕梅科                             丝梨叶绿体基因组的散在重复序列ꎬ具体参数设
            叶绿体基因组数据ꎬ进行了比较基因组和系统发                              定如下:最小重复长度为 30 bpꎬ汉明距离为 3ꎮ 使
            育分析ꎬ为探讨水丝梨属与假蚊母属、波斯铁木属                             用 MISA(Beier et al.ꎬ 2017) 分析三脉水丝梨叶绿
            及蚊母树属之间的关系提供新的分子证据ꎮ 本研                             体基因组的简单重复序列ꎬ参数设置单核苷酸到
            究拟探讨以下科学问题:(1) 三脉水丝梨的叶绿体                           六核苷酸的最小重复次数分别为 10、5、4、3、3 和
            基因组的分子结构ꎻ(2)三脉水丝梨叶绿体基因组                            3ꎮ 此 外ꎬ 串 联 重 复 序 列 通 过 Tandem Repeats
            的重复序列、SSRs 位点及密码子偏好性ꎻ(3) 基于                        Finder(Bensonꎬ 1999)进行分析ꎮ
            叶绿体基因组数据构建金缕梅科系统发育树ꎬ分                              1.4 密码子偏好性分析
            析三脉水丝梨的系统位置ꎮ                                           使用 Geneious Prime 2023 提取三脉水丝梨叶
                                                               绿体基因组的 CDS 序列ꎬ筛选出序列长度≥300
            1  材料与方法                                           bp 的 CDS 序列ꎬ重复序列只保留一条ꎬ确保序列
                                                               中碱基类型仅包含 A、T、C、G 且序列中间没有终
            1.1 研究材料及 DNA 提取、测序                                止密 码 子ꎮ 运 行 CodonW v1. 4. 2 软 件 ( Pedenꎬ
                 三脉水丝梨植物分子材料采集于昭通市大关                           2005) 计 算 相 对 同 义 密 码 子 使 用 度 ( relative
            县三江口林场(103°56′20″ E、28°12′47″ N)ꎬ选取                synonymous of condon usageꎬ RSCU) 和有效密码子
            生长状态良好的新鲜叶片ꎬ置于变色硅胶中进行                              数( effective number of codonꎬ ENC)ꎮ 用 EMBOSS
            干燥处理ꎬ样品编号为 08CS358ꎬ标本保存在中国                         ( https: / / www. bioinformatics. nl/ emboss ̄explorer / )
            科 学 院 昆 明 植 物 研 究 所 标 本 馆 ( 编 号:                   中的 CUSP 程序计算每条 CDS 序列的 GC 总含量
            KUN1325573)ꎮ 采用改良的 CTAB 法( Porebski et             以及密码子 3 个位置的 GC 含量(分别记作 GC 、
                                                                                                          all
            al.ꎬ 1997) 提取干燥叶片的 DNAꎬ并对 DNA 纯度                   GC 、GC 和 GC )ꎮ GC 和 GC 的平均值以及同义
                                                                      2
                                                                 1
                                                                                          2
                                                                                   1
                                                                            3
            进行分析( OD260 / OD280 为 1.91ꎻ浓度为 160.96              密码子第 3 位的 GC 含量分别记作 GC 和 GC ꎮ
                                                                                                         3S
                                                                                                  12
            ng μL )ꎮ 测 量 合 格 后 通 过 超 声 波 将 提 取 的                 对计算出的 ENC 值进行排序ꎬ两端各选出 5
                    ̄1
            DNA 破碎为 150 bp 片段构建文库来进行高通量                        个基因建立高、低 表 达 基 因 库ꎬ计 算 ΔRSCU 值ꎮ
            测序ꎬ测序共获得 2.1 G raw dataꎮ 测序产生的原                    选取 ΔRSCU>0.08 的密码子作为高表达密码子ꎮ
                                                               结合 RSCU>1 的高频率密码子与 ΔRSCU>0.08 高
            始 数 据 已 上 传 至 NCBI 数 据 库 ( Submission ID:
            SUB14370161ꎻ BioProject ID: PRJNA1098481)ꎮ         表达密码子得到最优密码子ꎮ
            1.2 叶绿体基因组的组装与注释                                       以每条序列的 ENC 和 GC 分别为纵坐标和横
                                                                                          3S
                 通过 fastp v0. 23. 2 对 原 始 数 据 进 行 质 控          坐标绘制 ENC ̄plot 散点图ꎮ 以每条序列的 GC 和
                                                                                                          3
            (Chenꎬ 2023)ꎬ随后使用 GetOrganelle v1.7.3.5 软          GC 分别为横坐标和纵坐标绘制散点图及拟合直
                                                                 12
                                                               线ꎬ并计算相关性ꎮ 利用软件 MEGA v7.0.26 计算
            件( Jin et al.ꎬ 2020) 对叶绿体基因组进行组装ꎮ
            组装好的序列先导入 Geneious Prime 2023 中使用                  密码子第 3 位每个碱基的含量(A 、T 、C 、G )ꎬ以
                                                                                                       3
                                                                                             3
                                                                                                 3
                                                                                                    3
   48   49   50   51   52   53   54   55   56   57   58