Page 50 - 《广西植物》2023年第11期
P. 50
2 0 1 0 广 西 植 物 43 卷
木的叶绿体全基因组序列( 序列号 NC_058874.1) 新测序的叶绿体基因组序列以及注释信息均已上
从 NCBI 数据库( https: / / www. ncbi. nlm. nih. gov / ) 传至 NCBI 数据库ꎬ并获得登录号ꎮ 采集信息及
下载ꎬ用作叶绿体基因组组装及注释的参考ꎬ所有 GenBank 登录号见表 1ꎮ
表 1 桃叶珊瑚属 6 种植物采集信息及 GenBank 登录号
Table 1 Collected informations and GenBank accession numbers of six Aucuba species
植物名 凭证标本 采集地点 GenBank 登录号
Plant name Voucher specimen Collection location GenBank accession number
峨眉桃叶珊瑚 李娟 LJ20210329026 四川峨眉山市峨眉山
A. omeiensis Li Juan LJ20210329026 Emei Mountainꎬ Emei Cityꎬ Sichuan OQ348516
桃叶珊瑚 李玉玲 LYL264 广东惠州市象头山
A. chinensis Li Yuling LYL264 Xiangtou Mountainꎬ Huizhou Cityꎬ Guangdong OQ348513
密花桃叶珊瑚 童毅 TY20081412 广西那坡县老虎跳大峡谷
A. confertiflora Tong Yi TY20081412 Laohutiao Valleyꎬ Napo Countyꎬ Guangxi OQ348514
花叶青木 童毅 TY20080506 广西桂林市桂林植物园
A. japonica var. variegata Tong Yi TY20080506 Guilin Botanical Gardenꎬ Guilin Cityꎬ Guangxi OQ348512
纤尾桃叶珊瑚 童毅 TY20080903 广西龙胜县红滩瀑布
A. filicauda Tong Yi TY20080903 Hongtan Waterfallꎬ Longsheng Countyꎬ Guangxi OQ348515
窄斑叶珊瑚 李娟 LJ20210329002 四川峨眉山市峨眉山
A. albopunctifolia var. angustula Li Juan LJ20210329002 Emei Mountainꎬ Emei Cityꎬ Sichuan OQ362998
珊瑚属叶绿体全基因组序列、两个单拷贝区以及
2 方法 一对反向重复区的长度、各区 GC 含量以及基因注
释结果等信息ꎮ
2.1 总基因组 DNA 提取与测序 2.4 密码子偏好性及最优密码子分析
采 用 改 良 的 CTAB 方 法 ( Doyle & Doyleꎬ 对 6 种桃叶珊瑚植物叶绿体基因组中的蛋白
1987)ꎬ从硅胶干燥的叶片中提取桃叶珊瑚属植物 编码基因序列( CDS) 进行筛选ꎬ剔除重复基因以
的总 DNAꎻ提取总 DNA 后ꎬ使用 B ̄500 超微量分 及长度小于 300 bp 的基因ꎬ序列中碱基类型仅包
光光度计(上海元析仪器有限公司) 以及琼脂糖凝
含 A、T、C、Gꎬ每条序列均含有起始密码子( ATG)
胶电泳检测所提 DNA 的质量和浓度ꎬ检测合格的
和终止密码子(TAG、TGA 和 TAA)ꎬ序列中间没有
DNA 测序工作委托深圳华大基因科技有限公司使
终止密码子ꎮ 最终每个叶绿体基因组序列均获得
用 DNBSEQ 测序平台进行二代测序ꎻ最终每个样
52 条 符 合 条 件 的 CDSꎬ 使 用 CodonW ( Pedenꎬ
品获得 3 Gb 的 clean dataꎮ
2005)软件计算这些序列的同义密码子相对使用
2.2 叶绿体全基因组的组装、注释以及物理图谱的绘制
度(RSCU)以及有效密码子数(ENC)ꎬ所得数据在
首先ꎬ 使 用 GetOrganelle ̄1. 7. 3. 5. ( Jin et al.ꎬ
Excel 进行整理ꎬ并用 TBtools( Chen et al.ꎬ 2020)
2020)软件进行叶绿体基因组拼接组装ꎬk ̄mer 值
软件绘制热图ꎮ 密码子中 RSCU 值大于 1 的被确
设置 65、105、127ꎬ线程 t 设置 24ꎬ其他命令使用默
定为高频密码子( Wang et al.ꎬ 2018)ꎮ 同时满足
认参数ꎬ 最 终 的 组 装 命 令 为 get_ organelle _ from _
高频及高表达条件的密码子被认定为最优密码子
reads.py  ̄1 sample_1.fastq.gz  ̄2 sample_2.fastq.gz  ̄F
( Sharp & Liꎬ 1987)ꎮ 高 表 达 基 因 具 有 较 低 的
embplant pt  ̄o output ̄plastome  ̄R 10  ̄t 24  ̄k 65ꎬ
105ꎬ127ꎻ然后ꎬ以青木的叶绿体全基因组序列作 ENC 值ꎬ 低 表 达 基 因 具 有 较 高 的 ENC 值ꎬ 按 照
为参考ꎬ利用 PGA ̄master( Qu et al.ꎬ 2019) 软件对 ENC 值的大小对每个物种的基因进行排序ꎬ选取
高低两端各 10%的基因分别作为低表达基因组和
组装出的叶绿体基因组进行注释ꎬ使用 Geneious R
9.0.2( Basicꎬ 2012) 软件对 PGA ̄master 的注释结 高表达基因组ꎬ计算高表达基因组和低表达基因
组每个密码子的差值 ΔRSCUꎬΔRSCU 大于 0.08 则
果进 行 手 动 校 正ꎻ 最 后ꎬ 使 用 在 线 软 件 OGDraw
(Lohse et al.ꎬ 2013)绘制叶绿体基因组物理图谱ꎮ 定为高表达密码子ꎬ筛选出高达表密码子中 RSCU
2.3 叶绿体基因组特征分析 值大于 1 的高频密码子ꎬ即得最优密码子(Sharp &
使用 Geneious R 9.0.2 软件分别统计 6 种桃叶 Liꎬ 1987)ꎮ