Page 89 - 《广西植物》2022年第10期
P. 89
10 期 陈模舜等: 基于叶绿体基因组 SNP 的天台鹅耳枥谱系结构与分化分析 1 7 0 7
ycf1 基因具有 2 个串联重复ꎮ 其中 LSC 和 SSC 区 2.4 cpDNA 变异检测
域共 有 25 个 rps12 基 因 串 联 重 复ꎬ IR 有 10 个 单核苷酸多态性( SNP) 和基因组结构变异在
rps12 串联重复基因ꎮ 进化 过 程 中 至 关 重 要 ( Britten et al.ꎬ 2003 )ꎮ
在 cpDNA 中有 87 个不同的 SSR 类型重复了 cpDNA 结构性变异有插入 / 缺失、转换、颠换和基
10 次以上ꎬ其中单核苷酸的数量最多ꎬ平均有 50 因组结构重排ꎮ 在 26 个天台鹅耳枥 cpDNA 中鉴
个ꎬ占总数的 57.47%ꎻ其次是四核苷酸ꎬ为 14 个ꎬ 定了 314 条 SNPsꎬJST 居群 SNPs 平均为 132 条、
二核苷酸为 12 个ꎬ三核苷酸、复合核苷酸各为 4 QYH 为 126 条、PDS 为 18 条、PGS 为 18 条、PQJ
个ꎬ五核苷酸发现的比较少ꎬ为 3 个ꎬ而六核苷酸 为 8 条、 THS 为 12 条ꎮ 以 居 群 植 株 与 THS _ 1
没有发现(图 3)ꎮ 在 cpDNA 中发现的 SSR 通常由 cpDNA 比 对ꎬ 结 果 表 明 JST 居 群 碱 基 颠 换 数
A / T 重复组成ꎬ很少包含 G∕C 串联重复序列ꎬ其中 (transversionꎬTv)平均为 95 个、QYH 为 90 个、PDS
单核苷酸由 A / T 碱基组成ꎬ占 92%ꎬ这些 SSR 丰富 为 16 个、PGS 为 15 个、PQJ 为 6 个、THS 为 12 个
了 cpDNA 的 ATꎮ cpSSR 碱基重复序列中 10 条占 (表 3)ꎮ 研究的所有成对序列比较表明ꎬ颠换次
31.20%、11 条占 16.95%、12 条占34.44%、13 条占 数多于 转 换 次 数ꎬ 这 在 其 他 分 类 群 中 也 被 发 现
5.65%、14 条以上占 11.76%( 图 4)ꎮ cpSSR 分区 (Stoltzfus & Norrisꎬ 2016)ꎮ
IRA、 IRB 各 占 6. 58%ꎬ LSC 占 68.59%ꎬ SSC 占 2.5 IR 区域与边界的扩张收缩
17.96%ꎬ其中 LSC 重复序列最多( 图 5)ꎮ 在天台 被子植物的 cpDNA 是高度保守的ꎬIR 区域和
鹅耳枥 cpDNA 中ꎬ观察到 SSR 具有丰富的碱基重 单拷贝(single copyꎬSC)边界区域的扩展和收缩是
复和重复条数ꎬ可以作为居群进化研究有用的遗 造成高等植物 cpDNA 长度变化的主要机制( Saina
传信息ꎮ et al.ꎬ 2018)ꎮ 比 较 26 个 完 整 的 天 台 鹅 耳 枥
2.3 密码子偏好性分析 cpDNA 的 IR∕SC 边界区域ꎬ发现在连接位置上有
密码子在遗传信息的传递中起着重要作用ꎬ 明显差异ꎮ 其中ꎬrpl2 基因的长度都是 1 513 bpꎬ
是核酸和蛋白质之间的联系ꎮ 通过对所有蛋白质 其端点 较 保 守ꎬ离 JLA、 JLB 基 因 间 隔 区 都 是 71
编码的 cpDNA 和氨基酸序列进行统计分析ꎬ天台 bpꎮ trnN ̄GUU 的长度是 72 bpꎬ离 JSB、JSA 基因间
鹅耳枥 cpDNA 序列的 65.65%是蛋白编码基因ꎬ结 隔区变化为 1 516 ~ 1 864 bpꎬ不超过以下基因间隔
果显示蛋白质密码子的相似性ꎬ其中 AUG、UUA、 区的终点ꎮ rps19 基因在 JSB∕IRb 边界处由 JSB 向
AGA、GCU、UCU 的频率较高ꎬ而 CUG、GUG、AGC、 IRb 延伸 3 bpꎮ ycf1 基因跨越 JSA∕IRa 区ꎬ4 211~
CUC、CUG 的频率较低( 图 6)ꎮ 在这些密码子中ꎬ 4 553 bp位于 SSC 区域内ꎬ向 IRb 延伸1 192~ 1 540
蛋白质编码基因中最常见的氨基酸是异亮氨酸 bp(图 8)ꎮ 这 4 个 cpDNA 中 IR/ SC 边界处的变异
(Ile)ꎬ其在 cpDNA 中出现 1 146 次ꎮ 相对同义密 导致了整个 cpDNA 序列长度的差异ꎬ并在其他植物
码子使用( relative synonymous codon usageꎬRSCU) 中也已发现(Yin et al.ꎬ 2018)ꎮ
值分 析 表 明ꎬ 色 氨 酸 ( Trp ) 蛋 白 质 编 码 基 因 2.6 基于完整的 cpDNA 序列的群体分析
RSCU = 1ꎬ 表 示 该 密 码 子 没 有 偏 好 性ꎮ 其 中: 2.6.1 单倍型网络构建 通过天台鹅耳枥 cpDNA
47.62% 密 码 子 的 RSCU > 1ꎬ 大 多 数 ( 28 / 30ꎬ 93. 分析ꎬ运用一段遗传连锁的核酸序列的变异来区
33%)以 A 或 T(U)结尾ꎻ50.79%密码子的 RSCU< 分ꎬ构建单倍型网络( haplotype network)ꎮ 在系统
1ꎬ大多数(30 / 32ꎬ93.75%)以 C 或 G 结尾(图 6)ꎮ 发育分析时ꎬ核苷酸碱基一个插入或缺失作为一
在天台鹅耳枥物种的蛋白质编码 cpDNA 中ꎬ 次进化事件进行编码分析ꎮ 天台鹅耳枥单倍型中
20 个氨基酸由 63 个密码子编码ꎬ其中除天冬氨酸 的大多数具有居群单倍型ꎬ几乎没有观察到居群
(Asp)外ꎬ大多数氨基酸都具有密码子偏好性ꎮ 总 之间的 单 倍 型 共 享ꎮ 在 地 理 上 接 近 的 天 台 县
共确定了 40 个密码子偏好ꎬ其中涉及 19 个氨基 (THS)(H1 ~ H3)、景宁县( JST) ( H4 ~ H6)、磐安
酸ꎮ 在优选的密码子中ꎬ63.49%表现出较高的偏 县大盘山(PDS) ( H7 ~ H9)ꎬ各居群内具有相同单
好( 图 7)ꎮ 该 结 果 进 一 步 揭 示 了 天 台 鹅 耳 枥 倍型ꎻ而磐安县青明尖( PQJ) H10、磐安县高姥山
cpDNA 的相对保守性ꎬ因为高密码子偏好也是高 (PGS)H11 和青田县( PQJ) H12 是在单个标本中
等植物中的常见现象(喻凤和韩明ꎬ2021)ꎮ 发现的私有单倍型ꎮ 根据统计单倍型网络图( 图