Page 116 - 《广西植物》2025年第5期
P. 116
9 2 0 广 西 植 物 45 卷
数量、碱基数量、GC 含量、碱基质量ꎮ 利用 STAR 表 1 qRT ̄PCR 引物列表
v2.5.0 将 Clean data 与全长转录本进行序列比对ꎬ Table 1 List of qRT ̄PCR primers
获 取 其 在 转 录 本 上 的 位 置 信 息ꎮ 使 用 Kallisto 引物名称 引物序列 (5′ ̄3′)
v0.46.1 将 Clean data 与全长转录本进行比对并直 Primer name Primer sequence (5′ ̄3′)
18S rRNA ̄qF GGGCATTCGTATTTCATAGTCAGAG
接 计 数ꎬ 采 用 FPKM ( fragments per kilobase of
transcript per million fragments mapped) 作为衡量基 18S rRNA ̄qR CGGTTCTTGATTAATGAAAACATCCT
因表达水平的指标ꎮ 利用 DESeq v1.6.3 筛选不同 En108950 ̄qF ATGTCCTTGTGGGAGGAGGA
样品 间 ( 处 理 组 VS 对 照 组) 的 差 异 表 达 基 因 En108950 ̄qR CCTGCTGCTTGTTTGTTTCA
(differentially expressed genesꎬ DEGs)ꎬ 差 异 倍 数 En35573 ̄qF ACTCGTCGTTCGACTTTGCT
(fold changeꎬ FC)表示 2 个样品间表达量的比值ꎬ En35573 ̄qR CATGGGGAAGAACGACTTGA
使用 log FC 值筛选不同激素处理后 EnTCPs 中的 En10347 ̄qF ACCTCAACCAGATGCTGCAC
2
DEGsꎬ将 | Log FC | ≥1.50 且 P<0.01 作为筛选标 En10347 ̄qR GTGGAAGTGGATGGACTGGA
2
准ꎮ 并利用 TBtools v2.042 绘制热图ꎮ En16325 ̄qF CACAGCTCATCAACCTCGCC
通过实时荧光定量 PCR( qRT ̄PCR) 检测激素 En16325 ̄qR TTCTGGACCACGGTAGAGGC
响应的关键 EnTCP 基因的相对表达量ꎮ 具体流程 En128790 ̄qF CATGTTCGCCAGCCACGC
如下:使用 RNAprep Pure Plant Kit 试剂盒[天根生 En128790 ̄qR TGGTAGAACTGGCTGAGCAC
化科技( 北京) 有限公司ꎬ中国] 提 取 RNAꎬ利 用 En10346 ̄qF CACCAGCTTCAAATCCAGGT
NanoDrop ND ̄1000 ( Thermo Fisher Scientificꎬ
En10346 ̄qR CTTGTTGGAGCTCCGCTTC
WalthamꎬMAꎬUSA)评估 RNA 纯度ꎻ使用 5×All ̄In ̄
En14028 ̄qF GCGGCCACATCGGGTT
One RT MasterMix 试 剂 盒 ( with AccuRT Genomic
En14028 ̄qR CGCCGACCTGATGGTAGAAC
DNA Removal Kit) ( Cat. No. G492) 进行反转录ꎬ获
得 cDNAꎮ 利 用 在 线 软 件 Primer 3 ( https: / /
bioinfo.ut.ee / primer3 ̄0.4.0 / ) 设计特异性引物( 表 盖的基因使用蓝色标注ꎬ占比为71.5%ꎬ结果表明
去冗余后的转录本比对上已知基因集的基因较
1)ꎬ 以 18S rRNA 作 为 内 参 基 因ꎬ 使 用 Fast Start
Universal SYBR Green Master Mix( ROX) 试剂配制 多ꎬ转录本完整性较好ꎬ可用于后续分析ꎮ 全长转
20 μL 反应体系在 Applied Biosystems 7500 PCR 仪 录组数据上传至国家基因组科学数据中心ꎬGSA
上进行 qRT ̄PCR 实验ꎮ 每种反应设置 3 个重复ꎬ 编号为 CRA006867ꎮ
2.2 全长转录本 CDS 预测
-ΔΔCt
实验结果使用 2 方法计算基因的相对表达量ꎬ
通过对去冗余转录本序列的 CDS 区域及其对
利用 IBM SPSS Statistics 20.0 进行统计分析ꎮ
应氨基酸序列进行预测ꎬ共获得开放阅读框( open
2 结果与分析 reading frameꎬ ORF)81 782 个ꎬ其中完整开放阅读
框 39 157 个ꎮ CDS 编码的蛋白序列长度分布如图
2.1 全长转录组测序结果统计 2 所示ꎬ蛋白序列最长达 1 800 ~ 1 900 aaꎬ整体趋
在 PacBio 平台进行垂穗披碱草全长转录组测 势为蛋白序列越长ꎬ数量越少ꎮ
序ꎬ共获得全长转录组数据 36.96 Gbꎮ 原始数据 2.3 全长转录本功能注释
经过纠错和合并后得到 351 787 条 CCSꎬCCS 序列 将全长转录本序列在 8 个数据库中进行功能
平均长度为 1 719 bpꎻCCS 序列经过校正和聚类后 注释ꎬ结果(表 2)显示ꎬ共有 80 421 条转录本被注
得到 278 076 条全长非嵌合序列ꎻ对全长非嵌合序 释ꎬ占 总 转 录 本 数 量 的 88. 42%ꎬ 其 中 Nr、 Swiss ̄
列进行聚类后得到 131 224 条高质量一致序列ꎬ对 Prot、Pfam、GO、KOG、COG、eggNOG 和 KEGG 数据
高质量一致序列合并进行去冗余分析得到 90 956 库 分 别 注 释 了 78 155 ( 97. 18%)、 51 689
条非冗余转录本ꎮ 去冗余后的转录本基于通用单 (64.27%)、 54 044(67.20%)、62 355(77.50%)、
拷贝同源基因( benchmarking universal single ̄copy 39 964 ( 49. 69%)、 23 323 ( 29. 00%)、 64 538
orthologsꎬ BUSCOs) 评估其完整性(图 1)ꎬ 完全覆 (80.25%) 和 50 902(63.29%)条全长转录本ꎮ 在

