Page 115 - 《广西植物》2025年第5期
P. 115

5 期               彭晓梅等: 垂穗披碱草 TCP 转录因子家族鉴定及激素响应模式分析                                         9 1 9

            书指示进行操作ꎮ 将提取的总 RNA 进行质量检                           Genomes)数据库进行 BLAST 比对分析ꎬ获取转录
            测: 使 用 NanoDrop ND ̄1000 ( Thermo Fisher            本注释信息ꎬ同时评估垂穗披碱草与其他物种基
            Scientificꎬ Walthamꎬ MAꎬ USA)评估 RNA 纯度ꎻ使           因序列的相似性ꎮ

            用 Agilent Bioanalyzer 2100 ( Agilent Technologiesꎬ  1.6 TCP 转录因子家族成员的鉴 定 及 理 化 性 质
            Santa Claraꎬ CAꎬ USA) 的 RNA Nano 6000 Assay        分析
            Kit 试剂盒评估 RNA 质量ꎮ 将检测合格的总 RNA                          从 PFAM 数据库(http: / / pfam.xfam.org / ) 下载
            样品进行文库构建ꎮ                                          TCP 转录因子家族保守结构域的隐马尔可夫模型
            1.3 文库构建、Illumina 测序和 SMRT 测序                      文件(PF03634)ꎬ通过 HMMER 3.0 软件在垂穗披

                 RNA 样品质量检测合格后ꎬ使用 TruSeq RNA                   碱草全长转录组蛋白序列中初步筛选 TCP 转录因
            library Prep Kit (Illuminaꎬ CAꎬ USA) 构建 Illumina   子家族成员ꎻ将筛选到的 TCP 转录因子家族成员
            测序文库ꎻ将 27 个样品的 RNA 等质量混样后ꎬ使                        进 一 步 使 用 PFAM、 SMART 数 据 库 ( http: / /

            用 SMRTbell Template Prep Kit(Pacific Biosciencesꎬ  smart. embl ̄heidelberg. de / ) 和 NCBI CDD 数 据 库
            Menlo Parkꎬ CAꎬ USA) 构建 SMRT 测序文库ꎮ 文               ( https: / / www. ncbi. nlm. nih. gov / Structure / bwrpsb /
            库经质检合格后进行测序ꎬ测序方法参照操作手                              bwrpsb.cgi)进行序列比对和确认ꎬ舍弃重复、冗余
            册进行ꎮ 以上文库构建及测序工作由百迈客生物                             和注释不完整的序列ꎬ保留下来的序列即为垂穗
            科技有限公司完成ꎮ                                          披碱草 TCP 转录因子家族成员ꎮ 利用在线软件
            1.4 全长转录组测序数据质量控制                                  ExPASy ̄ProtParam ( https: / / web.  expasy.  org /
                 使用 SMRT Link v10.1 软件中的 IsoSeq 模块             protparam / )分析 TCP 蛋白一级结构的理化性质ꎬ
            对全长转录组原始测序数据进行预处理和过滤ꎬ                              包括氨基酸数量、分子量(mocular weightꎬ MW) 以
            按默认参数设置ꎬ统计以下项目:环形一致性序列                             及 等 电 点 ( isoelectric pointꎬ pI )ꎮ 利 用 TargetP
            (circular consensus sequencingꎬ CCS) 的数量、全长        ( https: / / services.  healthtech.  dtu.  dk / services/
            非嵌合序列( full ̄length non ̄chimeric readsꎬ FLNC)       TargetP ̄2.0 / )对 TCP 蛋白进行亚细胞定位预测ꎬ
            的数量及平均长度、聚类分析后得到高质量一致                              同 时 使 用 在 线 软 件 CELLO ( http: / / cello. life.
            性序列的数量ꎮ 利用 CD ̄HIT v4.6.1 通过序列比                     nctu.edu.tw / )对预测结果进行二次确认ꎬ确保预测
            对聚类 法 去 除 冗 余ꎬ 参 数 设 置 如 下: ̄c 0. 95  ̄aS            结果的可信度ꎮ
            0.95  ̄aL 0.95  ̄AS 60  ̄AL 60ꎻ最终输出 1 个非冗余            1.7 EnTCPs 系统进化及保守基序分析
            的序列文件ꎬ去冗余后的基因即为 Unigenesꎮ 利用                           通过 PlantTFDB 植物转录因子数据库(http: / /
            BUSCO v3.0.2 将 OrthoDB 作为参考数据库ꎬ将去                  planttfdb.gao ̄lab.org / )下载模式植物拟南芥和水稻
            冗余后的转录本比对到近源物种的基因集ꎬ对去                              的 TCP 转 录 因 子 家 族 成 员 的 蛋 白 序 列ꎻ 利 用
            冗 余 后 的 转 录 组 进 行 完 整 性 评 估ꎮ 使 用                   MEGA X 软件的 ClustalW 模块对拟南芥、水稻和垂
            TransDecoder v5.0.0 对去冗余转录本的编码区序                   穗披碱草 TCP 蛋白进行多序列比对ꎬ使用邻接法
            列(coding sequenceꎬ CDS)及其对应氨基酸序列进                  (neighbor ̄joining methodꎬ NJ) 构 建 垂 穗 披 碱 草

            行预测ꎮ                                               TCP 转 录 因 子 家 族 的 系 统 进 化 树ꎬ 自 展 值
            1.5 全长转录本功能注释                                      (bootstraps) 设 置 为 1 000ꎻ 利 用 在 线 软 件 iTOL

                 将非 冗 余 全 长 转 录 本 在 Nr ( NCBI Non ̄             (https: / / itol.embl.de / ) 美化进化树ꎮ 使用在线软
            Redundant Protein Sequence Database)、 Swiss ̄Prot   件 MEME( http: / / meme ̄suite. org / ) 分析 TCP 蛋白
            ( Swiss ̄Prot Protein Sequence Database )、 Pfam     保 守 Motifꎬ 参 数 设 置 如 下: any number of
            ( Protein family )、 GO ( Gene Ontology )、 KOG      Repetitions( anr)ꎬ maximum number of Motifs = 10ꎬ
            ( Clusters of Orthologous Groups for Eukaryotic    minimum width≥6ꎬ and maximum width≤50ꎮ
            Complete Genomes)、 COG ( Clusters of Orthologous   1.8 二代转录组测序数据质量控制及 EnTCPs 表
            Groups of Proteins)、eggNOG(Evolutionary Genealogy  达量分析
            of  Genes:   Non ̄supervised  Orthologous  Groups       对 Illumina 测序平 台 获 得 的 27 份 原 始 数 据
            Database)、KEGG( Kyoto Encyclopedia of Genes and    (raw data) 进行过滤得到 Clean dataꎬ并统计 Read
   110   111   112   113   114   115   116   117   118   119   120