Page 23 - 《广西植物》2021年第4期
P. 23
࿗ 期 夏铭泽等᧥ 多裂骆驼蓬叶片转录组分析 ጢ ԡ ጢ
ВႿᔽ੫ᔀႿᔀ 通过 ఋʢᑕႿ༁᧕ᔀዹᆍʛᔀʢ 软件预测其 ऊ᧕୩ 序列ᤥ
ϟজ 材料与方法 ϟ࿗ ୩શ۪ 和 ୩୩ 的 筛 选与统计 জ 以组装好的
ВႿᔽ੫ᔀႿᔀ 作为参考序 列ᖔ 使用 ାऊèᡷᆍᆍ༁ ྉ 版本为
ϓॹϓ 材料 ࿗ሕɯྉ͐ࣼᔽႿᑕႿᖔԡϟԡɯ找出其中的 ୩શ۪ 位点ᖔ参数
多裂骆驼蓬植株采自青 海省共和县铁盖乡 为质量值大于 ԡ 且覆盖度大于 ऐᖔ对 筛 选出的
ྉሕᤃԡᤃࣕጢᤃᤃϟ× શܦϟԡԡ࿗ϟࣕ࿗ϟᎮ࿗× ጶᖔ ጢँ࿗ ቝɯᤥ 将 ୩શ۪ 突变类型进行统计分析ᤥ 使用 ᥘ᧧୩ዶྉ版本为
采集的成熟植物叶片放入液氮中快速冷冻ᖔ返回 ϟԡϟɯྉఋၤᔽᔀᖔԡԡሕɯ检测 ВႿᔽ੫ᔀႿᔀ 序列中的 ୩୩ 信
实验室后放入ͱऐԡ ቩ 超低温冰箱保存ᤥ 凭证标本 息ᖔ检 测 的类型包括完美型 ྉ ᡱᔀʢᔀዹᡷɯ 及复合型
ྉԻၤᑕႿ੫ԡϟऐԡϟሕɯ存放在中国科学院西北高原生物 ྉዹᆍቝᡱᆍࣼႿʛɯ的 ୩୩ᤥ 微卫星各重复单元的筛选标
研究所青藏高原生物标本馆ྉ̀શۼ۪ɯ中ᤥ 准为二核苷酸 ୩୩ 至少重复 ᤃ 次ᖔ三核苷酸 ୩୩
ϓॹԣ 方法 至少重复 ጢ 次ᖔ四核苷酸至少重复 ጢ 次ᖔ五核苷酸
ϟϟ શዶ 提取জ 从多裂骆驼蓬的叶片材料中提取 至少 重 复 ጢ 次ᖔ 六核苷酸至 少 重 复 ጢ 次ᤥ 使用
总 શዶᖔ用琼脂糖凝胶电泳分析 શዶ 的降解程度 ጶዹᔀྉ版本为 ᥘᔽዹʢᆍ༁ᆍᡷ ᨃᔽዹᔀ ԡϟᤃɯ软件对 ୩୩ 的
以及是否有污染ଫ用 શᑕႿᆍʛʢᆍᡱ ԡԡԡ 初步检测 શዶ 类型ܦ数量等进行统计分析ᤥ
的纯度ྉዶᤃԡᣰ ዶऐԡ 应在 ϟ ँ ጲ ԡ 范围内ɯଫ使用
ዶ੫ᔽᔀႿᡷ ϟԡԡ 测定样品的 ᧧શ 值以确定 શዶ 完整性ᤥ জ 结果与分析
ϟ 拼接组装জ 利用 ᧧ࣼቝᔽႿᑕ ̀ᔽ༁ᔀी ጢԡԡ 高通量
测序 平 台 进行测序ᖔ 得到的原始图像数据由 ԣॹϓ 转录组数据组装及 ІႥᔠᓣႥᓣ 获取
ऊዶ୩ዶዶ 碱基识别ྉ ᤦᑕ༁ᔀ ዹᑕᔽႿ੫ɯ 后转化为原始测 对多裂骆驼蓬叶片 ቝશዶ 进行测序ᖔ共获得
序数据ྉᑕऔ ʢᔀᑕʛ༁ɯᤥ 该数据文件包含测序得到的 ጢϟ ࿗ँϟ ԡᤃ 条 ᑕऔ ʢᔀᑕʛ༁ᖔ包含 Ꭾ Ꭾሕ ᤃጢሕ ँԡԡ ᤦᡱ 的
碱基序列ྉʢᔀᑕʛ༁ɯ信息及其对应的碱基测序质量信 核苷酸序列信息ᖔ平均每条 ʢᔀᑕʛ 的长度为 ϟጢԡ ᤦᡱᖔ
息ᤥ 质量评估后对所得的原始测序数据进行过 长度大于 ሕԡ ᤦᡱ 序列的占比为 ँሕᎮᤃᠮᖔ᥈ऊ 百分比
滤᧥去除接头ྉᑕʛᑕᡱᡷᔀʢɯ序列ଫ去除含有未知碱基的 为 ࿗Ꭾ ᤃጢᠮᤥ 对 ᑕऔ ʢᔀᑕʛ༁ 进行过滤ᖔ 获得
序列ଫ从序列两端起始ᖔ去除低质量的碱基ᤥ 过滤 ጢԡ ϟԡ࿗ ሕᤃ࿗条 ऊᔀᑕႿ ʢᔀᑕʛ༁ᖔ包含 Ꭾ ጢᎮ ࿗࿗ँ ँᤃ ᤦᡱ
后的 测序数据为 ऊᔀᑕႿ ʢᔀᑕʛ༁ᖔ 使用软件 ఋʢᔽႿᔽᡷᢃ 的核 苷酸序列 信 息ᖔ 平均每条 ʢᔀᑕʛ 的长度为
ྉ᥈ʢᑕᤦၤᔀʢʢ ᔀᡷ ᑕᖔԡϟϟɯྉ版本为 ࿗ԡଫ参数设置为 ϟ࿗࿗ऐጢ ᤦᡱᖔ长度大于 ሕԡ ᤦᡱ 序列的占比为 ँጢԡᤃᠮᖔ
ቝᔽႿᡸҴቝᔀʢᡸዹᆍ ᢉ ᖔ其余为默认设置ɯ 将该数据组装 ᥈ऊ 百分比为 ࿗Ꭾ࿗ᤃᠮᤥ
成转录 本ᖔ 并 取 每 条基因中最长的转录本作为 用 ఋʢᔽႿᔽᡷᢃ 软件对 ऊᔀᑕႿ ʢᔀᑕʛ༁ 进行 ʐᓣ Ⴅᅳצᅳ 组装
ВႿᔽ੫ᔀႿᔀᖔ以此作为后续分析的参考序列ᤥ 后获得 ϟ࿗ऐ ሕϟᎮ 个 ఋʢᑕႿ༁ዹʢᔽᡱᡷᖔ去冗余后获得 Ꭾऐ ᤃ࿗ϟ
ϟ ሕ 功能注释 জ 使用 શऊା᧧ ାᓂዶ୩ఋ շ ྉ ၤᡷᡷᡱ༁᧥ᣰ ᣰ 条 ВႿᔽ੫ᔀႿᔀᖔ其总的核苷酸数分别为 ϟϟᎮ ࿗ϟ ࿗ሕँܦ
ᤦᑕ༁ᡷႿዹᤦᔽႿቝႿᔽၤ੫ᆍᣰ ାᑕ༁ᡷዹ੫ᔽɯ 将 ВႿᔽ੫ᔀႿᔀ 序列与 ጢ ऐँ ँᎮϟ 个ྉ表 ϟɯᤥ ВႿᔽ੫ᔀႿᔀ 长度在 ԡԡ ጲ ሕԡԡ Ⴟᡷ
ऊ᧕᧕ܦ ᨃ᥈ܦ ऊᨃ᥈ܦ શܦ શఋܦ ۪èዶᥘܦ ୩औᔽ༁༁ᡱʢᆍᡷ 和 之间的有 ሕϟ ሕϟᤃ 条ᖔ占比 ሕँऐᠮଫ在 ሕԡԡ ጲ ԡԡԡ
ఋʢጶᥘାᓂ 数据库比对ᖔ获得基因的功能注释信息ᤥ Ⴟᡷ 之间 的 有 ࿗ ጢ࿗ 条ᖔ 占比 ጢ࿗ ԡᎮᠮଫ 长度超过
首先根据 ୩औᔽ༁༁ᡱʢᆍᡷ 数据库和 ఋʢጶᥘାᓂ 数据库的蛋 ԡԡԡ Ⴟᡷ 的有 ࿗ ऐԡϟ 条ᖔ占比 ᤃϟԡᠮྉ 图 ϟ᧥ዶɯᤥ 同
白注释结果ᖔ结合 ВႿᔽᡱʢᆍᡷྉ ВႿᔽ۪ʢᆍᡷᖔԡϟऐɯ 的注释 时ᖔ对多裂骆驼蓬 ВႿᔽ੫ᔀႿᔀ 的编码序列进行预测ᖔ
信 息得到 ᥈ᨃ 注释ᤥ 使用软件 ዶዶ୩ ྉ ጶ᥈᥈ 共获 得 ጢጢ ጢሕጢ 条 ऊ᧕୩ 序列ᤥऊ᧕୩ 序列长度在
ዶࣼᡷᆍቝᑕᡷᔽዹ ዶႿႿᆍᡷᑕᡷᔽᆍႿ ୩ᔀʢᔀʢ ɯ ྉ ᥘᆍʢᔽᢃᑕᖔ ԡԡᎮ ɯ 将 ϟԡԡ ጲ ԡԡ Ⴟᡷ 之间的有 ϟ ጢ࿗ϟ 条ᖔ占比ጢऐᠮଫ在
ВႿᔽ੫ᔀႿᔀ 序列与 ጶ᥈᥈ 基因数据库进行 ାᓂዶ୩ఋ 或 ԡԡ ጲ ሕԡԡ Ⴟᡷ 之间的有 ϟጢ ሕϟϟ 条ᖔ占比 ᎮጢᎮᠮଫ在
᥈̀ᨃ୩ఋ 比较ᖔ以此来获得基因的功能注释信息ᤥ ሕԡԡጲ ԡԡԡ Ⴟᡷ 之间的有 ᤃ ࿗ϟᤃ 条ᖔ占比 ࿗ᎮጢᎮᠮଫ长
首先根据 શܦ୩औᔽ༁༁ᡱʢᆍᡷܦఋʢጶᥘାᓂ 的最佳比对结果 度超过 ԡԡԡ Ⴟᡷ 的有ϟ ᤃᎮ条ᖔ占比 ऐᠮྉ图 ϟ᧥ାɯᤥ
按其优先级顺序确定 ВႿᔽ੫ᔀႿᔀ 的 ᨃè 读码框ଫ然 ԣॹԣ 转录组基因功能注释
后根 据标准密码子 表 确 定 其 ऊ᧕୩ 序列 ྉऊᆍʛᔽႿ੫ 将 ВႿᔽ੫ᔀႿᔀ 分别与 ऊ᧕᧕ܦᨃ᥈ܦશܦશఋܦ۪èዶᥘܦ
୩ᔀीࣼᔀႿዹᔀᖔ 氨基酸序列 ɯᖔ 同 时 将 未比对上的 ୩औᔽ༁༁ᡱʢᆍᡷܦ ఋʢጶᥘାᓂܦ ᥈ᨃ 和 ጶ᥈᥈ 数据库进行比对