Page 138 - 《广西植物》2021年第11期
P. 138
ϟ ँ ԡ ԡ 广জ 西জ 植জ 物 ࿗ϟ 卷
表 ϓই 印度血桐与中平树的数据产出统计信息
ఋᑕᤦᔀ ϟজ ᧕ᑕᡷᑕ ༁ᡷᑕᡷᔽ༁ᡷᔽዹ༁ ᆍ ᤹ᐹዞᐹʗᐹႥᐹ ᔠႥʐᔠዞᐹ ᑕႿʛ ᤹ॹ ʐᓣႥᡙᔠዞࣩᤀᐹᡙᐹ
原始数据 过滤后碱基数 错误率 ͐ԡ 比例 ͐ሕԡ 比例 ᥈ऊ 含量
文库
ᑕऔ ᤦᑕ༁ᔀ ऊᔀᑕႿ ᤦᑕ༁ᔀ ጶʢʢᆍʢ ʢᑕᡷᔀ ͐ԡ ᡱᔀʢዹᔀႿᡷᑕ੫ᔀ ͐ሕԡ ᡱᔀʢዹᔀႿᡷᑕ੫ᔀ ᥈ऊ ዹᆍႿᡷᔀႿᡷ
ᓂᔽᤦʢᑕʢᢃ
ྉᤦᡱɯ ྉᤦᡱɯ ྉᠮɯ ྉᠮɯ ྉᠮɯ ྉᠮɯ
印度血桐ᡸᓂྉሕጢԡ ᤦᡱɯ ऐऐሕ ϟሕᎮ ऐԡԡ ऐጢँ ᤃ࿗ϟ ጢԡԡ ԡԡ࿗ ँᤃᎮऐ ँϟ ሕሕऐሕ
᤹ॹ ᔠႥʐᔠዞᐹᡸᓂྉሕጢԡ ᤦᡱɯ
印度血桐ᡸᓂϟྉጢԡԡᤦᡱɯ ሕԡ Ꭾጢ ϟԡ࿗ ԡԡ ሕԡ Ꭾԡऐ ሕ࿗Ꭾ Ꭾԡԡ ԡԡ࿗ ँᎮԡ ँϟጢሕ ሕሕँጢ
᤹ॹ ᔠႥʐᔠዞᐹᡸᓂϟྉጢԡԡ ᤦᡱɯ
合计 ጢሕ ᤃԡऐ ࿗ ԡԡԡ ጢሕ ጢᤃᎮ ँऐँ ԡԡ ԡԡ࿗ ँᤃँ ँϟᤃ ሕሕऐँ
ఋᆍᡷᑕ
中平树ᡸᓂྉሕጢԡ ᤦᡱɯ ᤃ ᤃጢँ ऐጢᎮ ԡԡԡ ᤃ ᤃጢऐ ࿗ጢᤃ ᤃԡԡ ԡԡ࿗ ँᎮሕ ँϟँϟ ሕሕԡ
᤹ॹ ʐᓣႥᡙᔠዞࣩᤀᐹᡙᐹᡸᓂྉሕጢԡ ᤦᡱɯ
中平树ᡸᓂ࿗ྉጢԡԡ ᤦᡱɯ ࿗ϟ ࿗ጢ ࿗ँ ጢԡԡ ࿗ϟ ࿗ϟ ँऐ ԡԡ ԡԡ࿗ ँᎮϟሕ ँϟᤃϟ ሕँᎮ
᤹ॹ ʐᓣႥᡙᔠዞࣩᤀᐹᡙᐹᡸᓂ࿗ྉጢԡԡ ᤦᡱɯ
合计 ᤃऐ ԡऐጢ ሕ࿗ँ ጢԡԡ ᤃऐ ԡᎮϟ ࿗ሕऐ ऐԡԡ ԡԡ࿗ ँᎮϟऐ ँϟᎮᤃ ሕሕ
ఋᆍᡷᑕ
জ 注᧥ ͅԣԔ ྉᠮɯ 碱基识别的正确率为 ँँᠮଫ ͅᇺԔ ྉᠮɯ 碱基识别的正确率为 ँँँᠮଫ ᤹ॹ ᔠႥʐᔠዞᐹᡸᓂྉሕጢԡ ᤦᡱɯᖔ ᤹ॹ ᔠႥʐᔠዞᐹᡸᓂϟྉጢԡԡ
ᤦᡱɯᖔ ᤹ॹ ʐᓣႥᡙᔠዞࣩᤀᐹᡙᐹᡸᓂྉሕጢԡ ᤦᡱɯᖔ ᤹ॹ ʐᓣႥᡙᔠዞࣩᤀᐹᡙᐹᡸᓂ࿗ྉጢԡԡ ᤦᡱɯ表示插入片段大小ᤥ
জશᆍᡷᔀ᧥ ͅԣԔ ྉᠮɯ ఋၤᔀ ᑕዹዹࣼʢᑕዹᢃ ᆍ ᤦᑕ༁ᔀ ʢᔀዹᆍ੫ႿᔽᡷᔽᆍႿ ᔽ༁ ँँᠮଫ ͅᇺԔ ྉᠮɯ ఋၤᔀ ᑕዹዹࣼʢᑕዹᢃ ᆍ ᤦᑕ༁ᔀ ʢᔀዹᆍ੫ႿᔽᡷᔽᆍႿ ᔽ༁ ँँँᠮଫ ᤹ॹ ᔠႥʐᔠዞᐹᡸᓂྉሕጢԡ
ᤦᡱɯᖔ ᤹ॹ ᔠႥʐᔠዞᐹᡸᓂϟྉጢԡԡ ᤦᡱɯᖔ ᤹ॹ ʐᓣႥᡙᔠዞࣩᤀᐹᡙᐹᡸᓂྉሕጢԡ ᤦᡱɯᖔ ᤹ॹ ʐᓣႥᡙᔠዞࣩᤀᐹᡙᐹᡸᓂ࿗ྉጢԡԡ ᤦᡱɯ ᔽႿʛᔽዹᑕᡷᔀ ᡷၤᔀ ᔽႿ༁ᔀʢᡷ ༁ᔽझᔀ༁
据用于后续分析ᤥ 两种材料碱基质量正常ᖔ͐ԡ ԣॹ 样品污染评估ᗘᗘᗘ核苷酸比对结果
与 ͐ሕԡ 都大于 ँԡᠮᖔ测序错误率都为ԡԡ࿗ᠮᖔ印度 分别从印度血桐与中平树的 ሕጢԡ 和 ጢԡԡ ᤦᡱ 的
血桐的 ᥈ऊ 含量为 ሕሕऐँᠮᖔ中平树的 ᥈ऊ 含量为 序列文库中随机抽取 ϟԡ ԡԡԡ 条过滤后的单端高质
ሕሕᠮᖔ结果表明原始测序质量较好ᖔ能保证后续实 量 ʢᔀᑕʛ༁ ྉ ʢᔀᑕʛϟ 和 ʢᔀᑕʛ 各 ጢ ԡԡԡ 条ɯᖔ 与 શఋ 库
验分析的正常进行ᤥ ྉશऊା᧧ 核苷酸数据库ɯ 进行 ାᓂዶ୩ఋ 比对ᖔ将比对结
ԣॹᇺ ᣞቂᓣʗ 分析与基因组大小估测 果比率最高的前六位物种展示出来ྉ表 ሕɯᖔ比对结
采用基于 ᥋ቝᔀʢ 的分析方法对印度血桐与中 果显示ᖔ在印度血桐与中平树的两个文库中ᖔ比对
平树的 ጢሕጢᤃ 和 ᤃऐԡᎮ ᥈ᤦ 的数据进行分析ᖔ得到 结果比率最高的物种均为蓖麻ᖔ在印度血桐的 ሕጢԡ
印度血桐与中平树的 ϟᎮ᥋ቝᔀʢ 分布情况ྉ 图 ɯᖔ横 和 ጢԡԡ ᤦᡱ 文库中ᖔ蓖麻分别占比对上 શఋ 库的 ʢᔀᑕʛ༁
坐标表示 ᥋ቝᔀʢ 出现的总次数ᖔ纵坐标表示 ᥋ቝᔀʢ 总数的 ϟᤃϟᠮ和 ϟँᠮᖔ而在中平树的 ሕጢԡ 和 ጢԡԡ ᤦᡱ
出现的频率ྉ唐其等ᖔԡϟጢɯᖔ两种材料主峰之前都 文库中ᖔ蓖麻分别占比对上的 શఋ 库的 ʢᔀᑕʛ༁ 总数的
出现杂合峰ᖔ说明它们都有一定的杂合率ᤥ 两种 ϟᎮऐᠮ和 ϟᤃጢᠮᖔ根据分类学结果可知ᖔ蓖麻属于大
材料的 ϟᎮ᥋ቝᔀʢ 曲线均有严重拖尾ᖔ说明它们都有 戟科植物ᖔ为印度血桐与中平树的近缘物种ᤥ 此
很高的重复序列比例ᤥ 结合表 可知ᖔ印度血桐 外ᖔ比对结果的其他物种均为植物ᖔ未发现动物或
与中平树的测序深度分别为 ࿗ԡᣮ 和 ጢ࿗ᣮᖔ印度血 微生物等异常物种的高比率情况ᖔ因此判断样品材
桐的 ᥋ቝᔀʢ 总数为 ሕँ Ꭾጢ ऐጢϟ ϟँጢᖔ中平树的 ᥋ 料无污染ᖔ可用于后续基因组调研图的正常分析ᤥ
ቝᔀʢ 总数为 ጢϟ ጢँ࿗ ँऐሕ ϟϟᎮᖔ根据公式基因组大小 ԣॹጇ 印度血桐与中平树基因组 ቴ 分析
ྉ᥈ɯ的估计算法᧥᥈ ᢉ ᥋ቝࣼႿ ᣰ ᥋ʛᔀᡱᡷၤᖔ其中 ᥋ʛᔀᡱᡷၤ 利用微卫星识别工具 ᥘ᧧୩ዶ 在印度血桐与中平
表示 ᥋ቝᔀʢ 的期望测序深度ᖔ᥋ቝࣼႿ 表示 ᥋ቝᔀʢ 的 树初步组装的所有序列中进行 ୩୩ 查找ᖔ搜索结果
总数ྉ闫婧ᖔԡϟऐɯᖔ由此公式可得印度血桐的大小 如表 ࿗ 所示ᖔ在印度血桐中共搜索到࿗ ࿗ँँ ϟऐጢ 个
为 ँँሕϟጢ ᥘᖔ修正后的基因组大小为 ँऐᤃऐ࿗ ᥘଫ中 ୩୩ᖔ在所含有 ୩୩ 的序列中ᖔ࿗࿗ጢ ϟϟᎮ条序列包含 ϟ
平树的基因组大小为 ँጢጢ࿗ᤃ ᥘᖔ修正后的基因组 个以上 ୩୩ᖔ以复合形式存在的 ୩୩ 数量有 ࿗ँ ሕ࿗ϟ
大小为 ँ࿗ᤃሕ ᥘଫ印度血桐与中平树的杂合率分 个ଫ在中平树中共搜索到࿗ ँᤃँ ԡँऐ个 ୩୩ᖔ在所含
别为 ԡᎮጢᠮ和 ԡᤃጢᠮᖔ印度血桐与中平树的重复率 有 ୩୩ 的序列中ᖔ࿗ጢऐ Ꭾᤃ 条序列 包 含 ϟ 个以上
分别为 Ꭾሕԡᠮ和 Ꭾሕጢᠮᤥ 由测序结果可知ᖔ印度 ୩୩ᖔ以复合形式存在的 ୩୩ 序列有ጢԡᎮ ऐऐᎮ 条ᤥ
血桐与中平树都属于高重复微杂合基因组ᤥ 分别对两种材料的不同类型的 ୩୩ 核苷酸数量进