Page 138 - 《广西植物》2021年第11期
P. 138

ϟ ँ ԡ ԡ                                广জ 西জ 植জ 物                                         ࿗ϟ 卷
                                        表 ϓই 印度血桐与中平树的数据产出统计信息
                                  ఋᑕᤦ᤟ᔀ ϟজ ᧕ᑕᡷᑕ ༁ᡷᑕᡷᔽ༁ᡷᔽዹ༁ ᆍ஦ ᤹ᐹዞᐹʗᐹႥ੖ᐹ ᔠႥʐᔠዞᐹ ᑕႿʛ ᤹ॹ ʐᓣႥᡙᔠዞࣩᤀᐹᡙᐹ

                                       原始数据        过滤后碱基数        错误率         ͐԰ԡ 比例       ͐ሕԡ 比例    ᥈ऊ 含量
                      文库
                                       ኏ᑕऔ ᤦᑕ༁ᔀ      ऊ᤟ᔀᑕႿ ᤦᑕ༁ᔀ  ጶʢʢᆍʢ ʢᑕᡷᔀ  ͐԰ԡ ᡱᔀʢዹᔀႿᡷᑕ੫ᔀ  ͐ሕԡ ᡱᔀʢዹᔀႿᡷᑕ੫ᔀ  ᥈ऊ ዹᆍႿᡷᔀႿᡷ
                     ᓂᔽᤦʢᑕʢᢃ
                                        ྉᤦᡱɯ          ྉᤦᡱɯ        ྉᠮɯ         ྉᠮɯ          ྉᠮɯ        ྉᠮɯ
                印度血桐ᡸᓂ԰ྉሕጢԡ ᤦᡱɯ      ԰԰ ऐऐሕ ϟሕᎮ ऐԡԡ  ԰԰ ऐጢँ ᤃ࿗ϟ ጢԡԡ  ԡ঎ԡ࿗     ँᤃ঎Ꭾऐ         ँϟ       ሕሕ঎ऐሕ
                ᤹ॹ ᔠႥʐᔠዞᐹᡸᓂ԰ྉሕጢԡ ᤦᡱɯ
                印度血桐ᡸᓂϟྉጢԡԡᤦᡱɯ       ሕԡ Ꭾ԰ጢ ϟԡ࿗ ԰ԡԡ  ሕԡ Ꭾԡऐ ሕ࿗Ꭾ Ꭾԡԡ  ԡ঎ԡ࿗     ँᎮ঎ԡ԰        ँϟ঎ጢሕ     ሕሕ঎ँጢ
                ᤹ॹ ᔠႥʐᔠዞᐹᡸᓂϟྉጢԡԡ ᤦᡱɯ
                      合计             ጢሕ ᤃԡऐ ԰࿗԰ ԡԡԡ  ጢሕ ጢᤃᎮ ँऐँ ԰ԡԡ  ԡ঎ԡ࿗     ँᤃ঎ँ         ँϟ঎԰ᤃ     ሕሕ঎ऐँ
                      ఋᆍᡷᑕ᤟
                 中平树ᡸᓂ԰ྉሕጢԡ ᤦᡱɯ      ԰ᤃ ᤃጢँ ऐጢᎮ ԡԡԡ  ԰ᤃ ᤃጢऐ ࿗ጢᤃ ᤃԡԡ  ԡ঎ԡ࿗     ँᎮ঎԰ሕ        ँϟ঎ँϟ     ሕሕ঎ԡ԰
              ᤹ॹ ʐᓣႥᡙᔠዞࣩᤀᐹᡙᐹᡸᓂ԰ྉሕጢԡ ᤦᡱɯ
                 中平树ᡸᓂ࿗ྉጢԡԡ ᤦᡱɯ      ࿗ϟ ࿗԰ጢ ࿗ँ԰ ጢԡԡ  ࿗ϟ ࿗ϟ԰ ँऐ԰ ԰ԡԡ  ԡ঎ԡ࿗     ँᎮ঎ϟሕ        ँϟ঎ᤃϟ     ሕ԰঎ँᎮ
              ᤹ॹ ʐᓣႥᡙᔠዞࣩᤀᐹᡙᐹᡸᓂ࿗ྉጢԡԡ ᤦᡱɯ
                      合计             ᤃऐ ԡऐጢ ሕ࿗ँ ጢԡԡ  ᤃऐ ԡᎮϟ ࿗ሕऐ ऐԡԡ  ԡ঎ԡ࿗     ँᎮ঎ϟऐ        ँϟ঎Ꭾᤃ      ሕሕ
                      ఋᆍᡷᑕ᤟
            জ 注᧥ ͅԣԔ ྉᠮɯ঎ 碱基识别的正确率为 ँँᠮଫ ͅᇺԔ ྉᠮɯ঎ 碱基识别的正确率为 ँँ঎ँᠮଫ ᤹ॹ ᔠႥʐᔠዞᐹᡸᓂ԰ྉሕጢԡ ᤦᡱɯᖔ ᤹ॹ ᔠႥʐᔠዞᐹᡸᓂϟྉጢԡԡ
            ᤦᡱɯᖔ ᤹ॹ ʐᓣႥᡙᔠዞࣩᤀᐹᡙᐹᡸᓂ԰ྉሕጢԡ ᤦᡱɯᖔ ᤹ॹ ʐᓣႥᡙᔠዞࣩᤀᐹᡙᐹᡸᓂ࿗ྉጢԡԡ ᤦᡱɯ表示插入片段大小ᤥ
            জશᆍᡷᔀ᧥ ͅԣԔ ྉᠮɯ঎ ఋၤᔀ ᑕዹዹࣼʢᑕዹᢃ ᆍ஦ ᤦᑕ༁ᔀ ʢᔀዹᆍ੫ႿᔽᡷᔽᆍႿ ᔽ༁ ँँᠮଫ ͅᇺԔ ྉᠮɯ঎ ఋၤᔀ ᑕዹዹࣼʢᑕዹᢃ ᆍ஦ ᤦᑕ༁ᔀ ʢᔀዹᆍ੫ႿᔽᡷᔽᆍႿ ᔽ༁ ँँ঎ँᠮଫ ᤹ॹ ᔠႥʐᔠዞᐹᡸᓂ԰ྉሕጢԡ
            ᤦᡱɯᖔ ᤹ॹ ᔠႥʐᔠዞᐹᡸᓂϟྉጢԡԡ ᤦᡱɯᖔ ᤹ॹ ʐᓣႥᡙᔠዞࣩᤀᐹᡙᐹᡸᓂ԰ྉሕጢԡ ᤦᡱɯᖔ ᤹ॹ ʐᓣႥᡙᔠዞࣩᤀᐹᡙᐹᡸᓂ࿗ྉጢԡԡ ᤦᡱɯ ᔽႿʛᔽዹᑕᡷᔀ ᡷၤᔀ ᔽႿ༁ᔀʢᡷ ༁ᔽझᔀ༁঎


            据用于后续分析ᤥ 两种材料碱基质量正常ᖔ͐԰ԡ                            ԣॹ྽ 样品污染评估ᗘᗘᗘ核苷酸比对结果
            与 ͐ሕԡ 都大于 ँԡᠮᖔ测序错误率都为ԡ঎ԡ࿗ᠮᖔ印度                          分别从印度血桐与中平树的 ሕጢԡ 和 ጢԡԡ ᤦᡱ 的
            血桐的 ᥈ऊ 含量为 ሕሕ঎ऐँᠮᖔ中平树的 ᥈ऊ 含量为                      序列文库中随机抽取 ϟԡ ԡԡԡ 条过滤后的单端高质
            ሕሕᠮᖔ结果表明原始测序质量较好ᖔ能保证后续实                            量 ʢᔀᑕʛ༁ ྉ ʢᔀᑕʛϟ 和 ʢᔀᑕʛ԰ 各 ጢ ԡԡԡ 条ɯᖔ 与 શఋ 库

            验分析的正常进行ᤥ                                          ྉશऊା᧧ 核苷酸数据库ɯ 进行 ାᓂዶ୩ఋ 比对ᖔ将比对结
            ԣॹᇺ ᣞ᤬ቂᓣʗ 分析与基因组大小估测                               果比率最高的前六位物种展示出来ྉ表 ሕɯᖔ比对结
                 采用基于 ᣽᥋ቝᔀʢ 的分析方法对印度血桐与中                       果显示ᖔ在印度血桐与中平树的两个文库中ᖔ比对
            平树的 ጢሕ঎ጢᤃ 和 ᤃऐ঎ԡᎮ ᥈ᤦ 的数据进行分析ᖔ得到                    结果比率最高的物种均为蓖麻ᖔ在印度血桐的 ሕጢԡ
            印度血桐与中平树的 ϟᎮ᥋ቝᔀʢ 分布情况ྉ 图 ԰ɯᖔ横                      和 ጢԡԡ ᤦᡱ 文库中ᖔ蓖麻分别占比对上 શఋ 库的 ʢᔀᑕʛ༁

            坐标表示 ᣽᥋ቝᔀʢ 出现的总次数ᖔ纵坐标表示 ᣽᥋ቝᔀʢ                      总数的 ϟ঎ᤃϟᠮ和 ϟ঎ँᠮᖔ而在中平树的 ሕጢԡ 和 ጢԡԡ ᤦᡱ
            出现的频率ྉ唐其等ᖔ԰ԡϟጢɯᖔ两种材料主峰之前都                          文库中ᖔ蓖麻分别占比对上的 શఋ 库的 ʢᔀᑕʛ༁ 总数的
            出现杂合峰ᖔ说明它们都有一定的杂合率ᤥ 两种                             ϟ঎Ꭾऐᠮ和 ϟ঎ᤃጢᠮᖔ根据分类学结果可知ᖔ蓖麻属于大
            材料的 ϟᎮ᥋ቝᔀʢ 曲线均有严重拖尾ᖔ说明它们都有                         戟科植物ᖔ为印度血桐与中平树的近缘物种ᤥ 此
            很高的重复序列比例ᤥ 结合表 ԰ 可知ᖔ印度血桐                           外ᖔ比对结果的其他物种均为植物ᖔ未发现动物或
            与中平树的测序深度分别为 ࿗ԡᣮ 和 ጢ࿗ᣮᖔ印度血                         微生物等异常物种的高比率情况ᖔ因此判断样品材
            桐的 ᣽᥋ቝᔀʢ 总数为 ሕँ Ꭾ԰ጢ ऐጢϟ ϟँጢᖔ中平树的 ᣽᥋                料无污染ᖔ可用于后续基因组调研图的正常分析ᤥ
            ቝᔀʢ 总数为 ጢϟ ጢँ࿗ ँऐሕ ϟϟᎮᖔ根据公式基因组大小                   ԣॹጇ 印度血桐与中平树基因组 ୒୒ቴ 分析
            ྉ᥈ɯ的估计算法᧥᥈ ᢉ ᣽᥋ቝࣼႿ ᣰ ᣽᥋ʛᔀᡱᡷၤᖔ其中 ᣽᥋ʛᔀᡱᡷၤ                利用微卫星识别工具 ᥘ᧧୩ዶ 在印度血桐与中平
            表示 ᣽᥋ቝᔀʢ 的期望测序深度ᖔ᣽᥋ቝࣼႿ 表示 ᣽᥋ቝᔀʢ 的                  树初步组装的所有序列中进行 ୩୩኏ 查找ᖔ搜索结果
            总数ྉ闫婧ᖔ԰ԡϟऐɯᖔ由此公式可得印度血桐的大小                          如表 ࿗ 所示ᖔ在印度血桐中共搜索到࿗ ࿗ँँ ϟऐጢ 个
            为 ँँሕ঎ϟጢ ᥘᖔ修正后的基因组大小为 ँऐᤃ঎ऐ࿗ ᥘଫ中                   ୩୩኏ᖔ在所含有 ୩୩኏ 的序列中ᖔ࿗࿗ጢ ϟϟᎮ条序列包含 ϟ
            平树的基因组大小为 ँጢጢ঎࿗ᤃ ᥘᖔ修正后的基因组                         个以上 ୩୩኏ᖔ以复合形式存在的 ୩୩኏ 数量有 ࿗ँ԰ ሕ࿗ϟ
            大小为 ँ࿗ᤃ঎԰ሕ ᥘଫ印度血桐与中平树的杂合率分                         个ଫ在中平树中共搜索到࿗ ँᤃँ ԡँऐ个 ୩୩኏ᖔ在所含
            别为 ԡ঎Ꭾጢᠮ和 ԡ঎ᤃጢᠮᖔ印度血桐与中平树的重复率                       有 ୩୩኏ 的序列中ᖔ࿗ጢऐ Ꭾ԰ᤃ 条序列 包 含 ϟ 个以上
            分别为 Ꭾሕ঎ԡ԰ᠮ和 Ꭾሕ঎ጢᠮᤥ 由测序结果可知ᖔ印度                      ୩୩኏ᖔ以复合形式存在的 ୩୩኏ 序列有ጢԡᎮ ऐऐᎮ 条ᤥ

            血桐与中平树都属于高重复微杂合基因组ᤥ                                分别对两种材料的不同类型的 ୩୩኏ 核苷酸数量进
   133   134   135   136   137   138   139   140   141   142   143