Page 43 - 《广西植物》2023年第6期
P. 43
6 期 郑芳等: 基于 MaxEnt 模型预测中国兰属植物的分布格局及主导气候因子 1 0 2 9
种群的分布地点、经纬度、海拔、受威胁因素、生境 对模型的精度进行评价ꎮ ROC 曲线与横坐标所围
类型等信息ꎮ 成区域面积(AUC)的大小具有不受临界值影响的
1.1.2 物种分布信息 物种分布信息来源于三个途 特性ꎬ可用 于 评 价 预 测 模 型 的 准 确 性 ( 邓 飞 等ꎬ
径:一是根据课题组种质资源调查ꎬ分布点经纬度 2014ꎻ郭杰等ꎬ2017ꎻ周扬等ꎬ2019)ꎮ AUC 的取值
信息由 GPS 实地定位获得ꎻ二是通过查阅国内外相 范围为 0 ~ 1ꎬ其取值越大表示与随机分布越远ꎬ预
关已发表文献ꎬ找出其已报道的分布地点ꎬ用百度 测的效果越好ꎮ 当 AUC 值为 0.5 ~ 0.6 时ꎬ表示模
拾取坐标查找相应的经纬度坐标ꎻ三是通过中国数 型预测失败ꎻ当 AUC 值为 0.6 ~ 0.7 时ꎬ表示预测结
字植物标本馆(http:/ / www.cvh. ac. cn / ) 和全球生 果较差ꎻ当 AUC 值为 0.7 ~ 0.8 时ꎬ表明预测效果一
物多样性信息网络( https:/ / www.gbif.org / ) 获取标 般ꎻ当 AUC 值为 0.8 ~ 0.9 时ꎬ表示预测效果好ꎻ当
本采集地经纬度信息ꎮ 通过以上三个途径ꎬ获得中 AUC 值为 0.9 ~ 1 时ꎬ表示预测效果非常好ꎮ
国兰属 35 个物种共3 170条分布记录ꎮ 剔除栽培、 1.2.3 适生区等级的划分 MaxEnt 结果输出文件
购买等采集点ꎬ以及重叠和记录模糊的采集点ꎬ最 为 ASCⅡ格式ꎬ将其加载到 ArcGIS 10.6 中ꎬ使用
终得到 24 个物种共 915 条有效分布记录ꎮ “ArcToolbox”中的“ 格式转换工具” 转换为栅格数
1.1.3 气候因子数据 本研究选取的现代(1970— 据ꎬ利用“ 重分类工具( reclassify)” 将兰属植物的
2000 年 ) 和 未 来 2030s ( 2021—2041 年 )、 2050s 生境 适 宜 性 按 照 “ 自 然 间 断 点 分 级 法 ( natural
(2041—2060 年)ꎬ2070s(2061—2080 年) 和 2090s break)”划分成 4 类ꎬ即非适生区、低适生区、中适
(2081—2100 年)的 19 个气候因子数据ꎬ均来源于 生区和高适生区ꎬ并计算各适生区的面积ꎮ
世界气候数据库 WorldClim(http:/ / worldclim.org)ꎬ 1.2.4 系统发育树构建 以贵州地宝兰作为外类
空间分 辨 率 为 2. 5 minꎮ 现 代 气 候 数 据 是 根 据 群ꎬ将 20 种兰属植物的叶绿体全基因组序列ꎬ利
1970—2000 年全球不同气象站点记录的气候数据 用 HomBlocks(Bi et al.ꎬ 2018) 软件进行基因组序
经插值法生成ꎮ 未来气候数据选择 CMIP6 计划中 列的比 对ꎻ比 对 结 果 利 用 IQ ̄TREE version 2. 1. 2
精度为 2.5 min 的 BCC-CSM2-MR 模式下的 SSP1- (Trifinopoulos et al.ꎬ 2016)ꎬ构建兰属植物的 ML
2.6 和 SSP5-8.5 两组数据ꎮ 数据经 ArcGIS 10.6 软 (maximum likelihood) 系统进化树ꎬBootstrap 值 设
件剪裁为中国范围并转换为 ASCⅡ格式ꎮ 置为 1 000ꎬ 建 树 最 优 模 块 由 IQ ̄TREE 内 置 的
1.1.4 叶绿体基因组数据 从 NCBI( https:/ / www. ModelFinder ( Kalyaanamoorthy et al.ꎬ 2017 ) 进 行
ncbi.nlm.nih.gov / )数据库共获取 17 个已公布兰属 选择ꎮ
植 物 的 叶 绿 体 基 因 组ꎬ 同 时 下 载 贵 州 地 宝 兰
(Geodorum eulophioides) 的叶绿体基因组作为外类 2 结果与分析
群ꎮ 叶绿 体 基 因 组 信 息 和 GenBank 登 录 号 详 见
表 1ꎮ 2.1 MaxEnt 模型预测潜在分布格局
另 外ꎬ 取 样 测 序 得 到 莎 叶 兰 ( Cymbidium 2.1.1 模型准确性检验 运用 MaxEnt 模型基于 19
cyperifolium)、 莎 草 兰 ( C. elegans)、 黄 蝉 兰 ( C. 个气候因子构建的兰属植物全属及其中 20 个物
iridioides)的叶绿体基因组ꎮ 种(另外 4 种兰属植物位置信息太少ꎬ结果可信度
1.2 研究方法 不高ꎬ仅用于预测全属的分布格局)在当代、未来 4
1.2.1 建立模型 采用 MaxEnt version 3.4.1(http:/ / 个时间段两种不同气候情景下的地理分布模型的
biodiversityinformatics.amnh.org/ open_source / maxent) AUC 值为 0.849 ~ 0.992(表 2)ꎬ平均值为 0.953ꎮ
模拟兰属植物在不同气候情境下的潜在分布格 基于 ROC 曲线分析法对 MaxEnt 预测的当前
局ꎬ设置训练集为 75%ꎬ测试集为 25%进行模拟分 气候条件整个兰属植物潜在地理分布结果进行检
析ꎮ 将物种分布数据与气候因子数据一起导入 验ꎬ分析得出:训练集( training data) 和测试集( test
MaxEnt 中ꎬ选择刀切法( Jackknife)ꎬ绘制响应曲线 data)的 AUC 值分别可达 0.916 和 0.911ꎬ远大于
并制作预测图ꎮ 随机预测( random prediction) 的 AUC 值 0.500( 图
1.2.2 模型精度检验 采用受试者工作特征曲线 1)ꎬ表明该模型预测结果准确性较高ꎬ可以用于兰
(receiver operator characteristic curvesꎬ ROC curves) 属植物在中国的潜在分布区模拟研究ꎮ