CMIP6数据下载与处理指南
CMIP6数据下载与处理指南
CMIP6(第六次耦合模式比较计划)是气候研究领域的重要数据资源,包含了全球多个气候模型的模拟数据。本文将详细介绍如何从ESGF(Earth System Grid Federation)数据平台下载CMIP6数据,包括界面功能详解、数据筛选步骤和具体案例,以及如何在ArcGIS中处理下载的数据。
数据下载网站:https://aims2.llnl.gov/search/cmip6(需科学上网)
选择Sign in/Log in注册或者登录即可。
个人学习笔记,如有错误或建议欢迎在评论区指出。
一、界面简介
目前最新的下载界面如下图所示,左侧可以筛选数据,右侧则会显示数据筛选的结果。
二、右侧数据筛选栏详解
这一章节会详细记录右侧数据筛选栏的每一项含义。
(一)Select a Project
这个菜单列出了可以下载的不同气候模型相关数据集,每个选项代表一个特定的项目或数据框架,这里默认就是CMIP6。
(二)Filter By Transfer Options
这个选项是用于筛选数据传输方式的过滤器。
Any是默认选择:显示所有数据文件,无论其支持的传输方式。适合普通用户,不需要对传输方式进行限制。
Only Globus Transferrable只显示支持通过Globus传输工具下载的数据。(Globus是一种高效、可靠的数据传输工具,适合处理大规模或高性能需求的传输任务。)
目前的学习为网页单个下载,默认选择Any。
(三)Filter with Facets
ESGF数据平台的筛选选项,用于更精确地过滤和选择所需数据集。
1.General
Activity ID(活动标识),表示数据所属的特定实验活动或计划,可以看到就是MIPs,根据研究目的选择不同的MIPs。
Data Node指存储数据的服务器节点,其实可以直接空着。
2.Identifiers
Source ID表示气候模式(GCMs)的名称。
Instituiton ID表示开发和维护数据集的研究机构。
Source Type描述数据的来源类别,例如:AOGCM表示大气-海洋耦合模式,ESM表示地球系统模式(包含碳循环等生物地球化学过程)。
Experiment ID表示数据所属的具体模拟实验,比如historical(历史模拟),ssp(未来情景实验),piControl(工业化前的控制实验)等。这里用的比较多的ssp,要注意前面MIPs的筛选,并不是所有的MIPs都有ssp情景。
Sub Experiment ID(子实验标识),表示特定实验的子集或变种,细化实验条件,例如分年代际预测或具体模型设置的子实验。
3.Resolutions
Nominal Resolution,用于根据气候模式的数据分辨率筛选所需数据集。
4.Labels
Variant Label指数据集的变体标签,用于标识同一实验的不同模拟版本。同一实验可能由不同的初始化条件、物理参数或随机种子运行多次,产生多个变体版本,而Variant Label 用于区分这些版本,例如r1i1p1f1:
- r1:第1个随机种子(Run ID)。
- i1:第1个初始化条件(Initialization Method)。
- p1:第1个物理方案(Physics Configuration)。
- f1:第1个强迫方案(Forcing Index)。
同一研究所使用的数据必须保持相同的Variant Label。
Grid Label表示数据的网格类型或分辨率标签,用于说明数据输出的网格系统: - gn:原生网格(Native Grid),即模型本身的计算网格。
- gr:再投影网格(Regridded),将数据重新插值到规则网格。
- gr1、gr2:不同分辨率的规则网格。
如果研究需要模型的原始输出(最高精度),选择 gn;如果需要便于对比或使用的数据(标准化网格),也就是多模式对比,选择 gr 或其他再投影版本。
5.Classifications
Table ID表示数据类型的处理方式,如月平均、日平均等(Amon表示大气数据月平均,Omon表示海洋数据月平均)。
Frequency表示数据的时间分辨率,比如day就是日平均,yr就是年平均数据。
Realm表示数据所属的气候系统领域比如atmos表示大气,land表示陆地。
Variable ID表示表示具体的气候变量名称,比如pr表示降水量,关于Variable ID的快速查询和变量描述可以参考:CMIP6 变量详细表格-CSDN博客
CF Standard Name表示符合 CF(Climate and Forecast)标准的变量名称,用于确保数据的一致性和互操作性。
6.Addtional Properties
Version Type可以选择数据版本,只分为Latest和All。
Result Type表示结果类型,同于筛选原始数据和副本。
- Originals and Replicas:显示原始数据及其副本。
- Originals Only:仅显示原始数据(数据的主要来源)。
- Replicas Only:仅显示副本(存储在其他节点的复制数据)。
Version Date Range表示指定数据版本的日期范围。
7.Filename
如果已知目标数据的文件名或其一部分,可以输入相关信息可快速定位数据。
三、筛选数据举例
上一章节介绍了数据筛选栏所有模块的内容,但其实在下载数据的时候并不是所有模块都需要被筛选的,因此在这一章节记录了个人的一个下载案例。
我需要下载SSP2-4.5这一未来情景下的降水数据,那么首先我的Activity选择了ScenarioMIP(其实可以发现只有这一个MIPs包括SSP情景的数据)。Data Node不作选择。
我想研究未来全球的气候变化,因此最合适的GCMs为EC-Earth3,所以Source ID选择EC-Earth3。未来情景我选择了ssp245。设定完Source ID和Experiment ID后我的Institution ID和Soruce Type本身就只剩下了一个选项,因此也无需作出选择。如果是其他类型的数据,也可以根据自身的需要进行设定。
Resulutions,Variant Label和Grid Label可以根据自身的研究需求确定。也可以先空着,筛选完后面的变量和时间分辨率之后再来看这里有什么选项。在这里我可以选择的分辨率其实只有100km,因此如果想要获取分辨率更高的CMIP6数据的话需要进行降尺度,降尺度的步骤流程也将在后续进行更新。
这里我选择逐日的降水数据。
剩下的Additional Properties和Filename没有需求,不作设定。
全部筛选之后,可以看到右侧结果是筛选出来了261个数据。
四、右侧数据详解
借助上一章节我筛选出的降水数据来对右侧数据显示作出解释,随机挑选第一个数据,如下图所示。
Dataset ID为:CMIP6.ScenarioMIP.EC-Earth-Consortium.EC-Earth3.ssp245.r4i1p1f1.day.pr.gr。
各部分含义:
- CMIP6:数据所属项目(第六阶段耦合模式比较计划)。
- ScenarioMIP:实验类型(未来情景模拟,基于SSP情景)。
- EC-Earth-Consortium:开发该模式的机构(欧洲地球系统模式联盟)。
- EC-Earth3:气候模式名称。
- ssp245:实验ID,表示 SSP2-4.5 中等排放情景。
- r4i1p1f1:变体标签,表示该模拟的运行版本。
- r4:第4次模拟运行(随机种子)。
- i1:第1个初始化条件。
- p1:第1个物理配置。
- f1:第1个强迫方案。
- day:时间分辨率,逐日数据。
- pr:变量,表示降水量(precipitation)。
- gr:网格类型,表示再投影网格。
Files表示数据集中包含的文件数量(86 个)。
Total Size表示数据集的总大小(11.4 GB)。
Version表示数据版本号(20200425),此数据于 2020 年 4 月 25 日发布。
Download Options提供下载方式,包括生成 wget 脚本,可用于批量下载或直接单击下载按钮获取全部数据。
Globus Ready表示数据是否支持 Globus 传输工具,绿色图标表示此数据集可以使用 Globus 高效传输工具下载。
1.Files
打开Files可以看到是每一年的nc文件,可以选择下载某一年的,也可以直接打包下载全部的nc文件。
2.Metadata
Metadata里的信息与Dataset ID的相近,具体可以关注一下其中的variable_units,变量单位,但有关描述在上文给到的CMIP6变量表格中也都有涉及到。
五、在ArcGIS中打开nc影像
下载了2015年的降水量数据,单幅nc数据可以直接在ArcGIS中打开,但是如果多幅的话可以选择nc批量转tiff会更方便,此方法将会在后续更新。
打开ArcGIS后搜索“创建NetCDF栅格图层(多维)”工具。
注意这里的变量记得选择正确变量,有时候进去默认是经度或者纬度。后续如果下载的是多波段影像的话,也可以通过波段维度及维度值设置一个时间维度。
影像如下图所示,可以根据自己的需求进行裁剪。