Argo数据开放共享实践二十年
编辑 :中国Argo实时资料中心 时间
:2019-07-31 14:18:06 访问次数 :
中国Argo实时资料中心(CARDC)是自然资源部(原国家海洋局)第二海洋研究所卫星海洋环境动力学国家重点实验室(SOED)的重要科技支撑平台,也是实施我国Argo计划和建设中国Argo大洋观测网的执行单位,中国Argo计划首席科学家和国际Argo指导组成员就诞生于该科技创新团队,代表中国参与了国际Argo计划的组织实施及其全球Argo实时海洋观测网的建设维护。自2002年以来,该中心一直肩负着Argo大洋观测网中剖面浮标的检测与投放、观测数据接收与解码、Argo实时资料校正处理与质量控制和网格数据集制作与衍生数据产品研制,以及Argo实时资料国际交换与共享等日常工作。
在国家重点基础研究发展计划(973)“我国重大气候灾害的形成机理和预测理论研究”(1998-2003年)、国家基础研究重大项目前期研究专项“我国新一代海洋实时观测系统(Argo)—大洋观测网试验”(2002-2003年)、科技部国际重点合作项目“太平洋-印度洋暖池的Argo浮标观测研究”(2003-2007年)、国家海洋公益性行业科研专项“西北太平洋Argo剖面浮标观测及其应用研究”(2007-2009年)、国家重点基础研究发展计划(973)“基于全球实时海洋观测计划(Argo)的上层海洋结构、变异及预测研究”(2007-2011年)、国家海洋公益性行业科研专项“印度洋海域海洋环境数值预报系统研制与示范”(2010-2012年)、国家科技基础性工作专项“西太平洋Argo实时海洋调查”(2012-2017年)和财政部国家重点实验室科研仪器设备专项“自动剖面浮标实时海洋观测系统”(2017-2018年)等项目、课题的滚动资助下,围绕我国和国际Argo计划的组织实施、中国Argo大洋观测网和全球Argo实时海洋观测网建设与维护,CARDC做了大量科技基础性工作,无条件免费提供的覆盖全球海洋的、高分辨率的、高质量的Argo资料及其衍生数据产品,得到了国内外许多单位和众多专家学者,特别是涉海院校和科研院所在读研究生们广泛应用,取得了许多创新的原始成果,收到了良好的社会效益,以及巨大的间接经济效益,也为国家节省了巨额海洋调查经费,更为我国海洋界提供了一个践行海洋科学数据开放共享的极好机会。
一、国际Argo计划的成功实践
Argo计划在短短20年间取得的举世瞩目成就,特别是收集的海量高精度海洋环境要素资料,不仅为沿海国家海洋资源开发、蓝色经济发展和应对全球气候变化等提供了丰富的基础数据和科学依据,更为全人类积累了一大批宝贵的自然财富,这与Argo计划的缜密组织实施是分不开的。早在该计划实施之初,就成立了Argo指导组和Argo资料管理组两个专门小组,前者负责观测网的设计和协调,规范的制订和监督,以及问题的收集和解决等;后者负责为浮标资料制订标准,研发统一的资料校正和质量控制方法,以及规定资料交换的统一格式等。针对浮标观测中遇到的传感器质量或者浮标性能问题,会及时组织浮标、传感器研制技术人员和资料分析研究人员共同攻关,提出改进措施和解决办法等,或者通过观测资料的后处理和高标准的质量控制给予弥补,以确保提供的观测数据能达到统一的标准。上述两个小组每年定期各举行一次会议,并不定期地举办浮标和传感器技术研讨会、观测资料校正和质量控制培训班等;还每隔2-3年举行一次Argo科学研讨会,检验Argo资料被各国和各领域科学家应用及其取得的成果等情况,并听取用户对浮标技术、观测网、观测要素和测量频次等的改进意见和建议,使得观测网建设、资料质量控制和数据共享与应用研究这两支队伍,既能发挥各自的专长,又能紧密地结合在一起,相辅相成,收效十分显著。
为了保证浮标在海上长期工作所获取的剖面资料有较高的质量,美国、法国和德国等国家的科学家还开发了Argo延时模式质量控制方法,利用浮标附近的历史水文观测资料进行检验和校正。除了要求在布放浮标时,尽可能使用专业的科学调查船(配备船载CTD仪,并携带玫瑰型采水器),以便准同步获取浮标布放期间的船载CTD仪测量剖面和特定层次上的海水样品,再采用高精度实验室盐度计测出各层的盐度值,以此来检验船载CTD仪的观测精度,以及用来校正或验证剖面浮标观测资料的质量外,还专门制作了一个Argo参考数据库,用来快速、自动检验浮标观测资料的质量。该数据库主要收集了船载CTD仪的历史观测资料,且只有通过了采水器(瓶)数据检验或校正后的才能加入到该数据库中。对一些海区因符合要求的历史高质量船载CTD剖面资料十分罕见或者难以收集,还采取了将经过严格质量控制的高质量历史Argo资料加入参考数据库中的措施,来弥补对这些海区浮标观测资料快速、自动检验,以及质量控制的需求。此外,国际Argo组织为了确保全球Argo海洋观测网中由近40个国家和团体布放的约20种型号(通过国际认证)的上万个浮标所提供的观测资料,既能符合统一的观测精度,又能确保它们的可靠性和一致性,针对剖面浮标准入、传感器选型、观测信息收集和观测资料格式及其质量控制等,研究并制订了一系列标准、方法、措施和程序,而且还在不断改进和补充完善中。
在2019年3月结束的第20次国际Argo指导组(AST-20)会议上,AST又正式提出了一份“Argo2020愿景”规划,设想从2020年起实施一个加强版的Argo计划,维持一个由4700个活跃浮标组成的全球性、全海深和多学科(包括物理海洋和生物地球化学)海洋观测网,不仅可以通过基础研究,提高人们对海洋、气候变化的评估和认识,还可以通过改进长期海洋再分析和预报模型及其模式参数化等,提高对海洋和天气/气候的业务预测预报水平,从而达到更好地监控当前气候变化和生态系统健康的目的,使得全社会能更好地适应气候变化;而且,海洋热量、淡水和生物地球化学等环境要素观测资料的实时同化,还能进一步提高短期预报的水平,这对气候敏感行业(如农业、水产养殖业、渔业、海洋石油和天然气产业等)的持续发展同样至关重要。新版Argo计划还会将Core-Argo、BGC-Argo和Deep-Argo等子计划收集的物理和生物地球化学环境要素资料统一集成在一个综合的Argo数据管理系统中,继续给予广大用户最好、最大化的利用Argo数据的无障碍环境(免费共享),进一步促进Argo资料在科研教育、海洋资源开发、蓝色经济发展和气候变化适应等科学和社会领域的广泛应用。
二、中国Argo计划的跟跑尝试
由于海上现场观测数据获取的艰辛、代价的高昂和覆盖区域及其数量的稀缺,以及数据质量的参差不齐,海洋科学数据开放共享在国内一直是个老大难问题。本世纪初参与的国际Argo计划,恰好给了我国海洋界一个践行海洋科学数据开放共享的难得契机,中国Argo实时资料中心(CARDC)也就义不容辞地肩负起了这一光荣而又艰巨的使命。在科技部基础研究司及相关处室至少三任领导的接力重视和科技项目的长期滚动资助,以及CARDC团队锲而不舍的坚持、不辞辛劳的努力和大张旗鼓的宣传推动下,开创了我国海洋科学数据开放共享的先河,赢得了海洋界,特别是科技界和气象界的普遍赞誉。我们的切身体会主要包括如下几个方面:
1、拥有海量、知识产权明晰的海洋环境要素数据源是Argo数据开放共享的基础。作为全球Argo实时海洋观测网的重要组成部分,中国Argo计划在邻近我国的西太平洋、东印度洋和南海海域建立了Argo大洋观测网的框架,有能力对海洋上层(0-2000m水深)的海水温度和盐度等海洋环境要素进行长期、实时和大范围的监测。在过去18年里,我国Argo计划累计布放了400多个剖面浮标,共接收到60000余条温、盐度剖面(部分含溶解氧剖面);同时,我国还是国际Argo计划成员国,有权利共享其他成员国布放的全部浮标观测资料,累计接收到的温、盐度剖面多达200万条(部分还含溶解氧、pH、叶绿素和硝酸盐等生物地球化学要素剖面),而且每年还会持续接收约14万条观测剖面。这些源源不断的、来自深海大洋的物理海洋和生物地球化学环境要素资料,为监测、研究全球海洋和气候变化,特别是我国邻近海域的上层海洋结构和变异等建立了前所未有的数据源,尤其是为海洋科学数据在我国的开放共享打下了坚实的基础。
2、拥有权威性、高质量的海洋环境要素资料是Argo数据开放共享的可靠保证。原始Argo观测数据必须经过预处理和质量控制才能使用,我们主要通过建立实时和延时两种质量控制模式,进行严格把关。全球Argo资料中心的Argo数据虽然经过了各国资料中心的实时质量控制,但由于从事数据质量控制技术人员的业务素质和责任意识的差异,导致资料质量依然会参差不齐。另外,自动剖面浮标在海上长期工作后,其传感器特别是电导率传感器会产生漂移或偏移等故障,导致观测数据出现较大偏差。我们利用历史观测资料和浮标附近的CTD仪或其它(如卫星遥感)观测资料,对存在传感器测量误差的浮标数据进行质量评估及延时质量控制,从而确保所提供的Argo资料具有较高的质量水平。目前不但能及时接收全球海洋上的全部剖面浮标的观测资料,还具备了实时批量处理的能力。我国的浮标资料做到了24小时内即可在线发布在“中国Argo实时资料中心”网站上,供国内外用户及时下载应用。
3、拥有丰富多彩、长时间序列的海洋环境要素数据产品是Argo数据开放共享经久不衰的生命源泉。由于自动剖面浮标投放入海后会“随波逐流”漂移,所以其测量过程具有“拉格朗日”移动特性,观测剖面的空间分布极不均匀,给用户直接使用这类资料带来困难。针对用户对网格化Argo产品的迫切需求,先后研制、制作了十多个Argo网格资料集及其衍生数据产品(如全球三维温盐度数据产品、全球海洋热含量数据集、全球Argo网格化产品、Argo网格化温盐产品和亚印太交汇区海洋再分析数据集等)。部分受用户普遍欢迎的网格数据产品(如全球海洋Argo散点资料集和全球海洋Argo网格数据集等)还做到了每年定期更新,且还会补充一些新研制的资料集或者衍生数据产品(如太平洋Argo网格资料集、热带太平洋海域Argo衍生数据产品(热、盐含量)和西太平洋海域Argo衍生数据产品(混合层、温跃层)等),不断推陈出新,以吸引更多的用户关注并利用Argo数据。
4、拥有一个具有高可扩展存储与安全管理能力的综合数据库是Argo数据开放共享的重要保障。采用HDFS和PostgreSQL/PostGIS混合存储模式,实现了对全球海量Argo资料的高可扩展存储与安全管理。全球Argo资料综合数据库由基础空间地理信息库、Argo元数据库、浮标布放信息库、Argo剖面信息库和Argo详细信息观测库等组成,存储了包含海洋地理信息基础数据、Argo剖面观测信息及文本等在内的海量多源异构数据。在实际业务应用中,当数据规模大到单一节点的关系数据库无法支撑时,可采用垂直扩展与水平扩展相结合的方式对数据库进行扩容,以满足存储需求。数据库还集成了数据冗余备份存储机制,具有可靠的数据备份保障。利用数据实时监听与自动入库程序,全球Argo资料综合数据库实现了资料的业务化接收与常态化更新,并具备了100TB级的自动增量存储能力,可满足未来50年全球海量Argo资料的存储需求。
5、拥有一个便捷、无障碍访问的用户应用平台是海洋科学数据开放共享的重要窗口。中国Argo实时资料中心长期以来承担了全球海洋Argo数据的收集工作,这些资料经质量控制后在线发布在“中国Argo实时资料中心”网站上,供国内外用户无条件免费下载使用,早期还曾制作成数据光盘,不定期地向国内7个系统45个部门和单位的用户分发。据不完全统计,累计发放Argo数据光盘500余张,访问中国Argo实时资料中心网站(http://www.argo.org.cn)的用户累计达数万人次;与某基地气象中心建立的专线连接,可准实时推送经实时质量控制的Argo观测资料,另外还主动为涉海/气象业务单位和科研院校(如上海海洋气象台和上海海洋大学等)安装Argo数据网络共享服务平台等,使得国内业务和科研部门能及时获得经质量控制的高质量Argo资料;还建立了与浙江省气象局的FTP连接,每天可将我国Argo观测网内获取的实时海洋资料,通过国家气象局设在北京的GTS节点发布,供各WMO成员国气象业务部门使用。
6、拥有一批海洋环境要素数据及其衍生数据产品的长期用户是Argo数据开放共享的源动力。Argo资料及其衍生数据产品的公开发布和无条件免费分发,有力地支持了国家重大基础研究计划和全球气候变化专项项目,以及一批由国家自然科学基金委员会和国家部属教育、科研院所开放实验室等部门和单位资助的与全球气候变化和深海大洋研究有关的项目,为促进行业科技进步发挥了重要作用。我国开展的多个涉海重大基础研究项目,如:“亚印太交汇区海气相互作用及其对我国短期气候的影响”(973计划)、“北太平洋副热带环流变异及其对我国近海动力环境的影响”(973计划),以及一批由国家自然科学基金委员会和国家部属教育、科研院所开放实验室等部门和单位资助的与深海大洋研究有关的项目,已经把全球Argo实时海洋观测网当作收集深海大洋物理海洋观测资料的主要渠道,而Argo数据更已成为广大研究者利用的必备基础资料。特别如“基于全球实时海洋观测计划(Argo)的上层海洋结构、变异及预测研究”(973计划)项目,其立项就建立在拥有Argo资料的基础上,其研究工作对Argo 资料的依赖性更是不言而喻。该项目利用Argo浮标、卫星高度计等观测资料建立的业务化海洋资料同化系统,也已在国家海洋信息中心得到业务化应用。此外,由中国Argo实时资料中心提供的全球Argo数据也已在国内海洋和气象领域的业务预测预报中得到应用。如:国家海洋环境预报中心把Argo资料应用到“热带太平洋温度盐度同化业务化系统”中,可以业务化运行发布月平均的热带太平洋同化再分析产品等;国家气候中心“利用含Argo资料在内的观测资料,提高了该中心的短期气候预测业务模式系统的模拟预测能力”;国家海洋局南海预报中心在 “南海海洋灾害中长期预测业务”中广泛使用了Argo资料,取得了较好的预测效果;东海水产研究所在其开展的“大洋金枪鱼渔情的速预报业务”和“大洋金枪鱼洄游规律及渔场形成机制的研究”项目中使用了Argo资料提供的渔场垂直温盐信息,且发挥了重要作用。
与此同时,Argo数据开放共享,也离不开媒体的大力宣传。中国Argo从2003年起,主动承办了多次国际Argo会议(如AST-5,2003杭州; ADMT-7,2006天津;ASW-3和AST-10,2009杭州;ADMT-17,2016天津;生物地球化学Argo技术与应用国际研讨会,2017杭州;首次国际BGC-Argo科学组会议,2019杭州),并主办了2次国内Argo科学研讨会(2006杭州、2013舟山)。2019年在国际Argo计划实施及其全球Argo实时海洋观测网建设20周年之际,我国还在杭州承办了第20次国际Argo指导组年会(AST-20)。不仅提高了我国在国际Argo成员国中的地位和作用,而且也扩大了Argo在国内的影响力,吸引了更多Argo用户。
为了推广Argo资料在国内的应用,以及沟通与国际Argo组织(AST、ADMT、AIC)和各成员国之间的联系及其资料的交换共享,早在2002年就创建了中国Argo中英文宣传网页,随后升级为中国Argo实时资料中心网站(www.argo.org.cn),辟有“项目介绍”、“Argo动态”、“研究成果”、“Argo科普”、“实时资料”、“数据产品”和“Argo网络平台”等栏目,每年定期更新(每季度一次);自从2003年开始还不定期编发“Argo简讯”,辟有“项目进展”、“应用研究”、“国内动态”、“国际动态”和“会议动态”等栏目,2012年进入定期编发状态,每季度一期;2002年10月首发全球Argo资料数据光盘,以后根据用户需求不定期刻录分发,并随着Argo网站访问速度的提高和“Argo网络平台”的业务运行,发放Argo数据光盘的数量则在不断减少;自从2002年由海洋出版社公开出版发行第一本介绍Argo计划的科普书籍以来,到目前为止已经公开出版发行涉及Argo的论文集和专著等5册。
中国Argo实时资料中心还利用承办Argo指导组年会、Argo资料管理组会议和Argo科学研讨会等机会,扩大Argo在我国的影响力。既尽到了一个Argo成员国的职责和义务,又赢得了较好的国际声誉。同时,通过组织承办学术研讨会和参加国内各种相关学术会议,以及报刊杂志、网络电视等媒体(每当Argo计划取得具有“里程碑”意义的成就,如全球海洋上活跃浮标数量达到3000个、4000个和观测剖面总数达到100、200万条的时候,以及Argo计划实施10、15、20周年的关键节点上),通过PPT会议演讲、拍摄专题片在中央电视台播放、出版科普/会议文集/专著等书籍公开发行,以及发放Argo宣传台历、海报等手段,大力宣传Argo计划及其全球Argo实时海洋观测网建设的现状和发展前景,免费分发Argo数据光盘,从而促进了Argo资料在相关科学领域(海洋、气象、大气、水产、教育和军事等)中的迅速推广应用,取得了丰硕的调查研究成果。据国际Argo计划办公室的一份统计材料表明,1998年以来我国科学家在全球23种主要学术刊物上累计发表涉及Argo的学术论文就达520篇,仅次于美国(1010篇),排名世界第二。然而,在过去18年间,我国累计投入的调查资金仅约1亿元(不含研究经费),布放浮标仅400多个,获得的温、盐度剖面(含部分溶解氧剖面)也仅60000条。但若按照常规的船载CTD仪测量一条剖面费用(约10万元)的8折估算,需要投入的调查经费至少约48亿元;同时,我国又收集并共享了其他Argo成员国布放的浮标观测剖面200多万条,为国家节省的调查资金则多达1600亿元,经济效益极其可观。
三、Argo数据持续开放共享亟需国家层面的统筹协调
Argo大洋观测网建设、维护,看似一项科技基础性工作,如同沿岸海洋台站观测网或者陆地上的气象观测站(网),应归属业务部门管理,给予财政预算的长期支持,一些国际Argo成员国也是这么做的,但在国内现行的科技体制下似乎还行不通,只能长期依赖科研项目(如国家基础研究重大专项前期研究项目、国际合作项目、海洋公益性专项、国家基础研究重大专项、科技基础性工作专项等)滚动支持。当然,从长远来看,我国Argo计划的实施和Argo大洋观测网的建设亟需创新的海洋调查体制机制,并适当调整科研项目的立项原则和重点支持方向,对参加重大国际合作计划、数据共享规范、用户广泛且遍布众多领域的观测项目给予重点扶持,其中健全并稳定一支专门从事自动剖面浮标检测与优化布放,数据校正方法与质量控制技术研究,数据产品研发与共享服务的高水平科技人才队伍,显得至关重要。
在国家重点基础研究发展计划(973)“我国重大气候灾害的形成机理和预测理论研究”(1998-2003年)、国家基础研究重大项目前期研究专项“我国新一代海洋实时观测系统(Argo)—大洋观测网试验”(2002-2003年)、科技部国际重点合作项目“太平洋-印度洋暖池的Argo浮标观测研究”(2003-2007年)、国家海洋公益性行业科研专项“西北太平洋Argo剖面浮标观测及其应用研究”(2007-2009年)、国家重点基础研究发展计划(973)“基于全球实时海洋观测计划(Argo)的上层海洋结构、变异及预测研究”(2007-2011年)、国家海洋公益性行业科研专项“印度洋海域海洋环境数值预报系统研制与示范”(2010-2012年)、国家科技基础性工作专项“西太平洋Argo实时海洋调查”(2012-2017年)和财政部国家重点实验室科研仪器设备专项“自动剖面浮标实时海洋观测系统”(2017-2018年)等项目、课题的滚动资助下,围绕我国和国际Argo计划的组织实施、中国Argo大洋观测网和全球Argo实时海洋观测网建设与维护,CARDC做了大量科技基础性工作,无条件免费提供的覆盖全球海洋的、高分辨率的、高质量的Argo资料及其衍生数据产品,得到了国内外许多单位和众多专家学者,特别是涉海院校和科研院所在读研究生们广泛应用,取得了许多创新的原始成果,收到了良好的社会效益,以及巨大的间接经济效益,也为国家节省了巨额海洋调查经费,更为我国海洋界提供了一个践行海洋科学数据开放共享的极好机会。
一、国际Argo计划的成功实践
Argo计划在短短20年间取得的举世瞩目成就,特别是收集的海量高精度海洋环境要素资料,不仅为沿海国家海洋资源开发、蓝色经济发展和应对全球气候变化等提供了丰富的基础数据和科学依据,更为全人类积累了一大批宝贵的自然财富,这与Argo计划的缜密组织实施是分不开的。早在该计划实施之初,就成立了Argo指导组和Argo资料管理组两个专门小组,前者负责观测网的设计和协调,规范的制订和监督,以及问题的收集和解决等;后者负责为浮标资料制订标准,研发统一的资料校正和质量控制方法,以及规定资料交换的统一格式等。针对浮标观测中遇到的传感器质量或者浮标性能问题,会及时组织浮标、传感器研制技术人员和资料分析研究人员共同攻关,提出改进措施和解决办法等,或者通过观测资料的后处理和高标准的质量控制给予弥补,以确保提供的观测数据能达到统一的标准。上述两个小组每年定期各举行一次会议,并不定期地举办浮标和传感器技术研讨会、观测资料校正和质量控制培训班等;还每隔2-3年举行一次Argo科学研讨会,检验Argo资料被各国和各领域科学家应用及其取得的成果等情况,并听取用户对浮标技术、观测网、观测要素和测量频次等的改进意见和建议,使得观测网建设、资料质量控制和数据共享与应用研究这两支队伍,既能发挥各自的专长,又能紧密地结合在一起,相辅相成,收效十分显著。
为了保证浮标在海上长期工作所获取的剖面资料有较高的质量,美国、法国和德国等国家的科学家还开发了Argo延时模式质量控制方法,利用浮标附近的历史水文观测资料进行检验和校正。除了要求在布放浮标时,尽可能使用专业的科学调查船(配备船载CTD仪,并携带玫瑰型采水器),以便准同步获取浮标布放期间的船载CTD仪测量剖面和特定层次上的海水样品,再采用高精度实验室盐度计测出各层的盐度值,以此来检验船载CTD仪的观测精度,以及用来校正或验证剖面浮标观测资料的质量外,还专门制作了一个Argo参考数据库,用来快速、自动检验浮标观测资料的质量。该数据库主要收集了船载CTD仪的历史观测资料,且只有通过了采水器(瓶)数据检验或校正后的才能加入到该数据库中。对一些海区因符合要求的历史高质量船载CTD剖面资料十分罕见或者难以收集,还采取了将经过严格质量控制的高质量历史Argo资料加入参考数据库中的措施,来弥补对这些海区浮标观测资料快速、自动检验,以及质量控制的需求。此外,国际Argo组织为了确保全球Argo海洋观测网中由近40个国家和团体布放的约20种型号(通过国际认证)的上万个浮标所提供的观测资料,既能符合统一的观测精度,又能确保它们的可靠性和一致性,针对剖面浮标准入、传感器选型、观测信息收集和观测资料格式及其质量控制等,研究并制订了一系列标准、方法、措施和程序,而且还在不断改进和补充完善中。
在2019年3月结束的第20次国际Argo指导组(AST-20)会议上,AST又正式提出了一份“Argo2020愿景”规划,设想从2020年起实施一个加强版的Argo计划,维持一个由4700个活跃浮标组成的全球性、全海深和多学科(包括物理海洋和生物地球化学)海洋观测网,不仅可以通过基础研究,提高人们对海洋、气候变化的评估和认识,还可以通过改进长期海洋再分析和预报模型及其模式参数化等,提高对海洋和天气/气候的业务预测预报水平,从而达到更好地监控当前气候变化和生态系统健康的目的,使得全社会能更好地适应气候变化;而且,海洋热量、淡水和生物地球化学等环境要素观测资料的实时同化,还能进一步提高短期预报的水平,这对气候敏感行业(如农业、水产养殖业、渔业、海洋石油和天然气产业等)的持续发展同样至关重要。新版Argo计划还会将Core-Argo、BGC-Argo和Deep-Argo等子计划收集的物理和生物地球化学环境要素资料统一集成在一个综合的Argo数据管理系统中,继续给予广大用户最好、最大化的利用Argo数据的无障碍环境(免费共享),进一步促进Argo资料在科研教育、海洋资源开发、蓝色经济发展和气候变化适应等科学和社会领域的广泛应用。
二、中国Argo计划的跟跑尝试
由于海上现场观测数据获取的艰辛、代价的高昂和覆盖区域及其数量的稀缺,以及数据质量的参差不齐,海洋科学数据开放共享在国内一直是个老大难问题。本世纪初参与的国际Argo计划,恰好给了我国海洋界一个践行海洋科学数据开放共享的难得契机,中国Argo实时资料中心(CARDC)也就义不容辞地肩负起了这一光荣而又艰巨的使命。在科技部基础研究司及相关处室至少三任领导的接力重视和科技项目的长期滚动资助,以及CARDC团队锲而不舍的坚持、不辞辛劳的努力和大张旗鼓的宣传推动下,开创了我国海洋科学数据开放共享的先河,赢得了海洋界,特别是科技界和气象界的普遍赞誉。我们的切身体会主要包括如下几个方面:
1、拥有海量、知识产权明晰的海洋环境要素数据源是Argo数据开放共享的基础。作为全球Argo实时海洋观测网的重要组成部分,中国Argo计划在邻近我国的西太平洋、东印度洋和南海海域建立了Argo大洋观测网的框架,有能力对海洋上层(0-2000m水深)的海水温度和盐度等海洋环境要素进行长期、实时和大范围的监测。在过去18年里,我国Argo计划累计布放了400多个剖面浮标,共接收到60000余条温、盐度剖面(部分含溶解氧剖面);同时,我国还是国际Argo计划成员国,有权利共享其他成员国布放的全部浮标观测资料,累计接收到的温、盐度剖面多达200万条(部分还含溶解氧、pH、叶绿素和硝酸盐等生物地球化学要素剖面),而且每年还会持续接收约14万条观测剖面。这些源源不断的、来自深海大洋的物理海洋和生物地球化学环境要素资料,为监测、研究全球海洋和气候变化,特别是我国邻近海域的上层海洋结构和变异等建立了前所未有的数据源,尤其是为海洋科学数据在我国的开放共享打下了坚实的基础。
2、拥有权威性、高质量的海洋环境要素资料是Argo数据开放共享的可靠保证。原始Argo观测数据必须经过预处理和质量控制才能使用,我们主要通过建立实时和延时两种质量控制模式,进行严格把关。全球Argo资料中心的Argo数据虽然经过了各国资料中心的实时质量控制,但由于从事数据质量控制技术人员的业务素质和责任意识的差异,导致资料质量依然会参差不齐。另外,自动剖面浮标在海上长期工作后,其传感器特别是电导率传感器会产生漂移或偏移等故障,导致观测数据出现较大偏差。我们利用历史观测资料和浮标附近的CTD仪或其它(如卫星遥感)观测资料,对存在传感器测量误差的浮标数据进行质量评估及延时质量控制,从而确保所提供的Argo资料具有较高的质量水平。目前不但能及时接收全球海洋上的全部剖面浮标的观测资料,还具备了实时批量处理的能力。我国的浮标资料做到了24小时内即可在线发布在“中国Argo实时资料中心”网站上,供国内外用户及时下载应用。
3、拥有丰富多彩、长时间序列的海洋环境要素数据产品是Argo数据开放共享经久不衰的生命源泉。由于自动剖面浮标投放入海后会“随波逐流”漂移,所以其测量过程具有“拉格朗日”移动特性,观测剖面的空间分布极不均匀,给用户直接使用这类资料带来困难。针对用户对网格化Argo产品的迫切需求,先后研制、制作了十多个Argo网格资料集及其衍生数据产品(如全球三维温盐度数据产品、全球海洋热含量数据集、全球Argo网格化产品、Argo网格化温盐产品和亚印太交汇区海洋再分析数据集等)。部分受用户普遍欢迎的网格数据产品(如全球海洋Argo散点资料集和全球海洋Argo网格数据集等)还做到了每年定期更新,且还会补充一些新研制的资料集或者衍生数据产品(如太平洋Argo网格资料集、热带太平洋海域Argo衍生数据产品(热、盐含量)和西太平洋海域Argo衍生数据产品(混合层、温跃层)等),不断推陈出新,以吸引更多的用户关注并利用Argo数据。
4、拥有一个具有高可扩展存储与安全管理能力的综合数据库是Argo数据开放共享的重要保障。采用HDFS和PostgreSQL/PostGIS混合存储模式,实现了对全球海量Argo资料的高可扩展存储与安全管理。全球Argo资料综合数据库由基础空间地理信息库、Argo元数据库、浮标布放信息库、Argo剖面信息库和Argo详细信息观测库等组成,存储了包含海洋地理信息基础数据、Argo剖面观测信息及文本等在内的海量多源异构数据。在实际业务应用中,当数据规模大到单一节点的关系数据库无法支撑时,可采用垂直扩展与水平扩展相结合的方式对数据库进行扩容,以满足存储需求。数据库还集成了数据冗余备份存储机制,具有可靠的数据备份保障。利用数据实时监听与自动入库程序,全球Argo资料综合数据库实现了资料的业务化接收与常态化更新,并具备了100TB级的自动增量存储能力,可满足未来50年全球海量Argo资料的存储需求。
5、拥有一个便捷、无障碍访问的用户应用平台是海洋科学数据开放共享的重要窗口。中国Argo实时资料中心长期以来承担了全球海洋Argo数据的收集工作,这些资料经质量控制后在线发布在“中国Argo实时资料中心”网站上,供国内外用户无条件免费下载使用,早期还曾制作成数据光盘,不定期地向国内7个系统45个部门和单位的用户分发。据不完全统计,累计发放Argo数据光盘500余张,访问中国Argo实时资料中心网站(http://www.argo.org.cn)的用户累计达数万人次;与某基地气象中心建立的专线连接,可准实时推送经实时质量控制的Argo观测资料,另外还主动为涉海/气象业务单位和科研院校(如上海海洋气象台和上海海洋大学等)安装Argo数据网络共享服务平台等,使得国内业务和科研部门能及时获得经质量控制的高质量Argo资料;还建立了与浙江省气象局的FTP连接,每天可将我国Argo观测网内获取的实时海洋资料,通过国家气象局设在北京的GTS节点发布,供各WMO成员国气象业务部门使用。
6、拥有一批海洋环境要素数据及其衍生数据产品的长期用户是Argo数据开放共享的源动力。Argo资料及其衍生数据产品的公开发布和无条件免费分发,有力地支持了国家重大基础研究计划和全球气候变化专项项目,以及一批由国家自然科学基金委员会和国家部属教育、科研院所开放实验室等部门和单位资助的与全球气候变化和深海大洋研究有关的项目,为促进行业科技进步发挥了重要作用。我国开展的多个涉海重大基础研究项目,如:“亚印太交汇区海气相互作用及其对我国短期气候的影响”(973计划)、“北太平洋副热带环流变异及其对我国近海动力环境的影响”(973计划),以及一批由国家自然科学基金委员会和国家部属教育、科研院所开放实验室等部门和单位资助的与深海大洋研究有关的项目,已经把全球Argo实时海洋观测网当作收集深海大洋物理海洋观测资料的主要渠道,而Argo数据更已成为广大研究者利用的必备基础资料。特别如“基于全球实时海洋观测计划(Argo)的上层海洋结构、变异及预测研究”(973计划)项目,其立项就建立在拥有Argo资料的基础上,其研究工作对Argo 资料的依赖性更是不言而喻。该项目利用Argo浮标、卫星高度计等观测资料建立的业务化海洋资料同化系统,也已在国家海洋信息中心得到业务化应用。此外,由中国Argo实时资料中心提供的全球Argo数据也已在国内海洋和气象领域的业务预测预报中得到应用。如:国家海洋环境预报中心把Argo资料应用到“热带太平洋温度盐度同化业务化系统”中,可以业务化运行发布月平均的热带太平洋同化再分析产品等;国家气候中心“利用含Argo资料在内的观测资料,提高了该中心的短期气候预测业务模式系统的模拟预测能力”;国家海洋局南海预报中心在 “南海海洋灾害中长期预测业务”中广泛使用了Argo资料,取得了较好的预测效果;东海水产研究所在其开展的“大洋金枪鱼渔情的速预报业务”和“大洋金枪鱼洄游规律及渔场形成机制的研究”项目中使用了Argo资料提供的渔场垂直温盐信息,且发挥了重要作用。
与此同时,Argo数据开放共享,也离不开媒体的大力宣传。中国Argo从2003年起,主动承办了多次国际Argo会议(如AST-5,2003杭州; ADMT-7,2006天津;ASW-3和AST-10,2009杭州;ADMT-17,2016天津;生物地球化学Argo技术与应用国际研讨会,2017杭州;首次国际BGC-Argo科学组会议,2019杭州),并主办了2次国内Argo科学研讨会(2006杭州、2013舟山)。2019年在国际Argo计划实施及其全球Argo实时海洋观测网建设20周年之际,我国还在杭州承办了第20次国际Argo指导组年会(AST-20)。不仅提高了我国在国际Argo成员国中的地位和作用,而且也扩大了Argo在国内的影响力,吸引了更多Argo用户。
为了推广Argo资料在国内的应用,以及沟通与国际Argo组织(AST、ADMT、AIC)和各成员国之间的联系及其资料的交换共享,早在2002年就创建了中国Argo中英文宣传网页,随后升级为中国Argo实时资料中心网站(www.argo.org.cn),辟有“项目介绍”、“Argo动态”、“研究成果”、“Argo科普”、“实时资料”、“数据产品”和“Argo网络平台”等栏目,每年定期更新(每季度一次);自从2003年开始还不定期编发“Argo简讯”,辟有“项目进展”、“应用研究”、“国内动态”、“国际动态”和“会议动态”等栏目,2012年进入定期编发状态,每季度一期;2002年10月首发全球Argo资料数据光盘,以后根据用户需求不定期刻录分发,并随着Argo网站访问速度的提高和“Argo网络平台”的业务运行,发放Argo数据光盘的数量则在不断减少;自从2002年由海洋出版社公开出版发行第一本介绍Argo计划的科普书籍以来,到目前为止已经公开出版发行涉及Argo的论文集和专著等5册。
中国Argo实时资料中心还利用承办Argo指导组年会、Argo资料管理组会议和Argo科学研讨会等机会,扩大Argo在我国的影响力。既尽到了一个Argo成员国的职责和义务,又赢得了较好的国际声誉。同时,通过组织承办学术研讨会和参加国内各种相关学术会议,以及报刊杂志、网络电视等媒体(每当Argo计划取得具有“里程碑”意义的成就,如全球海洋上活跃浮标数量达到3000个、4000个和观测剖面总数达到100、200万条的时候,以及Argo计划实施10、15、20周年的关键节点上),通过PPT会议演讲、拍摄专题片在中央电视台播放、出版科普/会议文集/专著等书籍公开发行,以及发放Argo宣传台历、海报等手段,大力宣传Argo计划及其全球Argo实时海洋观测网建设的现状和发展前景,免费分发Argo数据光盘,从而促进了Argo资料在相关科学领域(海洋、气象、大气、水产、教育和军事等)中的迅速推广应用,取得了丰硕的调查研究成果。据国际Argo计划办公室的一份统计材料表明,1998年以来我国科学家在全球23种主要学术刊物上累计发表涉及Argo的学术论文就达520篇,仅次于美国(1010篇),排名世界第二。然而,在过去18年间,我国累计投入的调查资金仅约1亿元(不含研究经费),布放浮标仅400多个,获得的温、盐度剖面(含部分溶解氧剖面)也仅60000条。但若按照常规的船载CTD仪测量一条剖面费用(约10万元)的8折估算,需要投入的调查经费至少约48亿元;同时,我国又收集并共享了其他Argo成员国布放的浮标观测剖面200多万条,为国家节省的调查资金则多达1600亿元,经济效益极其可观。
三、Argo数据持续开放共享亟需国家层面的统筹协调
Argo大洋观测网建设、维护,看似一项科技基础性工作,如同沿岸海洋台站观测网或者陆地上的气象观测站(网),应归属业务部门管理,给予财政预算的长期支持,一些国际Argo成员国也是这么做的,但在国内现行的科技体制下似乎还行不通,只能长期依赖科研项目(如国家基础研究重大专项前期研究项目、国际合作项目、海洋公益性专项、国家基础研究重大专项、科技基础性工作专项等)滚动支持。当然,从长远来看,我国Argo计划的实施和Argo大洋观测网的建设亟需创新的海洋调查体制机制,并适当调整科研项目的立项原则和重点支持方向,对参加重大国际合作计划、数据共享规范、用户广泛且遍布众多领域的观测项目给予重点扶持,其中健全并稳定一支专门从事自动剖面浮标检测与优化布放,数据校正方法与质量控制技术研究,数据产品研发与共享服务的高水平科技人才队伍,显得至关重要。