Argo资料质量一般?
众所周知,国际Argo计划自2000年实施以来,在30多个国家和国际组织的共同努力下,已经在全球海洋中布放了超过12,000个自动剖面浮标,累计获取了约160万条温、盐度剖面和部分涉及生物地球化学要素(如溶解氧、叶绿素、pH和硝酸盐等)的观测剖面。目前,在海上正常工作的浮标已经接近4000个,每年能新增约14万条观测剖面。随着时间推移,全球Argo资料集的时间序列也在不断延长,Argo资料已经成为海洋与大气科学领域开展基础研究和业务化预测预报的主要数据源。而且早在Argo计划实施之初,国际Argo组织就分别在美国和法国设立了两个全球Argo资料中心(GDAC),用来汇集和交换共享各Argo计划成员国布放的自动剖面浮标观测资料。但目前,在世界上还只有9个国家(美国、法国、澳大利亚、英国、加拿大、日本、韩国、印度和中国)有能力向GDAC实时提交Argo资料。这些国家的Argo资料中心,虽已按照国际Argo资料管理组(ADMT)要求和制定的实时质量控制规程,对提交的每条剖面做过质量控制,并采取统一的格式(NetCDF)进行交换共享。但是,各资料中心提交的数据质量的确存在参差不齐的现象,究其原因可能与解码软件编写有误(需要浮标用户自行编写代码)、某批次浮标本身存在技术缺陷、用于实时质量控制的阈值选取过于宽泛,以及审核技术人员专业知识或实践经验不足,甚至忽视人工审核等环节有关。况且,近些年来,随着传感器技术的发展,越来越多的自动剖面浮标加装了生物光学及生物地球化学传感器等,使得Argo资料集变得愈加复杂;有些Argo资料新用户更是不了解NetCDF格式的存储方式,导致用户在读取和使用数据时遇到了较大困难,误将因用户本身对Argo资料质量控制规程的不熟悉,甚至忽视了关键的人工审核关而引入的种种本应纠正或校正的问题,归结为Argo资料的质量不高,显然有失公允。
为了以正视听,便于国内Argo用户准确获取Argo资料,现将中国Argo实时资料中心(CARDC)不定期制作全球Argo资料集的详细过程介绍如下,方便用户从GDAC网站随时下载由各Argo成员国布放在全球海洋中的全部自动剖面浮标的观测资料,并自行实施质量再控制工作;也可以通过互联网直接从CARDC网站(www.argo.org.cn)免费下载经过质量再控制的、最新版全球Argo资料集(当前版本为V2.1,包含了1997/07-2016/12期间的全部自动剖面浮标观测资料,通常每年更新一次)。
1 Argo资料集制作过程
(1)数据来源
Argo资料用户可以通过FTP从法国海洋开发研究院(IFREMER)的GDAC服务器(ftp.ifremer.fr/ifremer/argo/),下载由各Argo成员国布放在全球海洋中的所有自动剖面浮标观测的温度、电导率(盐度)、压力(深度)等物理海洋环境要素数据,以及部分涉及生物地球化学要素(如溶解氧、叶绿素、pH和硝酸盐等)的观测数据。需要指出的是,各国Argo资料中心在提交经实时(24小时内)质量控制的Argo数据同时,还会不定期地提交经延时(约3个月左右)模式质量控制的数据。众所周知,对Argo数据的延时模式质量控制过程比较复杂,需要耗费较多的时间和人力资源,一些国家因缺少人手或经费,导致许多浮标虽已在海上工作了较长时间,但其观测资料却未能及时获得延时模式质量控制;而一旦经费有着落,就会安排人员进行这项工作,故一些历史Argo资料随时都有可能被更新。为此,CARDC在制作或更新Argo资料集时,通常每次都会下载所有浮标的数据文件,而不是仅下载那些新浮标的观测数据。
在GDAC服务器上,每个浮标的所有剖面数据通常包含在一个多剖面文件内,其文件名格式为XXXXXXX_prof.nc,这里XXXXXXX为浮标的WMO编号,如由中国Argo布放的2902700号浮标,其多剖面文件存放路径为ftp.ifremer.fr/ifremer/argo/dac/csio/2902700/2902700_prof.nc;而携带生物地球化学传感器(BGC)的自动剖面浮标,通常会包含一个核心Argo(即温、盐度和压力)数据文件和一个BGC数据文件,文件名格式分别为XXXXXXX_prof.nc和XXXXXXX_Mprof.nc。在下载这些文件时,通常需要用到由GDAC提供的包含所有浮标观测剖面的索引表(ar_index_global_prof.txt),可以帮助用户精确定位每个浮标数据文件的存放目录,避免出现遗漏。
(2)读取和写入数据
用户可以使用MATLAB方便地读取NetCDF格式的Argo数据文件。当然,在读取之前,需要在用户的计算机上安装snctools工具包(可从网址https://svn.code.sf.net/p/mexcdf/svn/snctools/trunk/下载),也可使用高于R2008a版本的MATLAB,并自行编写读取数据的脚本(或程序),但需周全考虑数据的复杂性,如有些浮标的剖面观测数据并没有对压力、温度和盐度进行校正,其校正项应使用原始数据,而对于存在校正项的浮标数据,则应分别提取;有些浮标除了温、盐度外,还有生物地球化学要素,而且有些要素的观测层次并不与温、盐度的观测层次相同,即存在多个深度轴;有些浮标在观测生物地球化学要素的同时,还通过CTD传感器额外再观测海水的温、盐度,即一个循环中存在一条以上温、盐度剖面等。这些不确定因素,用户在编写脚本时均须考虑周全,否则在读取数据过程中会容易出错。同时,也不能使脚本变得太复杂,导致读取过程缓慢,耗时过长。
为了方便对下载后的数据进行质量再控制或用于其他计算、绘图等,可以选取ASCII码(或文本方式)作为数据的写入方式,文件命名规则为XXXXXXX_NNN.dat,这里XXXXXXX为浮标的WMO编号,NNN为剖面序号。存储的内容主要包括两部分,第一部分为表头信息,包含浮标的编号、类型、通讯方式、所属项目名称、国家、PI(负责人)、采样方向、数据模式、观测时间、定位经纬度、观测要素名称和深度轴信息等;第二部分则为浮标的所有观测数据,包括各要素的原始值、校正值和质控标记等(详见《全球Argo资料集(V2.1)用户手册》)。
(3)数据质量再控制
虽然ADMT已经制定了有关Argo资料的实时和延时模式质量控制规程,但各国Argo资料中心在具体执行时,由于投入的人力有限或者缺少具备专业知识的人员操作,更有甚者解码过程存在明显错误,导致提交至GDAC的Argo资料质量参差不齐,有些资料甚至无法用于科学研究。所以,在正式用于基础研究或业务化预测预报时,需要对从GDAC网站下载的Argo资料进行严格审核或质量再控制。该过程主要包括以下两个步骤:
第一步由计算机自动检验完成。主要检验浮标有效的观测层数和观测时间,剔除那些观测层数过少或观测时间有误的剖面。通过编写的MATLAB脚本对所有数据文件内的数据进行自动读取,并提取质控标记为“1”的有效温、盐度和压力数据。当有效数据的层数少于10个时,则删除该数据文件;且当剖面观测时间小于1996年1月1日(自动剖面浮标问世之前)或者大于当前日期(用户下载数据文件之日)时,同样应删除该数据文件。
第二步须由人工审核完成。针对计算机无法自动检验出的数据质量问题,如存在明显错误或异常的数据,以及浮标漂移轨迹中存在的定位异常等,则需要通过绘制图件并由具备专业知识的技术人员,逐一检查审核。这些图件包括每个浮标观测的温度瀑布和温度垂直分布、盐度瀑布和盐度垂直分布、T-S曲线和浮标漂移轨迹等(图1a);有的还包含了溶解氧垂直分布(图1b);也有的还带有多深度轴(图1c)等。
在人工审核每个浮标的图件、并发现某些剖面数据存在明显异常或错误时,需要通过MATLAB脚本查出这些异常或错误所在的文件名,而后再打开该文件,进一步查看对应的数据项,直到找出异常数据的位置,修改对应于这些数据的质控标记,以此类推。这一步通常不对存在明显异常或错误的数据做任何校正处理,只是将原来的质控标记“1”(好)调整为“3”(有可能被校正的坏数据)或“4”(坏数据),以便提醒资料用户在利用该浮标或剖面时特别留意。一般情况下,建议用户尽量利用质控标记为“1”(好)的数据。
还需指出的是,由于ADMT对于生物地球化学要素(如溶解氧、叶绿素、pH和硝酸盐等)还没有制定出完善的质量控制规程,而且一些国家的Argo资料中心也没有能力对这些生物地球化学要素进行质量控制(通常质控标记为“0”,表示“未进行质量控制”)。目前,CARDC也还没有配备相应的专业技术人员对这些观测要素进行人工审核或质量再控制,完全保留了从GDAC网站下载的NetCDF文件中的原始数据。若用户需利用这些生物地球化学要素(如溶解氧、叶绿素、pH和硝酸盐等)开展基础研究或业务应用时,务必对这些观测数据自行进行质量控制或评估。
2 国际共享Argo数据中存在的问题
CARDC在近期制作新版《全球Argo资料集(V2.1)》(1997/07-2016/12)时,从法国海洋开发研究院(IFREMER)的GDAC服务器(ftp.ifremer.fr/ifremer/argo/)下载了1997年7月至2017年2月期间由各Argo成员国布放的11,856个自动剖面浮标观测的全部剖面(约160万条)数据,除了常规的温、盐度和压力等物理海洋要素外,部分剖面还包含了生物地球化学要素(如溶解氧、叶绿素、pH和硝酸盐等)。与此同时,绘制了每个浮标观测的温度瀑布图和温度垂直分布图、盐度瀑布图和盐度垂直分布图、T-S曲线和浮标漂移轨迹图等(图1a);有的还包含了溶解氧垂直分布图(图1b);也有的还带有多深度轴(图1c)等。正如前面所述,由于CARDC还没有配备从事生物地球化学研究的专业技术人员,新版全球Argo资料集也没有对浮标观测的生物地球化学要素数据进行质量再控制,所以也就没有绘制叶绿素、pH和硝酸盐垂直分布图等。
通过对11,856幅图件的逐一审核及客观分析可以发现,大部分浮标观测的温度(约10,683个,占90%)、盐度(约10,577个,占89%)剖面都是比较好的,完全可以放心使用。但其中一些浮标(约1330个)观测的T-S曲线底部略显发散状,虽然同样可以放心使用,不过也表明了在某些海域2000 dbar深处的温、盐度变化还是比较可观的。当然,还有一部分浮标观测的剖面或给出的信息就不那么放心了,必须得校正后才能使用,有的甚至根本无法校正,只能从数据集中删除。
(1)温度和盐度剖面异常
Argo资料中出现温、盐度异常的状况十分普遍,可能是由于传感器受到海面油污染、海水腐蚀及生物附着,甚至受电子原器件老化或外界电子信号干扰所致,但也有可能是遇到不同性质的水团或者浮标漂移穿过海洋锋面时产生的自然现象。如何正确分辨Argo资料中存在的温、盐度异常是正常的自然现象,还是不正常的“故障”所致,需要通过专业技术人员做出判断。如图2所示,该浮标位于北大西洋海域,首先从温、盐度垂直分布图中可以看出,绝大多数剖面温度都是随着深度增加而逐渐降低的,盐度则表现为表层低盐、次表层略高,之后随着深度增加盐度同样略有降低;但似乎只有一条温、盐度剖面出现异常情况,温度大约在1300 dbar、盐度在500 dbar上层都要比其它剖面低得多。显然,这样的低温、低盐状况有悖于常理(T-S曲线),通常需要找到该剖面并将对应的温、盐度数据质量控制标记由原来的“1”修改为“4”。
(2)温度或盐度剖面底部异常
图3呈现的2901466号浮标处于北印度洋海域,其盐度在底部(1000 dbar以深)出现很多异常偏大值,但并不是所有剖面都存在这种情况。尽管产生的原因不是十分清楚,但显然不是自然现象所致,需要对这些异常数据的质控标记做修改处理。可以通过编写MATLAB脚本并结合设定的阈值(如1000 dbar以下相邻层次盐度偏差大于0.08),来准确寻找这些存在盐度异常的文件,并将对应的盐度数据质量控制标记修改为“4”。
(3)温度异常
图4给出了一个处于北太平洋海域的5903452号浮标观测的结果。总体上看,除了在温度垂直分布和T-S曲线中,其中一条温度剖面出现异常外,其他剖面均表现得十分完美。显然,该异常剖面同样需要通过编写MATLAB脚本并结合设定的阈值,来准确寻找到存在该温度异常的文件,并将对应的温度数据质量控制标记修改为“4”。
(4)盐度异常
图5所示的5902509号浮标处于北太平洋海域,其中1条盐度剖面在约100 dbar深度上存在异常低值(< 33.5),经查为第000号剖面,并将对应的异常低盐数据质量控制标记修改为“3”或“4”。
(5)盐度偏移
Argo资料中存在盐度漂移或偏移现象也十分普遍,一般发生在海上工作较长(约3年以上)浮标的观测剖面中,通常由电导率传感器的电子原器件老化或者受到海水腐蚀、附着所致。图6所示的2900693号浮标处于北太平洋海域,在T-S曲线中可以明显看到,其中有1条剖面的盐度值从上到下均存在偏移误差,经查为第65号剖面,并将该剖面的盐度数据质控标记修改为“3”。对存在盐度漂移的浮标,通常在日后对Argo资料执行延时模式质量控制过程中,均可以得到较理想的校正结果。
(6)卫星定位异常
图7给出的1900586号浮标处于北印度洋海域。由图可见,该浮标观测的温、盐度剖面数据均十分正常,只有在漂移轨迹上发现了一个定位异常,显然该位置(53.1ºE,8.7ºN)与前后两个点比较存在明显错误,需要用线性插值方法来估算该剖面处的定位值,并将该插值得到的经、纬度写入文件。但若遇到第1条剖面或最后1条剖面处出现定位异常,由于目前还没有找到理想的外推方法,暂时只能将错误经、纬度用缺省值代替,分别为999.999和99.999。
除此以外,有部分浮标的数据存在剖面序号和观测时间排序混乱的异常,导致绘制的浮标轨迹十分混乱,如图8所示的2900520号浮标(韩国Argo计划布放)。对于这类异常,需要将所有剖面和剖面号、定位位置等信息按照时间增长顺序重新进行排序;还有些浮标会因传感器故障缺少盐度剖面(图9),但温度剖面仍然可以利用;还有些浮标的温盐度剖面数少于5个,这些浮标或许还只是刚刚布放的,若能得到确认的话,这些剖面数据也还是可以利用的,但也有的可能是遇到了技术故障,对这些剖面就不建议使用了。
再者,有些浮标观测的温、盐度剖面还带有双深度轴(图10),对这样的浮标完全可以选择较好的那条温盐度剖面使用。还有那些带溶解氧(图11),甚至叶绿素、pH和硝酸盐传感器的浮标,其大部分温、盐度剖面数据都是好的,同样可以放心使用;但若发现温、盐度数据存在如上述类似异常状况的,只需分别修改对应的质量控制标记。
特别需要指出的是,Argo资料中绝大多数的观测剖面(占79%)最大观测深度都会在2000 dbar附近,但也有的剖面深度小于1500 dbar(约占11%)或者1000 dbar(约占7%),甚至浅于500 dbar(约占1%)。当然,还有一部分浮标为了节省电池能耗,其剖面观测深度会在2000 dbar与1000 dbar或者500 dbar间交替进行,即测量几个浅水剖面后再测量一个深水剖面(图12),如此循环往复,但又能全程掌控传感器的测量精度。这样的测量过程可以说是对常规自动剖面浮标观测方式的一种创新,而且对温、盐度变化(在T-S图上表现为底部的曲线收敛)不是十分明显的海区(图13),剖面观测深度选取1500 dbar或者1000 dbar也许无可厚非,但若在T-S图上发现底部的曲线呈发散状(图14),那么对这样的剖面数据就难以进行质量控制了,也就无法正确评估观测结果的好坏。至于观测剖面浅于500dbar深度的数据,CARDC郑重建议“不要轻易使用”。
此外,还有一些问题浮标,如1000dbar上层漏测温盐度数据(图15),甚至仅有位置或者漂移轨迹,没有温、盐度剖面(图略)等,显然是由传感器故障或其他原因所致。对下载的Argo资料中存在这类问题的,建议直接做删除处理。
3 结语
2017年4月由CARDC新版的《全球Argo资料集(V2.1)》(1997/07-2016/12),从GDAC下载的剖面数量累计为1,678,299条,经CARDC质量再控制后保留的剖面总数为1,525,962条,约占全部剖面总量的91%(图16),其中温度质控标记为“1”的观测数据约占温度观测数据总量的98.4%,盐度质控标记为“1”的约占盐度观测数据总量的97.5%。也就是说,在GDAC提供的所有剖面数据中,约89.4%的温度数据质量是好的,而质量好的盐度数据约占88.6%。
总体而言,通过国际Argo计划成员国交换共享的Argo资料质量还是比较好的,也是值得信赖的。但不能因此而忽略了对来自GDAC的Argo资料质量再控制工作,特别是在用于制作Argo网格数据集或者将其同化进入海-气耦合模式,以及业务化观测预报时,即使少量的剖面数据异常或错误,也会影响到计算或预测预报的精度,甚至带来严重后果。为此,重视Argo资料的质量再控制工作,促进并提高国内现场海洋观测资料的质量和精度显得尤为重要而迫切!
另外,国内仍有用户在购买和布放最大观测深度仅为500米的浅海型剖面浮标,通过上面的分析不难发现,这种浅海型浮标资料质量难以得到保证,由于水体性质在该深度附近本身变化较大,利用历史船载CTD资料进行延时模式质量控制也无法取得好的校正效果,因此,浅海型剖面浮标资料不应进入全球Argo数据集。