与强对流监测和临近预报不同的是,强对流短时(2~12h预报)和短期预报(12~72h预报)更侧重于对数值预报模式的释用。近年来,随着高分辨率数值预报模式的发展,强对流天气预报更多地依赖高分辨率数值模式预报。随着时空分辨率越来越高,高分辨率数值模式预报信息量越来越大,对预报员的信息提取能力提出极高的要求。目前,很多强对流天气(如雷暴大风、龙卷等)并没有直接的模式输出产品。经验丰富的预报员需要从大量数据中,提取动力、水汽、能量、地形影响等强对流天气形成条件,最终形成一份可用的强对流预报。
本文梳理了机器学习在强对流天气监测、短时临近预报、短期预报等领域的应用和存在的问题,并给出了未来工作展望,以期更清晰地了解机器学习在强对流天气领域的应用情况,为更好地结合物理机理、数值预报等来发展强对流天气领域的机器学习技术提供参考。
强对流天气监测依赖于气象卫星、天气雷达、闪电定位仪、自动气象站等具备高时空分辨率的中小尺度监测网,是强对流预警预报的基础。
静止气象卫星观测具有覆盖范围广、时空分辨率高的特点,是监测强对流天气的重要手段。目前,国内外利用卫星遥感技术,进行强对流云团识别的研究已经取得了一定的成果。
基于卫星、雷达、闪电等观测数据,利用机器学习算法,能够有效实现对对流系统的识别和追踪,提取对流系统的移动方向、移动速度等信息,为对流预警提供重要信息。
雷达、卫星等观测数据本质属于图像的范畴,而深度学习近年来在图像识别领域取得极大成功。因此,利用深度学习可以有效从雷达图像、卫星云图中识别出强对流天气。
静止气象卫星具备对对流初生的观测能力,观测对流云顶的发生发展特征;天气雷达观测对流风暴的内部分布特征;数值模式预报数据可提供对流发展的环境条件。多源观测数据表现形式、物理意义各异,如何将多源数据实现有效融合,也是当前面临的挑战之一。
目前,机器学习在强对流监测、强对流短时临近预报与短期预报中,已经发挥了重要的积极作用,其应用效果往往优于原有的传统经验和方法。在样本标记充足、标记准确的情况下(如对流云识别、雷达回波外推、闪电预报等),机器学习尤其是深度学习,能够从海量数据中有效提取特征,进而进行有效预报;在样本稀缺且样本标记不确定性较大的情况下(如冰雹、龙卷等极端强对流天气),不管是深度学习或传统机器学习解决此类问题的能力有待进一步提高。总体而言,机器学习目前存在以下问题,未来在以下方面会继续发展。
(6)深度学习训练过程涉及到大量的并行运算,因此,目前对于高端GPU显卡或者云计算资源的使用不可或缺。对于深度学习网络,其运算需求往往非常巨大。因此,可以预见,未来高性能计算能力建设中,高性能GPU并行计算能力或者云计算资源的建设应该会加速推进。
(7)目前,机器学习算法可以基于雷达或者卫星观测资料提取对流初生等特征,进行有效的临近预报。然而,其尚不能完全考虑大气运动的基本物理规律,因此短期内不能代替数值预报模式进行基于物理方程的数值预报。
(1)利用机器学习方法进行多源数据的更有效融合应用,从而更好地实现强对流的监测和临近预报。卫星、雷达、闪电、自动气象站等观测数据,各有优势与劣势,如果充分发掘各自的优点,进行综合应用,最大化地体现观测数据的优势将成为未来强对流监测和临近预报的一大挑战。此外,高频次的观测数据还可以与高时空分辨率、快速更新同化的数值模型进行有效融合,实现临近预报到短时预报的无缝过渡。
(2)如果能对风暴的不同阶段的演变特征实现有效识别,将能更好地实现强对流天气的提前预警。可以尝试利用机器学习,进行中气旋、上冲云顶、弓状回波等特征的识别,相对于直接利用天气现象作为标记,对于冰雹、雷暴大风、龙卷等强烈对流天气能起到更加提前的预警效果。
尽管目前机器学习等人工智能技术在多个行业中的应用都如火如荼,但是机器学习并不是万能的。机器学习在大气科学领域的应用基础仍然依赖于高质量的观测数据、可靠的数值模式预报结果以及深刻的天气原理认识,且要根据不同的应用场景结合物理机理选择合适的机器学习方法。究其本质,机器学习只是一个工具,并不能替代基础天气观测数据、数值预报模式、天气学和大气动力学基础理论发展的研究。在利用人工智能技术发展天气预报技术的同时,也需时刻牢记大气科学基础理论才是强对流天气预报的基础和土壤。