中国气象图书馆

█唐伟(特约,中国气象局发展研究中心)译

█张定媛田晓阳审校

一、引言

1.人工神经网络

人工神经网络(ANN)是加权非线性函数的互联网络。实现多层连接和训练的人工神经网络可以表示任何非线性函数。它们也为深度学习方法提供了基础。自1980年代后期以来,人工神经网络在气象中得到了应用,包括云分类、龙卷监测预报、雷雨大风、冰雹谱、降水分类、风暴跟踪、雷达质量控制。

2.支持向量机

支持向量机(SVM)也被用于探测和预测龙卷。支持向量机通过核函数将数据转化为非线性空间然后学习这个非线性空间的线性模型。人工神经网络和支持向量机都是灵活和强大的,但想解释它们产生的模型所识别现象的潜在物理机制时通常会遇到困难。对于人工神经网络,通过非线性函数来解释权重是很困难的。对于支持向量机,由于做了数据转换,所以很难识别数据的最重要特征或模型识别的内容。

3.线性回归、岭回归、弹性网络

4.决策树

5.随机森林

6.梯度提升决策树

梯度提升决策树(GBRT)建立了一组使用提升(boosting)进行训练的决策树集合。在随机森林中每个决策树都由同等权重的案例进行同等加权和训练,而梯度提升决策树则在不同加权的数据子集上进行训练,权重由前一个训练步骤的误差残差决定。由于随机森林中每个树的权重相等,因此,随机森林将倾向于回归到预测平均值,因此预测不精确。梯度提升决策树可以解决这个问题,但有时也需要模式后校正。我们通常使用保序回归进行模型后校正。随机森林和梯度提升决策树都提供了度量数据集每个属性的重要性的功能,这被称为变量重要性。在对树进行训练之后,每个变量的数据都重新排列了,并且对排列后的数据和原始数据的性能都进行衡量。最重要的变量是导致性能下降最大的变量。这些重要性估计可以帮助对数学模型进行物理解释。

三、AI在高影响天气上的应用

2.灾害性大风

3.强冰雹

对冰雹的发生和大小的预测需要提前数天或数小时来指导对对流的趋势展望和监测。对流解析模型(CAM)集合可以提供有关风暴强度、位置和演化的信息,但不直接预测地表的最大冰雹大小。基于CAM输出的有关风暴及其环境的信息,利用机器学习模型可以预测冰雹发生的概率和预期的冰雹大小分布。基于机器学习的冰雹预报模型已经在两个CAM集合系统上实时运行,并在HAILCAST诊断和风暴替代变量(如上升气流螺旋性)中已验证。

4.降水分类

近地面气象现象识别计划(mPING)自2012年12月19日发起以来,已经收集了超过110万次观测数据。mPING计划收集的是通过智能手机应用(APP)匿名提交的“降水类型(ptype)”的众包观测数据,还有其他多种天气状况,如洪水、通视障碍、风害、冰雹和龙卷风。研究采用了每个NWP模式输出的湿球温度Tw廓线(从5000m高到地平面)的4种类型。类型1是湿球温度Tw都低于冰点(273.16K);类型2有一个冻结高度,在其表面上的Tw高于冰点;类型3有3个冻结高度,其中有一个抬升的暖层,一个抬升的冷层,以及一个Tw高于冰点的高度;而类型4是“经典”的抬升的暖层剖面,Tw低于冰点。为每个廓线类型计算多个预测因子,包括每一层零上和零下面积,各种冻结高度的高度,冷层和暖层以及整个廓线垂直高度的风切变(纬向和经向(分别为u和v)),每一层相对湿度高于0.8和低于0.8以及平均相对湿度的面积,冷层的最小Tw。每个廓线类型都有不同的预测因子集合,有些预测因子在所有廓线类型中都是通用的。总的来说,类型1的廓线有28个预测因子,类型2的廓线有23个,类型3的廓线有49个,类型4的廓线有38个。

因为每个廓线类型都有不同的预测因子集,所以每个预测因子集都有自己的随机森林。训练数据由随机抽取的80%的数据组成,剩下的20%用于测试。为了减少测试数据与训练数据的交叉,我们抽出了几个小时而非整个观测。这样,训练廓线和测试廓线不会来自同一时次。这些数据是不平衡的,因为雪和雨比冰球和冻雨多。抽样权值和最大树大小通过试错法进行了调整,这样每一个随机森林生成的四个类的偏差就接近1。没有其他的调整。

应用随机森林的方法可以显著改善NWP模式对降水类型的预测。图6是一个快速更新(RAP)模型有明显改进的例子。其中随机森林算法的得分根据较少的案例(测试数据)得到,而快速更新模型的得分基于整个可用的数据集。结果显示,随机森林算法对雨和雪的预测没有多大改善余地,但对冻雨和冰丸的改善相当明显。此外,随机森林算法输出是无偏的,这不同于快速更新模型的后处理输出。随机森林算法还可以提供降水类型的概率信息,这可能对业务预报人员和维护基础设施系统的人员有用。显然,如果有足够的数据,预测降水类型的随机森林方法可以显著改善最棘手的冬季降水类型的预报。

5.可再生能源

对可再生能源的预测是高影响天气预报的另一个例子。该预测可以帮助人们使用清洁的、局地可用的、多变的可再生资源来替代化石燃料能源。因为风能、水和太阳能资源都是变化很快的,因此通过预测可以提前部署可再生能源和其他能源的混合使用,确保可靠、高效和经济的能源使用。公用事业公司需要各种尺度的预测,本研究介绍其中两个较短尺度的预测:未来3-6小时短临预报,以及提前一天的预测(可以延伸到72小时来覆盖周末)。要将可再生能源混合到电网中,以实时满足电力负荷,短临预报是非常必要的。提前一天的预测被用于计划单位分配和与其他公用事业公司的交易能源。最近的一些研究试图通过隐式和显式的方法来识别流型和预测太阳辐照度的变化。隐式方法采用回归树方法,采用嵌入的最近邻方案来预测确定性的辐照度和它的可变性。使用k均值聚类和训练人工神经网络对每个集群进行显式的流型识别,比在整个训练数据集上训练一个单一的人工神经网络有所改进。这些统计预测方法的表现优于“智能持久性”方法。与其他临近预报产品相比,在第一个小时中,统计预测方法的表现优于其他所有产品,如图7所示。

提前一天的预测方法采用AI模型对NWP模式进行后期处理,并面向观测进行校正。常用的后处理方法包括人工神经网络和混合优化方法。动态综合预测(DICast)系统首先应用动态模型输出统计方法,然后优化混合。该系统对风能和太阳能的预测至少提高了15%。

对于真正的决策支持,只有风速或总辐射率预测对公用事业公司和电网运营商是不够的,他们实际上需要功率预测。尽管风力涡轮机和太阳能电池板的制造商提供了平均功率曲线,但由于地形高程、湍流和其他因素的变化,它们并不能完美地代表一个地点产生的实际电力。因此,训练AI方法将风或总辐射率转化为电力,可以为特定的地点提供更好的电力预测,并且不会像采用太阳辐照的替代方法那样还需要详细元数据。国家大气研究中心(NCAR)成功地将cubist回归树方法应用于风能和太阳能预测。

AI方法现在已直接为世界各地的公用事业公司和电网运营商提供决策支持,并增加了可再生能源资源的部署。本节中描述的所有方法都已被公用事业公司业务应用。通过这种方式,提高可再生能源的使用率,可以提高能源安全,减少能源生产用水,降低二氧化碳和其他污染物的排放,从而为全球提供清洁的可持续能源。

6.航空湍流

尽管人类所关心的恶劣天气大多发生在地表附近,但远离地表的地方也可能同样危险。商业航空受到各种灾害性天气的影响,包括超低温液态水导致的机身结冰、冰水含量高区域的发动机熄火、冰雹、闪电和大气湍流。从运行的角度来看,湍流是最主要的航空危险源之一。在湍急的涡流中飞行会导致飞机从一边到另一边上下颠簸,使乘客和机组人员感到不舒服,有时会使人员受伤或飞机损坏。湍流是由低稳定性地区的风切变造成的,这可能是由于急流和锋面、地形波或对流引致的重力波断裂,或雷暴的上升气流和下沉气流造成的。由于湍流通常是一种小尺度的、随机的现象,因此很难预测,甚至临近预报也难以预报出来。此外,NWP模型一般不能够准确预测航空尺度的湍流,而其输出变量如次网格湍流动能(TKE)在预测飞机的湍流方面也没有什么技巧。

四、讨论

现代AI技术在高影响天气预报中的应用,提高了我们筛选大量数据的能力,从而可以对预报员和决策者做出准确及时的指导。AI技术建立在传统的方法,例如模型输出统计方法上,通过提供更灵活和强大的模型,能够识别大量建模和观测到的天气特征或导出量之间的复杂关系。此外,AI方法可以很容易地直接预测高影响天气的影响,如太阳能或风能等可变资源产生的电能在某一地区的能源消耗,或机场到达能力。

本文提出了一个有趣的问题,即自动化指导在预报中的作用。虽然我们已经证明了AI/数据科学技术可以用来显著提高各种高影响天气领域的预测,但这不仅仅是将这些技术引入业务的问题。预报员必须能够相信这些技术所产生的预测,正如在灾害天气试验台-概率灾害信息实验中已经证明的那样。

对于常规天气变量(如温度和降水)的预测,NWS目前使用的是一种“人工介入”的模式,预报员主观上混合并调整多种数据资源。在局地效应对预测影响更大的情况下,地方气象台的预报员经验为预测提供了有用价值。NWS的天气预报中心对整个美国的气温和降水做预报,现在预报员的预报能力要比降尺度的、订正后的气温和降水集合预报差得多。NWS对飓风轨迹的官方预测,也比加权集合预报表现更差。在不同的气象机构之间的预测和警告之间也存在空间不连续的问题。包括WeatherCompany公司在内的私营气象公司,在一个“无人化”的模式下运行。在此模式下,由用户根据需要来自动生成一种最佳的模型输出误差订正融合预报,而预报员只需要添加过滤器和限定词来解释观测到的短期偏差或数据质量问题。这种方法很容易规模化应用,只需要一个由气象学家组成的小团队来监督一个高度自动化系统即可。这种高度自动化的方法的缺点是,预报员可能会脱离预测过程,并且在自动化预报失败时很难采取适当的纠正措施。

通过研究在高影响天气情况下不同机器学习方法的误差特征,研究人员和预报员可以确定何时应该信任自动指导,何时需要斟酌。本文提出的方法能够将物理知识与自动化校正相结合,在信息过载的时代发挥关键作用。

THE END
1.校园网络连接不稳信号不佳?六大症结全知晓中南财经政法大学http://xxglb.zuel.edu.cn/2024/1206/c11413a380401/page.htm
2.冬日图书馆里“充电”忙2024年12月7日,读者在国家图书馆内阅读学习,充电休闲https://tech.huanqiu.com/gallery/4Ka9KdxJKgQ
3.湖南工业大学图书馆开放时间湖南工学院图书馆图书馆每周开放7天,每周开放93.5小时,网络及数字资源全天24小时开放。所有书库和阅览室对读者实行全开架服务,开架借阅率达到100%。 服务方面计划:提供文献外借、参考咨询、代查代检、文献传递、馆际互借、文献复制、书目查询、新书荐购、读者信息查询、新书通报、网上书刊预约、催还和续借、网络数据库检索及全文下载、光https://www.gdhuarong.cn/zshi/202412-333.html
4.万江图书馆的网络真的很差您反映的问题已收悉,现回复如下: 经实地调查,万江图书馆免费提供有线和无线网络,无线是免费公共WIFI“万江图书馆”,信号覆盖一层自助图书馆、二层综合书库、展览区、自修室、书山、文化长廊、绘本馆等区域,由于正值暑假期间,每天人流量约2650人次,同时使用无线网络的读者激增,无线网络出现速度缓慢、连接不稳定、信号http://wzzdg.sun0769.com/political/politics/index?id=713844
5.湖南最差的高校——湖南网络工程职业学院百姓呼声2. 无图书馆,这么一个学校,既然没有图书馆,你说好不好笑,还叫大学,跟高中似的,大学空闲时间多,你要我们学生干嘛,没图书馆,我们去哪儿看书,自习 3. 校园环境差,篮球场还没有一个普通高中的多,这算大学吗 4. 食堂差,几千人的高校,就一个食堂,吃饭挤也挤不进 https://people.rednet.cn/front/messages/detail?id=1103625
6.关于改善图书馆网络质量与环境状况的建议书信件标题: 关于改善图书馆网络质量与环境状况的建议书 来信时间: 2024-05-18 15:20:42 信件内容: 尊敬的政府领导: 您好!我谨代表广大图书馆用户,向您反映图书馆目前存在的网络质量差以及环境吵闹的问题,并提出相应的改善建议,希望得到政府的关注和支持。 图书馆作为社会知识传播和文化交流的重要平台,为广大读者提https://www.longli.gov.cn/govmsgbox/202405/tGovMsgBox_27582394.html
7.网络环境下的图书馆(精选十篇)一、网络环境下的数字图书馆与传统图书馆的比较 网络环境下的数字图书馆是以现代通信技术为依托,以国际互联网络为传输通道,大量借助数字处理技术收集、整理、转换、收藏和流通数字资料,以使人数众多又处在不同地理位置的用户能够方便地利用电子资料的全部信息。传统的图书馆就其本质而言,它是为管理大量的数据和资料提供https://www.360wenmi.com/f/cnkeyv8of5lg.html
8.东北大学图书馆上网方法14篇(全文)二、所有读者不得利用图书馆网络进行制作、查阅、复制和传播以下信息: (一)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一的。 (二)煽动民族仇恨、民族歧视、破坏民族团结的。 (三)破坏国家宗教政策,宣扬邪教和封建迷信的。 (四)散布谣言、扰乱社会秩序,破坏社会稳定的。 https://www.99xueshu.com/w/filexehj77mb.html
9.中小学网络党校数字图书馆关于举办2024年全国中小学德育与素质教育系列专题网络培训的通知 2024年全国中小学德育与素质教育系列专题网络培训 研修成果 学员交流、分享、提高的资源空间 立即查看 学习专题 及时、权威、优质的参考资料 马上查看 数字图书 更多>> 社长(总编)荐书 查看更多>> http://www.zxxdx.com.cn/sztsg/
10.学校网络解决方案范文(通用8篇)结合高校网络的特点,为了便于管理和维护,校园网按照功能划分为6个功能区,分别是:数据中心服务器区(部署在核心机房)、办公区(含1座办公楼、4座教学楼、2座实验楼和1个实训中心)、图书馆区(1座楼)、学生公寓区(8座公寓楼、1座综合服务中心楼)、餐厅单身教师宿舍区(1座餐厅楼、2座单身宿舍楼、1座文印中心楼https://www.oh100.com/a/202210/5477577.html
11.小学图书室工作总结通用15篇充分利用图书馆的整体化优势和自己独特的环境,有意识的通过网络和计算机技术进行图书馆网络的优化组织与协调,使网上的电子信息资源成为图书馆信息服务的有机组成部分,实现网络资源配置的优化,实现网络信息资源的二次开发与综合信息服务,培养读者的信息素质和信息意识能力。 https://www.pinda.com/zhichang/gongzuozongjie/484955.html
12.图书室管理员工作总结通用15篇充分利用图书馆的整体化优势和自己独特的环境,有意识的通过网络和计算机技术进行图书馆网络的优化组织与协调,使网上的电子信息资源成为图书馆信息服务的有机组成部分,实现网络资源配置的优化,实现网络信息资源的二次开发与综合信息服务,培养读者的信息素质和信息意识能力。 总之,图书馆首先要在改造自身上下功夫,因为只有掌https://www.yjbys.com/hr/yuangongguanli/3789969.html
13.基于云计算和大数据的图书馆应用系统建设设计这些存储信息资源的的服务器集群根据云计算服务器的控制任务,提供用户需要的信息,这种强大的分布式计算和存储能力的复杂网络让用户省去考虑如何获取和管理数据的麻烦,只需要考虑最终使用这些结果即可,从而大大提升搜索效率。 4.2网络物理结构图 (图4.2.1 基于云计算的数字图书馆网络物理结构图)https://blog.csdn.net/nguever15/article/details/71190774/
14.大型图书馆一般性网络拓扑结构图20220701165624.ppt想预览更多内容,点击免费在线预览全文 免费在线预览全文 大型图书馆一般性网络拓扑结构 下载文档 收藏 分享赏 0 内容提供方:hylsx 审核时间:2022-07-03 审核编号:6120001124004204 认证类型:实名认证 能力类型:内容提供者 领域认证: 版权证书: 区块链号:https://m.book118.com/html/2022/0701/6120001124004204.shtm
15.校园网络设计方案校园网络方案设计具体分为:校园网络中心设计、教学子网设计、办公子网设计、图书馆子网设计、宿舍子网设计及后勤子网设计等。 1、校园网络中心的设计校园网络中心设计主要是校园主干网络的设计。 主干网在整个校园网络系统中占有举足轻重的地位,它是整个校园网络的中枢。主干网负责学校各个局域网之间的数据传输,信息发布,资https://www.ruiwen.com/shejifangan/7412111.html
16.图书情报工作杂志中国科学院文献情报中心主办2007年第10期通过对9所美国图书情报学硕士研究生院校网站的访问,分析美国图书情报学硕士研究生个性化教育的表现,总结美国图书情报学硕士研究生个性化教育的两大特色一是明确职业目标,量身定制培养方案二是通过网络信息教育系统(WISE)实现在美国图书馆协会认讧的其他研究生院校之间跨校选修课程。在此基础上,总结对我国图书情报学硕士研究https://www.youfabiao.com/tsqbgz/200710/