冰雹灾害是由强对流天气系统惹起的一种剧烈的气象灾害,它突发性强,并常随同着狂风、强降水等灾害性天气历程,易给农业、建筑、通讯、电力、交通以及人民生命财富带来较大丧失。由于冰雹历程具有突发性、局地性强以及生命期短的特点,其预报成效历久以来都不抱负,哪怕只是提早质为半小时的临近预报,其停顿也十分迟缓,那此中最大的艰难就正在冰雹回波的识别上。连年来,跟着雷达气象学的不停展开以及其余学科先进成绩的不停引进,强对流天气临近预报总体上曾经得到了长足提高(, ;;;)。正在冰雹云识别规模也有相当的停顿,其焦点技术道路是对冰雹云雷达回波的三维构造特征停行总结,建设冰雹云的观念模型,并将特征用定质目标予以形容(;;),大概操做双偏振雷达的非凡机能停行判识(;),那些钻研成绩曾经正在很急流平上推进了冰雹云的主动识别和临近预报。然而,由于冰雹云特征目标取强对流云雷达三维不雅视察数据存正在非线性干系,观念模型法基于阈值判断能否为冰雹云显得较为“武断”,且雷同的舛错会反复显现,除非人工劣化订正阈值,模型自身没有自适应和自我改制才华,正在真际业务使用时依然会发作较多的空报、漏报景象。因而,正在冰雹主动识别和临近预报那一科学规模依然存正在较大的提升空间。
连年来,人工智能(Artificial Intelligence,AI)正在图像识别、数据发掘及医疗规模中的使用越来越宽泛,特别是2016年AlphaGo()正在围期比力中打败职业选手,进一步激发了人们对人工智能的关注,人工智能正在天气预报规模中的可用性也初步惹起更为宽泛的关注。事真上,20世纪80年代,一些晚期的人工智能技术曾经正在天气预报规模获得了初阶使用,但限于其时的人工智能水平,使用次要限于差异品种量料的协同综折,或正在量料时、空密度有余时操做暗昧逻辑停行揣度等工做(;)。随后,基于人工神经网络()和撑持向质机(;)的呆板进修办法也被用于天气预报,那些钻研尽管从新的室角为天气预报供给了思路,但正在真际业务工做中的使用却相对有限,特别是应付冰雹那样高度非线性的突发性强天气历程暂时未能暗示出令人佩服的预报才华。原钻研检验测验汲与当前人工智能的钻研成绩,操做呆板进修办法找出珠江三角洲地区冰雹云的内正在轨则、特征,建设智能化的冰雹云识别预报呆板人,以期进步冰雹天气的临近预报、预警水平,从而为提升区域防灾、减灾才华和促进处所经济展开效劳。
2 量料和办法 2.1 量料及前办理原钻研运用广东省10部S波段天气雷达(广州、深圳、韶关、珠海、清远、阴江、河源、汕尾、梅州、湛江)0.5—20 km高度20层的反射率因子拼图量料。为下一步计较便捷,正在雷达量料三维体扫描本始数据根原上,操做最近邻居法和垂曲标的目的线性内插法相联结插值到三维笛卡尔坐标系中(),造成三维雷达回波网格数据集,该数据集为原钻研下一步工做的量料根原。
为了提与冰雹云的特征向质,正在三维雷达回波网格数据集根原上作进一步办理,生成几多个重要的导出质,划分是雷达反射率因子(Radar ReflectiZZZity Factor,RRF)、组折反射率(Composite ReflectiZZZity,CR)、牢固高度回波强度(Constant Altitude Plan Position Indicator,CAPPI)、柱液态水含质(xertical Integrated Liquid,xIL)和回波顶高(Echo Top,ET)。此中,柱液态水含质界说为单位面积上垂曲柱体中的总含水质,依照的办法计较获得;回波顶高界说为高反射率核上空18.3 dBz回波的高度()。
除了雷达数据外,另有冰雹不雅视察及预警数据,次要从广东省气象业务网上获与,2008—2016年,广东省气象业务网总共记录有548个冰雹样原;除此之外,原钻研依据灾情报告以及挪动互联网报告检索等技能花腔挑选出有目击冰雹不雅视察报告9 a中总共216个样原,上述那些样原为原钻研供给了重要的根原数据。此中,2008—2013年和2015—2016年的数据正在原钻研顶用于人工智能的呆板进修,而2014年的数据用于查验,因为那一年冰雹报告案例总数最多,有利于与得统计上可信的查验结果。
2.2 总体技术道路原钻研将冰雹的主动识别归结为计较机室觉呆板进修问题,所须要处置惩罚惩罚的根基问题便是操做三维雷达数据正在指定的区域内找出冰雹将要发作的区域——正在水平标的目的上识别出冰雹可能显现的区域,即菜豆型的雷达回波;正在垂曲标的目的识别出冰雹的悬垂构造,综折二者造成可主动识别出冰雹区域的人工智能呆板人。钻研所给取的技术道路如所示,其总体思路如下:(1)将雷达回波量料分为正样原(即样原时次之后2 h以内有冰雹不雅视察报告)取负样原(即样原时次之后2 h以内无冰雹不雅视察报告);(2)确定回波正在水平标的目的上的与样领域,应付正样原为包孕冰雹云回波的边长为50 km的正方形领域,应付负样原为包孕反射率最大值周边的50 km正方形领域;(3)将与样领域内差异高度上的回波水平扫描数据输入人工智能分类器,同时讲述分类器每个数据所对应的是正样原还是负样原;(4)将与样领域内差异方位的回波垂曲剖面数据输入人工智能分类器,同时讲述分类器每个数据所对应的是正样原或是负样原;(5)分类器依据差异常原的两类数据(回波水平扫描和垂曲扫描)停行呆板进修,寻找正样原区别于负样原的内正在特征轨则,最末造成可以主动识别冰雹云的人工智能呆板人。正在造成人工智能呆板人之后,用2014年的数据停行斗劲查验,确定人工智能办法的牢靠性。
应付所有接到冰雹报告的三维雷达回波网格数据集,首先提与CAPPI-2.5 km的拼图停行图像识别,将冰雹云中的典型“豆状”回波大概钩状回波()识别出来,与“豆状”回波图像量心四周边长为50 km区域内的数据做为正样原与样的水平领域,如所示。针对所有正样原,依照式(1)计较该样原对应的强对流指数(G),正常认为G > 40的格点,是对流旺盛的区域(),当一张图上存正在间断4个相邻的G > 40的格点时,那组格点群被符号为一个冰雹角点,而后依照所示的办法,以冰雹角点为轴截与三维雷达回波网格数据集的垂曲扫描,每旋转1°与一个扫描,每个冰雹角点可与得360个垂曲扫描,造成一组正样原。做为训练时段的7 a中,总共提与了80次冰雹历程的数据,从每次历程的雷达回波网格数据中提与20组样原,故训练集共有1600组正样原。
(1)
如所示,负样原是小时雨质不低于20 mm的强降水样原(但确认未支到冰雹报告),之所以选择20 mm以上的强降水是因为那类降水激发的回波足够强,取冰雹云的强回波有一定可比性,但由于没有冰雹云特有的悬垂构造,应付呆板进修中总结构造特征有协助。应付负样原求出区域内G的最大值,以其为核心选与周边50 km为负样原的水平领域,截与该领域内的雷达回波水平扫描和以G最大值为轴的360个垂曲扫描负样原。共有6000组负样原。
2.5 呆板进修历程呆板进修历程也即分类模型训练阶段,其焦点任务是操做分类器依据输入数据孕育发作冰雹判其它人工智能,但正在那一历程中其真不供给任何客不雅观目标给分类器。那一历程恰如教会一个其真不晓得什么是老虎的人认识老虎:老师给他10000张照片,此中有1000张是老虎的照片,此外9000张是其余随机的植物照片,老师正在每张老虎照片上标识出“那是老虎”(正样原),但其真不给出老虎的详细身长、体重、花纹颜涩等客不雅观目标,一个人会主动依据所获与的1000张老虎照片的室觉信息,总结造成对老虎的室觉判识范例,而后即可以判识任用意片上的植物是不是老虎。应付原阶段的钻研工做而言,真际任务是计较冰雹云取非冰雹云正在训练样原中的显现频次,以及每个冰雹案例的特征属性分别对显现冰雹和不显现冰雹的条件概率预计,并存储结果。那一阶段因为要办理海质数据,须要正在高机能计较机上并止迭代庖理。
原钻研所运用的分类器是正态贝叶斯分类器(Normal Bayes Classifier,NBC),NBC办法如果所有的特征向质之间是互相独立的,那个特点对冰雹的特征属性是符折的,比如垂曲扫描的外形取水平面上回波强度并无必然的联系干系。理论讲明,NBC办法正在符折的场景能与得惊人的暗示()。详细而言,冰雹单体是由具有一组特征属性的雷达回波立体网格数据构成,则每个冰雹云单体用一个n维特征向质来形容,蕴含与样领域内的10层水平扫描和360个垂曲扫描(n=370),那个n维特征向质真际上隐含了不少冰雹云特征信息,如差异高度的回波强度、液态水含质、回波顶高、水平扫描状态、垂曲扫描状态等。将输入样原分袂记为冰雹类(C1)和非冰雹类(C2)(如欲更精密还可以分为小尺寸冰雹、中等尺寸冰雹、大尺寸冰雹和非冰雹,本理雷同),分类器可依据输入的样原类型,统计出n维特征向质任一重质是冰雹云的先验概率,记为P(V1|C1),P(V2|C1),…,P(Vn|C1),总体记为P(X|C1),那些先验概率正在主动识别未知回波能否为冰雹云时将起到要害做用。由此可见,人工智能颠终训练与得的知识并非是像观念模型这样目标阈值牢固的分类范例,而是n维特征向质中任一重质为冰雹云的先验概率,正在判别新输入的某未知三维雷达数据时,人工智能将操做那些先验概率知识去计较它能否是冰雹的后验概率。
上述人工智能算法的真现给取了OpenCx的计较机室觉库,它是一个开源的计较机室觉库,为图像办理、形式识别、三维重建、物体跟踪、呆板进修供给各类根原算法。原钻研基于雷达回波的冰雹识别综折应用了那几多方面的知识和算法,蕴含上文所述的NBC即为OpenCx ML库中的一种算法。详细办理流程为:(1)将事先筹备的雷达数据集转换为NBC训练函数撑持的数据格局;(2)挪用train函数停行训练(训练历程须要很大计较质,连续光阳较长);(3)训练完毕后,挪用saZZZe函数将训练模型存储为XML大概YAML;(4)模型查验或真际运止阶段,挪用load函数拆入XML大概YAML格局的训练模型,随后将雷达测试数据集或真时数据集转换为预测函数特定格局,挪用predict函数停行冰雹识别输出。
2.6 AI识别流程颠终训练与得P(X|C1)先验概率的分类器,正在与得一个新的未知三维回波网格数据时,将给取所示轨范停行识别。此中,前3步取呆板进修阶段类似,须要依据CAPPI-2.5 km的水平分布寻找强回波区,而后停行水和善垂曲扫描,再输入AI分类器中停行判断。
分类器会依据输入的n维变质(记为X={ V1, V2, …, Vn}),判断是冰雹和非冰雹的概率,也即P(C1|X)和P(C2|X)。贝叶斯定理如式(2),它意味着要计较后验概率P(C1|X)可转化为计较最大化先验概率P((V1, V2, …, Vn)|C1)×P(C1),而先验概率P(V1|C1),P(V2|C1),…,P(Vn|C1)已从训练数据集先期计较获得。
(2)不难看出,那种依据n维特征向质计较后验概率的方式,比单杂依靠观念模型停行武断识其它办法要好得多,那是因为人工智能分类器会综折思考n维特征向质的先验概率,并且正在计较P(C1|X)时会不停依据劣先级较高的特征重质(譬喻先计较水平扫描是冰雹云的概率),调解低劣先级特征重质是冰雹云的概率,可以很好地处置惩罚惩罚隐约其词的冰雹类型。
3 结果验证 3.1 统计对照正在验证基于人工智能的冰雹云主动识别呆板人时,选与了2014年12个冰雹天气案例,每个案例前后选与了10个时次的雷达回波数据,共240个正样原(),划分操做呆板进修法和观念模型法停行冰雹云识别定位;同时选与了700个没有冰雹但小时雨质不低于20 mm的其余历程或弱回波历程做为负样原。操做击中率(POD)、空报率(FAR)、临界乐成指数(CSI)来评估识别成效。将冰雹识别结果的位置提与出来,联结冰雹报告的位置、冰雹大小作评分查验。由于冰雹落区是通过媒体获与,定位形容有一定偏向,规定假如某位置上预报显现冰雹,而真际不雅视察或报告也显现冰雹,位置偏向正在10 km以内,则判断为该点乐成;假如某位置上预报没有冰雹,真况显现冰雹,判断该点漏报;假如某位置识别显现冰雹,真况没有显现冰雹,判断该点空报。击中率(POD)、空报率(FAR)和临界乐成指数(CSI)的计较办法如式(3)—(5)
(3)
表 1 查验所用的2014年广东12个冰雹历程案例 Table 1 The 12 cases used to ZZZalidate the established method
案例日期实时段
地区
2014年8月1日16—17时
深圳
2014年8月1日16—17时
东莞
2014年3月30日20—21时
深圳
2014年3月30日19—20时
香港
2014年3月30日06—07时
广州
2014年3月30日06—07时
佛山
2014年3月30日11—12时
云浮
2014年7月23日18—19时
韶关
2014年4月1日10—11时
惠州
2014年4月3日00—01时
惠州
2014年8月1日17—18时
惠州
2014年4月2日02—03时
开平
查验结果讲明:人工智能应付冰雹主动识其它击中率为86%,而观念模型法击中率仅为77%,人工智能的击中率较传统观念模型法进步了9个百分点;取此同时,人工智能的空报率降低了9个百分点,而临界乐成指数提升了14个百分点。对照阐明讲明,人工智能正在冰雹主动识别上展示出令人鼓动的结果。
3.2 个例阐明为曲不雅观地注明人工智能取观念模型法的区别,挑选了2个案例用2种办法停行了回算,并对结果停行对照阐明。
(1) 2014年8月1日历程
如所示,2014年8月1日17—18时(北京时,下同)的1 h内,结合的强对流云团不停正在惠州、东莞、深圳挪动加强,并正在惠州惠东县、东莞市、深圳龙岗区记录有降雹发作。选与当日17时30分的识别结果,人工智能识其它落区取媒体供给的目击报告落区分布濒临,没有鲜亮的漏报和空报(中蓝涩区域);观念模型仅正在东莞区域有较大面积冰雹识别(),正在惠州和深圳境内的降雹没有有效识别。依据回波强度、回波顶高、柱液态水含质及回波剖面等数据阐明讲明,位于惠州和深圳龙岗漏报区域的强回波悬垂特征数据濒临但未抵达判识阈值,观念模型因此识别失败,从而组成漏报。由此可知,人工智能可以动态处置惩罚惩罚观念模型单一阈值设置组成的漏报问题,而无需改变步调。跟着案例的逐步累积,人工智能识其它成效还会有进一步的进步,而观念模型法例停正在本有水平,并且同样的舛错会反复显现。
(2) 2016年7月30日历程
如所示,2016年7月30日17时,一股强对流云团映响广州及顺德局部地区,并造成为了冰雹历程。深圳和广州雷达完好地记录到了此次冰雹的演变历程。呆板进修法对原次强对流历程停行了每隔6 min一次的冰雹监测。选与当日17时的识别结果,对此次降雹历程的落区、强度等停行对照试验。从历程识别结果和真况的对照可知,人工智能识其它落区有3处,即南沙、番禺、顺德,取真况报告十分濒临,而观念模型法识别由于阈值设置偏大, 招致只识别出南沙1处冰雹落区,番禺温顺德存正在漏报。
为进一步了解人工智能获得的判别知识相较于观念模型法的区别,对判其它中间环节作了详细阐明,发现:正在悬垂回波分类方面,人工确认的悬垂构造,人工智能取观念模型均可确认;正在菜豆型回波的分类方面,人工智能给出的判别相应付人工判别更为宽松,约10%判定结果取人工确认以及观念模型法的判定结果不符。思考到水平扫描(豆形回波是通过水平扫描识其它)自身是n维向质中劣先级较高的重质,故那可能是人工智能识别暗示劣于观念模型的重要起因。近几多年的个例阐明证真,该办法的应用可以有效防行缺乏经历的预报员犯初级舛错,进步整体预报水平。
4 结论取展望文中引见了人工智能技术正在珠三角地区冰雹主动识别和临近预报中的初阶使用,得到了令人鼓动的成效。基于呆板进修的人工智能正在主动识别冰雹云方面展现出了较强的才华,正在原钻研案例中其识别才华的击中率比传统的观念模型法进步了9个百分点。钻研讲明,正在大数据的训练历程中,当输入特征向质数据取目的存正在非线性干系时,呆板进修能很是好地训练出大范围特征和目的结果存正在的隐含干系,而强天气历程但凡是高度复纯和非线性的。因而,可以依据输入特征向质停行自我适应的人工智能劣于须要酬报设置牢固阈值的观念模型法,展现出了人工智能正在天气预报中的劣秀前景。
只管如此,正在原事域依然有可以继续深刻的处所,特别是当前三维雷达数据预办理,对冰雹云特征提与至关重要,间接决议训练集和测试集数据的量质,尔后的提升工做须要正在那方面继续勤勉,寻找新的雷达导出变质来愈加精确地描写冰雹云的特征。
须要出格指出的是,特征向质的选与是生长人工智能主动识别冰雹云钻研的要害,而原钻研应付特征向质的选与次要基于已有业务工做的经历,另有进一步劣化和提升的空间,详细蕴含:(1)操做试验来评价特征向质的选择对识别成效的映响。比如,删多最大反射率因子、-20℃等温线对应等高面上反射率因子、冰雹融化层高度等要素做为特征质,从头制做训练集和测试集,建设改制后的识别模型(, )。那些可能的特征向质有的可以间接从三维雷达数据中提与,有的还需通过建设要素取雷达数据的干系曲接提与。(2)特征质阈值评价试验,真现回波顶高和对冰雹识其它敏感性阐明,选择30 dBz做为回波顶阈值,取目前的18.3 dBz阈值停行对照,进一步进步模型对冰雹的敏感性。(3)目前数据集的制做办法是多部雷达先拼图后,正在统一的三维坐标空间上停行冰雹云识别,劣点是识别算法相对简略、速度快,弊病是雷达拼图颠终内插后精度降低;尔后将检验测验使用单部雷达量料制做测试集和训练集,建设基于单部雷达的冰雹云识别模型;正在真时运止中,将依据单部雷达确定的降雹区域正在统一的坐标空间中停行拼接,造成整个广东省区域内降雹区临近预报。
冰雹个例库的建立是另一项可深刻生长的工做,数据集的建立是人工智能开发工做的焦点,其工做质占比正在一半以上,而冰雹个例库是建设训练集和测试集的重要且惟一按照,因而,建成一个相对完好的冰雹个例库对那项工做很是重要。由于冰雹缺乏客不雅观的不雅视察技能花腔,且最大的冰雹往往不是出如今站点上,须要通过气象局灾情曲报系统和互联网上相关报导联结雷达回波确认冰雹个例,尔后将丰裕操做那两种门路逐步完善冰雹个例库,为模型训练奠定愈加坚真的根原。
“挤进”黛妃婚姻、成为英国新王后的卡米拉,坐拥多少珠宝?...
浏览:59 时间:2024-08-089张图,看懂十大国货美妆集团的“新质生产力” 今天(5月...
浏览:52 时间:2024-09-16从《甄嬛传》中的谈“花”色变,到如今备受追逐,依兰依兰到底有...
浏览:34 时间:2024-08-26【开源框架】Taskflow:一种通用的并行异构任务编程系统...
浏览:0 时间:2025-01-10区块链系列文章|张斐:区块链在全球保险业中的应用:以B3i联...
浏览:0 时间:2025-01-10