预报多天的天气预报?

阙新红阙新红最佳答案最佳答案

这个问题很有意思,我做过一些相关研究,就分享一下自己一些不成熟的想法和具体做法吧。 首先,我们知道影响天气的因子很多很复杂,单个因子很难对天气进行准确的预测,所以传统的气象学都是基于大气运动的三维结构进行气团追踪,从大量历史个例中挖掘规律从而对短期、中期以及长期(3天以上)的天气情况进行预测。

近年来随着计算能力的迅猛提升和数据挖掘方法的发展,人们尝试用更智能的手段来进行天气预测。例如利用机器学习的方法从历史数据中学习生成模型进而对未知数据进行预测。 这里我想提一个自己最近正在做的课题,就是如何利用长时间的数据挖掘来挖掘时空尺度上的规律,并在此基础上对远期的天气进行预测。

简单介绍完概念,我就想说一下我们具体的做法。因为时间的关系,我只展示了怎样通过统计分析方法找到时空上出现频率最高的组合并以此构建指数。当然这一步只是第一步,接下来我们还要构建优化的模型并进行验证。 我们的数据集是从NASA的GCMDATA下载的NCEP再分布后的每日4x4经纬度格网的全球温度场数据,包含从1950年到2006年每一天的全球气温,共786k个数据点。在展示图片之前我想先说说为什么要展示这25组特征值,而不直接给出特征向量。

这是因为如果我们直接展示特征向量的话那么其中必然存在许多0值,也就是变量选取时没有考虑到的特征。而通过特征值的方法我们就可以将0值填充起来,使得最终构造出的特征向量是一个完整的信息表达。同时可以看到,在这25组特征值中,有7组是常数项,这意味着虽然每个变量都对最后的结果做出贡献,但是它们的作用是非常相似的,所以最终的结果会有重复的情况。

现在展示的是经过归一化处理之后的结果,可以看到经度坐标上的值要远远大于纬度坐标的值,这说明在经纬度空间中,空气运动主要受经度变化的影响。同时还可以看到特征值出现了正负,这是由于我们采用了归一化的处理方式,对于每个变量都除以它的标准差然后求和,这样变量之间的差异被缩小了,但同时变量取值的离散程度也被削弱了,部分原本差别很大的数值都被“和谐”了。 为了直观的显示出不同特征值的出现次数,我把所有特征值按升序排列并且绘制了图1,可以看到经常出现的前几组特征值的符号基本是一致的,这意味着我们可以选择一组代表符把空间中大多数的情况都涵盖进去,而余下的非常规情况可以通过其他策略加以应对。

在特征值的基础上,我们进一步构建了指数,并在此之上设计了预测模型。

我来回答
请发表正能量的言论,文明评论!