气象统计整理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章气象资料及其表示方法
一、数据资料的统计特征
要素样本中资料分布的特点----用一些统计量表征。
1、平均值
含义:平均值是要素总体数学期望的一个估计。反映了该要素的平均(气候)状况。
2、距平
含义:反映数据偏离平均值的状况,也是通常所说的异常。
**中心化**
概念:把资料处理为距平的方法叫中心化
特性:距平值的平均值为0,使用方便;
直接作为预报值,比较直观(偏高/偏低)。
3、方差和均方差(标准差)
含义:是均方差,描述样本中资料与平均值差异的平均状况,反映变量围绕平均值的平均变化程度(离散程度),是方差。
标准差大-----变化幅度大;均方差小的要素预报比大容易,变化幅度小;变量减去某常数后均方差相同。
累积频率:变量小于某上限的次数与总次数之比。
二、总体和样本
1、总体(母体):统计分析对象的全体。
2、样本:总体中的一部分。
三、数据的标准化
各要素单位不同、平均值和标准差也不同。为使它们在同一水平上比较,采用标准化方法,使它们变成同一水平的无单位的变量----标准化变量(消除单位量纲的影响)。
证明:
(1)标准化变量的平均值为0。
(2)标准化变量的方差为1。
峰度系数与偏度系数是用来衡量随机变量分布密度曲线形状的数字特征,描述了气候变量的分布特征。
偏度系数:表征曲线峰点对期望值(平均值)偏离的程度。
峰度系数:表征分布形态图形顶峰的凸平度(即渐进于横轴的陡度)。
三、状态资料和统计特征
1.状态资料(离散型随机变量)
表征气象要素的各种状态,观测结果无法用数据表示。
2.频率表、分布列----------列出各个状态出现的频率。
对样本而言是频率表,总体而言就是分布列。
四、多要素的气象资料
两个方面来研究问题:
“R型分析”:研究不同变量(要素)或同一要素不同格点之间的关系。(行)
“Q型分析”:研究样本之间的关系(列)。
五、统计量---协方差和协方差矩阵
1.协方差
衡量任意两个气象要素(变量)之间关系的统计量(正、负相关关系)(另外一个统计量叫相关系数)
(距平的内积)
反映了两个气象要素异常关系的平均状况,或者两个变量的正、负相关关系。
变量自身的协方差就是方差
协方差带单位,不同要素之间不好比较,相关系数可解决这个问题。
2. 协方差矩阵
m阶对称矩阵,对角线元素是第i个变量的方差,撇号代表距平。
六、区域资料的整理和利用
(1)代表站方法---平均相关系数最大的站
(2)区域平均法---区域平均值要与周围格点(站点)值区别大
(3)综合指数法(各站点要素方差差异较大)
<越大,异常越明显>
i表示区域内台站,j表示观测资料的年代
第二章选择最大信息的预报因子
1.条件概率
在事件B已经发生的条件下计算事件A的概率,称为事件A在事件B已出现条件下的条件概率,记为P(A/B)。
2.天气预报指标必须满足两个经验性的条件
(1)P(A/B)>>P(A)或者P(A/B)<
二分类预报:只预报事件A出现或者不出现,又称为正反预报。P(A)=p,,p+q=1 求n次独立试验中,事件A出现m次的概率
4.定量数据时的指标
状态要素:可以用条件概率选择预报因子并且用二项分布检验预报因子的可靠程度。
定量数据要素:主要用相关系数选择预报因子或因子集,并用t检验方法检验其可靠性。
5.
(1)原始资料:
(2)距平(均值为0)
(3)标准化距平(标准化后资料均值为0,均方差为1)相关系数=协方差6. 相关系数的检验
正态总体的相关检验实质上是两个变量间或不同时刻间观测数据的独立性检验。
所谓相关检验,就是检验ρ=0的假设是否显著。
在假设总体相关系数ρ=0成立条件下,样本相关系数r的概率密度函数正好是t分布的密度函数。于是,就可以用t检验法来检验。
(1)t 检验
在原假设ρ=0的条件下,统计量符合自由度为n-2的t分布.
给定信度α和样本相关系数r,根据自由度查出,若,即否定ρ=0,总体相关。反之,接受ρ=0,总体非相关。
(3)相关系数表
可以计算统一的判别标准相关系数,若,则通过显著性的t检验。
实际应用中,若已知自由度(n-2)和显著性水平,查相关系数表即可。
7.自相关系数
衡量气象要素不同时刻之间的关系密切程度的量是自协方差和自相关系数。
8. 落后交叉协方差和相关系数
衡量两个变量不同时刻之间的相关密切程度的量,常用落后交叉协方差和落后交叉相关系数表示。
9. 高自相关变量间的相关系数及其统计检验
(1)两个变量无持续性(非高自相关)---------t检验
(2)两变量本身有强持续性或高自相关,t检验的自由度不能用,需要计算有效自由度,其中。
10. 偏相关系数
当存在三个以上变量互相影响时(如考虑y和x1、x2之间的关系),需要考虑消除了x1(x2)影响后,x2(x1)与y的相关关系,这时候的相关系数称为偏相关系数,记为
第三章气候稳定性检验
1.步骤
(1). 写出零假设H0和备选假设H1;