《气象统计方法》期末复习课件总结

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
若事件A、B同时出现的概率为P(AB),则有 P(A / B) = P(AB) P(B)
43
ph2.天气预报指标必须满足两个经验性的条件
(1)P(A/B)>>P(A)或者P(A/B)<<P(A) A/B之间有一定联系
如上例
(2)P(A/B)-----1或P(A/B)------0 预报指标有一定准确率
rα ,若 r > rα,则通过显著性的t检
验。 rα 的计算过程如下:
53
由 tα 计算出 rα :
样本容量固定时,通过检验的t值应 该至少等于 tα ,故有
tα = rα
n−2 1 − rα 2
式中, rα 就是通过检验的相关系数临界
值。
rα =
tα2 n − 2 + tα2
实际应用中,若已知自由度(n-2)和
出 tα ,若 t ≥ tα ,即
t=
r 1− r2
n − 2 ≥ tα 否定ρ=0,总体相关。
t=
r 1− r2
接受ρ=0,总体非相关。
n − 2 < tα
52
(2)相关系数表
在气象统计预报中,选择因子往往需 要计算很多相关系数,逐个如上法检验 很麻烦。 实际上,在样本量固定情况下 ,可以计算统一的判别标准相关系数
9
气象上的应用:
中心化的概念: 把资料处理为距平的方法叫中心化。 气象上常用距平值代替原样本中的资料值
作为研究对象。 中心化的必要性:
因为气象要素的年变化周期影响很大,各 月的平均值不一样,为了使之能在同一水平下 比较,常使用距平值(比如之前的举例)。
特性:距平值的平均值为0,使用方便; 直接作为预报值,比较直观(偏高/偏 低)。
1 n
n t =1
xit x jt

xi x j
(2.4)
30
协方差气象意义的进一步理解:
距平的内积
1)反映了两个气象要素异常关系的平均状况,或者两个变 量的正、负相关关系。
如理解(气温为例):
前冬气温负距平(冷)、后冬正距平(暖)---协方差负值---反相关
前冬气温正距平(暖)、后冬正距平(暖)----协方差正值---正相关
28
四、统计量---协方差和协方差矩阵
1.协方差 衡量任意两个气象要素(变量)之间
关系的统计量(正、负t相ire_ 关关系),另外一 个统计量叫相关系数(以后讲解)。
29
表达式:
距平的内积
A记
are
∑ sij
=
1 n
n
( xit
t =1
− xi )(x jt
− xj)
i, j = 1,2,"m
∑ =
**气候值:30年以上的平均(由大 数定律推断)
2)空间平均
纬向平均,区域平均,半球平均, 全球平均等
2、中位数
1)概念 将变量值按大小顺序排列,处于中间
位置的那个数就是中位数。
2)意义: 表征气候变量中心趋势,反映研究
对象的一般水平。
3、众数
1)概念 要素(变量)值中出现次数最多的那
个数。可以有多个,或者没有。
一一
定量数据要素:主要用相关系数选择预报因 子或因子集,并用t检验方法检验其可靠性。
46
下面学习的主要内容
1.简单相关系数
2.相关系数的检验-t检验
-
r
3.自相关系数 7 t h
4.复相关系数 tn 概念
5.偏相关系数 一一 木木既令
回 州多元
回归

47
相关 微 了了计算要么
(1)原始资料:
来自百度文库
r=
∑ 1
n
n t =1
( xt

x)( yt

y)
∑ ∑ 1
n
n t =1
( xt

x)2. 1 n
n t =1
( yt

y)2
8= Sxy SxSy
∑n
xt yt − nxy
=
t =1
∑ ∑ n
n
(
x2t − nx 2 )(
y
2 t

ny 2 )
t =1
t =1
48
(2)距平(均值为0)
r=
∑ 1
10
3、方差和均方差(标准差)
对气象要素x,资料长度n,其表达式:
sx =
∑ 1
n
n
( xt
t =1

x)2
t = 1,2,", n(4)
含义:sx 是均方差,描述样本中资料 与平均值差异的平均状况,反映变量围绕平 均值的平均变化程度(离散程度),sx 2 是 方差。
11
气象上的应用:
1)如果12月份气温标准差比1月份大,反映 了12月份气温随时间变化幅度比1月大。
显著性水平,查相关系数表即可。
54
t 分 布 表
55
相 关 系 数 检 验 表
56
二、自相关系数(huangP16,补充例子)
1.概念
o 衡量气象要素不同时刻之间的关
系密切程度的量是自协方差和自相关 系数。
57
三、落后交叉协方差和相关系数
o 1.概念
衡量两个变量不同时刻之间的相关 密切程度的量,常用落后交叉协方差和 落后交叉相关系数表示。
23
标准峰度系数的意义
24
七、状态资料和统计特征
1.状态资料(离散型随机变量) 表征气象要素的各种状态,观测结果无法
用数据表示。 如雾、冰雹、霜-------用“有”、“无”
、“强”、“弱”等表示。 雨的强度------等级表示,如大暴雨、大
雨等。 风的强度等级---1级、2、……12
25
• 2、频率表、分布列 如何描述状态资料的统计特征? 列出各个状态出现的频率。 对样本而言是频率表,总体而言就是
40
第二章 选择最大信息的预报因子
41
本章主要内容
1. 概率、条件概率以及预报指标 2. 天气预报指标的统计检验 3. 定量数据的指标 4. 高相关变量间的相关系数及其检验
二、条件概率和天气预报指标
1.概念 定义 论
在事件B已经发生的条件下计算事件A的 概率,称为事件A在事件B已出现条件下的条 件概率,记为P(A/B)。
2)对于同一个月,如果南京气温的标准差 比北京小,说明北京气温变化幅度大。(内陆 日变化较沿海大,这个日变化大小的比较就使 用标准差比较的)
3)均方差小的要素预报比大的困难还是容 易?原因?
4)变量减去某常数后均方差相同。
12
(二)描述异常状况(变化幅度/离散程度) 的统计量:
描述气候变化与正常情况的偏差和变化 的统计量:
分布列。
26
第二节 多要素的气象资料
*也可以理解为同一要素多个格点( 站点)的资料,下面慢慢体会。
27
x11 x12 " x1n
m Xn =
x21 #
x22 #
" #
x2n #
= ( x1x2 " xn )
xm1 xm2 " xmn
两个方面来研究问题: “R型分析”:研究不同变量(要素)或同一
要素不同格点之间的关系。(行) “Q型分析”:研究样本之间的关系(列)。
n
n t −1
xt′ yt′
∑ ∑ 1
n
n i =1
(
xt′
)
2
.
1 n
n ( yt′ )2
i =1
49
(3)标准化距平(标准化后资料均值为0,均方差为1) 此刻,相关系数就是协方差
∑ r
=
1 n
n t =1
x
* t
y
* t
50
4. 相关系数的检验(huang and weip36)
样本相关是否意味着总体相关? 正态总体的相关检验实质上是两个变量间 或不同时刻间观测数据的独立性检验。
2)变量自身的协方差就是方差。
问题:协方差带单位,不同要素之间不好比较,以 后学习相关系数可解决这个问题。
31
2.协方差矩阵
S = (sij ) i, j = 1,2,"m
= 1 X ′X ′T n
(2.6)
m阶对称矩阵,对角线元素是第i个变量的 方差,撇号代表距平。
32
六、区域资料的整理和利用
rent_ 峰度系数:表征分布形态图形顶峰
的凸平度(即渐进于横轴的陡度)。
21
2、 标准偏度系数和峰度系数的计算公式为:
其中, x 和 s 分别为样本均值和标准差。
22
正态以及偏态分布示意图
正态分布
众数/中位数/平均数
众 数
中 位 数
平 均 数
正/右偏态分布
平中 均位 众 数数 数
负/左偏态分布
三种方方法 的 新
做研究选择要研究的区域,划定区 域后,需要整理区域资料。本节就介绍 一些区域资料整理方法。
33
朽三种方法
K值的意义?
(1)代表站方法---平均相关系数最大的站
(2)区域平均法
区域平均值要与周围格点(站点)值区别大
(3)综合指数法(各站点要素方差差异较大)
∑ K
j
=
1 m
m i=1
距平 方差与标准差 变率和变差系数
13
3、变率和变差系数
要会算
14
相对变率:绝对变率与平均值之比。 也可用百分比表示:
15
(3)变差系数:表示变量的相对变化,标准差与 平均值之比(%)
注意: 绝对变率和标准差的数量级与变量平均值
的量级有关。有些同类型变量,彼此之间平均 值差别大,若要比较它们的变化性用绝对变率 和标准差不恰当,应当利用相对变率或变差系 数(选一).
2)意义 表征研究要素的一般水平。
变量取值次数较少,或虽然取值次 数多,但无明显集中趋势,计算众数就 没有意义。
2、 距平
xdt = xt − x t = 1,2,", n (3)
含义:反映数据偏离平均值的状况 ,也是通 常所说的异常。
距平序列:单要素样本中每个样本资料点的距 平值组成的序列称为距平序列,也可以记为距平向 量。
( xij
− si
xi
2
)
i = 1,2,", m
j = 1,2,", n
i表示区域内台站,j表示观测资料的年代。
越大,异常越明显
34
第四节 气候资料的审查与订正
1、什么叫资料均匀或均一 2、什么是可靠的观测序列
3、资料的订正 插补 纠正 延长
雄值
资料的订正(插补、延长)
__
海海
96差0值
资料订正问题的发展史
所谓相关检验,就是检验 ρ=0的假设是 否显著 。
在假设总体相关系数ρ=0成立条件下, 样本相关系数r的概率密度函数正好是t分 布的密度函数。于是,就可以用t检验法 来检验。
51
(1)t 检验
在原假设ρ=0的条件下,统计量
t = r n−2 1− r2
符合自由度为n-2的t分布. 给定信度α 和样本相关系数r,根据自由度查
气象统计方法 复习纲要
1
第一章 气象资料及其表示方法
2
本章主要包括两方面的内容:
单个要素的气象资料 多个要素的气象资料
学习要点: 掌握平均值、距平、标准化、正态化的概念
,并学会它们在单要素、特别是多要素气象资 料场中的应用(实习一的内容)。
3
二、数据资料的统计特征
要素样本中资料分布的特点----用一些统计 量表征。
44
第二节 天气预报指标的统计检验
1.二项分布
(1)二分类预报:只预报事件A出现或 者不出现( A ),又称为正反预报。设 P(A)=p, P(A) = q ,p+q=1
问题:求n次独立试验中,事件A出现m次 的概率 Pn (m)
第三节 定量数据时的指标
状态要素:可以用条件概率选择预报因子并 且用二项分布检验预报因子的可靠程度。
(一) 描述平均状况(中心趋势)的统计量
1、平均值
∑ x
=
1 n
n t =1
xt
(2)
含义:平均值是要素总体数学期望的一个 估计。反映了该要素的平均(气候)状况。
平均值概念在气象上的应用: 1)时间平均
月平均气温、年平均气温及某要素 多年平均值就是这种统计量。
**多年平均值:对于多年逐月的资 料,如何计算?
16
累积频率:变量小于某上限的次数与 总次数之比。(样本特征—直方图)
17
三、总体和样本
总体(母体):统计分析对象的全体。 样本:总体中的一部分。
18
五、数据的标准化
1、为何要进行标准化
各要素单位不同、平均值和标准差 也不同。为使它们在同一水平上比较, 采用标准化方法,使它们变成同一水平 的无单位的变量----标准化变量。
订正方法
1)回归订正方法(关系密切的站)
Jen 两站同一要素:先计算相关系数,再建立一元线性回归 方程对周围的基本站进行逐步筛选来建立多元回 归订正公式,是一个较好的途径。
2)差值订正法(地理环境近似一致的站点, 站与站之间差值基本为常数----气温、 气压) 3)比值订正法 两台站降水比值为准常数
x zt
=
xt − x sx
t = 1,2,", n (5)
19
2、可以证明: (1)标准化变量的平均值为0。 (2)标准化变量的方差为1。
20
1、概念
峰度系数与偏度系数是用来衡量随 机变量分布密度曲线形状的数字特征, 描述了气候变量的分布特征。
偏度系数:表征曲线峰点对期望值 (平均值)偏离的程度。
ry1.2 (ry 2.1 )
58
第四节 高自相关变量间的相关系数 及其统计检验
(1)两个变量无持续性(非高自相关)
---------t检验
(2)两变量本身有强持续性或高自相关,t 检验的自由度不能用,需要计算有效自由度
n ,其中
T
∑∞
T=
Rxx ( j)Ryy ( j)
j =−∞
59
so 第五节 偏相关系数
1.概念
当存在三个以上变量互相影响时(如 考虑y和x1、x2之间的关系),需要考虑消 除了x1(x2)影响后,x2(x1)与y的相关关系 ,这时候的相关系数称为偏相关系数,记 为
相关文档
最新文档