2气象统方法-复习思考题

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

《气象统计方法》复习要点与思考题
1、气候变化上通常说的异常，可以用距平这个基本统计量来描述，它反映数据偏离平均值（气候态）
的状况，把资料处理成该统计量的形式，叫做资料的中心化。

2、距平是指要素偏离平均值（气候态）的状况，把资料处理为距平的方法叫中心化。

3、如果一月南京气温的标准差比小，说明一月南京气温变化幅度比小，预报较为容易。

4、对资料进行标准化可以消除单位量纲不同造成的影响，其表达式为x
t zt s x x x -=
，标准化以后资
料的均方差为1，平均值是_0_。

5、频率表是用来描述状态资料的统计特征的。

6、一元线性回归分析中回归系数b 与相关系数r 之间的关系为b=lxy/lxx,r=lyy(1-r2)
7、多元线性回归中常采用最小二乘法求回归系数。

8、滑动平均是趋势拟合技术最基础的方法，它相当于低通滤波器。

9、最后一个累积距平值为0。

10、复相关系数是衡量一个变量和多个变量之间的线性关系程度的量。

11、
变量场X 表示为，则第i 个特征向量对变量X
的方差贡献为，前P 个特征向量对变量场的累积方差贡献为。

12、对上题中的变量场X ，当m>>n 时在实际计算中通常需进行时空转换。

13、相关系数的绝对值越大，表示变量之间关系越密切（紧密）。

14、在事件B 已经发生的条件下计算事件A 的概率，称为事件A 在事件B 已出现条件下的条件概率。

15、二分类预报是指只预报事件A 出现或者不出现，又称为正反预报。

16、在对回归问题进行方差分析时，预报量的方差可以表示成_回归方差与误差或残差方差之和。

17、
气象中一些气象要素，如冰雹、晕、雾等天气现象，气象资料中仅记录为“有”或“无”可用“1”或“0”二值数字化表征，这类变量可看成离散型随机变量。

对于这种状态要素，可以用条件概率选择预报因子并且用二项分布检验预报因子的可靠程度。

气温、气压与降水量等气象要素，观测值在正、负无穷之间，这种类型要素可看成为连续型随机变量。

对于这种定量数据要素，主要用相关系数选择预报因子或因子集，并用t_检验方法检验其可靠性。

18、如果序列的__自_相关系数为较大正值，表明序列具有_高持续性_；如果序列的滞后自相关系数接
近0或为负值，表明序列无持续性。

如果两变量本身有强持续性或高自相关，t_检验的自由度不能用，需要计算有效自由度，取更_严格的标准进行相关系数的检验，以免得到虚假的不可靠的相关。

19、气象变量场EOF 分析是把原变量场分解为空间函数和时间函数两部分，用为数较少的不相关的典
型模态，代替原始的气候变量场。

20、利用一元线性回归方法进行线性趋势分析中，回归系数b 的符号说明了气候变量x 的趋势倾向。

当b>0说明随时间的增加，变量x 是呈（上升或下降）趋势；b 值的大小反映了上升或下降的速率，b 的绝对值越大，表明直线越（倾斜或平缓）。

21、检验两地气候是否有显著差异，可针对这两个地区某气象资料的平均值和方差这两个基本统计量
进行显著性检验。

22、对多要素资料的数据矩阵进行分析时，研究变量之间的相互关系，称为R 型分析，而研究样本之
1112121
2221
2
n n m m mn x x x x x x x x x ⋅⋅⋅⎛⎫
⎪
⋅⋅⋅ ⎪
= ⎪⋅⋅⋅⋅⋅⋅
⎪
⋅⋅⋅⎝⎭
X
间关系的称为_Q型分析，相应的在系统聚类分析中，也可分为R型聚类和_Q型聚类。

二、判断题
1、相关系数是标准化变量的协方差。

（）
2、若相关系数通过显著性检验就说明总体一定存在线性相关。

（）
3、对于一元线性回归来说，回归方程的检验与相关系数的检验一致。

（）
4、预报量95%的置信区间表示真值有95%的概率落在该区间内。

（）
5、在多元线性回归方程中，若某个因子对预报量y的作用不显著，则它前面的系数近似为0。

（）
6、显著性水平控制了犯“第二类错误”（以假为真）的概率。

（）
三、简答题
1、简述资料正态化的必要性和常用的资料正态化处理方法。

答:必要性是:各类统计预报模型和统计检验方法（F\t\u\x2检验）要求资料是符合正态分布。

年\月平均气温\气压\多雨地区的月降水量符合.日降水和少雨地区月降水通常偏态。

旬\候降水不一定。

处理方法:1、立方根或四次方根；2.双曲正切转换（纠正课本公式）--旬降水。

3、化为有序数后的正态化转换（标准化和正态化）
2、简述显著性检验的基本思想。

抽样会产生抽样误差，利用样本资料进行分析时，不能仅凭样本资料的结果就对总体特征做出判断，而要鉴别其结果是否为总体的特征。

首先对总体的参数或分布形式做出一个假设，然后利用样本信息来判断这个假设是否合理。

原理是利用“小概率事件在一次试验中几乎是不发生的”来接受假设或者否定假设，是一种带有概率性质的“反证法”。

在原假设为真时拒绝元假设，称为第一类错误（以真为假），其出现的概率通常记作a,原假设为假时接受原假设，称为第二类错误，其出现的概率通常记作B，这种限定犯第一类错误的最大概率a,不考虑犯第二类错误的概率B的检验就称为显著性检验，概率a称为显著性水平。

3、简述利用多元线性回归方程进行预报的步骤。

答：1) 确定预报量并选择恰当的因子
2) 根据数据计算回归系数标准方程组所包含的有关统计量(因子的交叉积、矩阵协方差阵或
相关阵,以与因子与预报量交叉积向量)
3）解线性方程组定出回归系数
4）建立回归方程并进行统计显著性检验
5）利用已出现的因子值代入回归方程作出预报量的估计，求出预报值的置信区间
4、逐步回归中逐步剔除法与逐步引入法的主要缺点分别是什么？
答:逐步剔除法的主要缺点是计算量很大
逐步引入法的主要缺点是计算量很小，但不一定保证最后的方程是最优的。

5、请写出多元回归方程中预报因子数目增多的优缺点。

答:优点:一般而言，回归方程中包含的因子个数越多，回归平方和就越大，残差平方和越小，残差方差的估计就越小，预报值的置信区间就越小，方程一般也较容易通过检验。

缺点:1、因子增多，计算量增大，计算时间增多
2、方程中若含有对y不起作用或作用极小的因子，残差平方和不会由于这些变量的增多而减少多少，相反
由于Q自由度减小，残差方差估计值增大，使预报置信区间估计值增大。

3、由于存在对预报量y影响不显著地因子，随之带来许多其他与与预报量无关的随机因素，影响回归方程
的稳定性反而使预报效果下降。

1、试举例说明哪些方法（不少于三种）可以进行气候变化趋势分析？
1）线性倾向估计；2）滑动平均；3）二次平滑；4）累积距平
2、简述回归分析与相关分析的区别。

答：(1) 相关分析中，变量x 变量y 处于平等的地位；回归分析中，变量y 称为因变量，处在被解释的地位，x 称为自变量，用于预测因变量的变化。

(2). 相关分析中所涉与的变量x 和y 都是随机变量；回归分析中，因变量y 是随机
变量，自变量x 可以是随机变量，也可以是非随机的确定变量。

(3). 相关分析主要是描述两个变量之间线性关系的密切程度；回归分析不仅可以揭示变
量x 对变量y 的影响大小，还可以由回归方程进行预测和控制。

四、计算分析
1、已知预报量y：长江中下游夏季（6-8月）降水量，预报因子x1 ：冬季（12月-翌
年2月）北太平洋涛动指数；x2：1月太平洋地区极涡面积指数；x3：5月西太平洋
副高脊线，样本容量n=44。

现建立y关于x1、x2、x3的多元回归方程，分析结果
如表2所示。

1)试写出回归方程的表达式，并给出预报值95%的置信区间。

答：由表2，Y=287.435+2.496x1-0.195x2-2.901x3 ;
2)简要说明回归方程是否通过显著性检验。

设显著性水平为0.05。

答：由方差分析表，在0.05显著性水平下，F值为4.191或P值0.011，通过显
著性检验。

3)试问各预报因子是否显著？
4)y与各x因子的复相关系数为多少？回归方程的判决系数为多少?并简要说明其
代表的意义。

四、计算题
1、试计算变量x、y的简单相关系数，并进行显著性检验。

已知显著性水平 =0.05
下的临界相关系数0.05r = 0.709。

n 1 2 3 4 5 6 7 8 x 10 15 13 17 7 3 1 22 y
-8
3
1
9
4
6
-5
-2
解:x=(10+15+13+17+7+3+1+22)/8=11 y=(-8+3+1+9+4+6-5-2)/8=1 x=-1 y=-9 Sx= 4 2 2 0 6 8 -4 3 -8 5 -10 -6 -11 -3
第一模态方差贡献15.5%
1、请判断图中EOF 分析的对象是原始场、距平场还是标准化距平场？答:是距平场
2、请给两幅图加上图题。

答:图一中国夏季降水异常EOF 分析第一模态空间型。

图二中国
夏季降水异常EOF 分析第一模态时间系数。

3、请试分析图中的特征。

答中国夏季降水异常EOF 分析第一模态空间型主要反映了长江流域与华南与华北地区的降水异常的反位相变化，而其他地方的数值较小，说明这些地方夏季降水的方差较小。

中国夏季降水异常EOF 分析第一模态时间系数则具有较明显的年际变化，其值在0线上下振荡。

说明，当时间系数为正时，长江流域降水偏多时，华南与华北地区降水偏少。

这与我国夏季东部降水的三雨带变化相对应。

23、气候变化上通常说的异常，可以用距平这个基本统计量来描述，它反映数据偏离平均值的状况，
把资料处理成该统计量的形式，叫做资料的_中心化。

24、对资料做标准化可以消除单位量纲不同造成的影响，其表达式为
x
t zt s x x x -=
，标准化以后资料的均
方差为1。

25、在对回归问题进行方差分析时，预报量的方差可以表示成回归方差与误差（残差）方差之和。

26、寻找合适的条件概率作为天气预报指标需要满足两个经验性条件，一是P(A/B)>>P(A) 或
P(A/B)<<P(A),它保证了事件A 与B 事件有一定的联系;第二是P(A/B)→1或者P(A/B)→0,它保证了预报指标有一定的准确率。

27、气象中一些气象要素，如冰雹、晕、雾等天气现象，气象资料中仅记录为“有”或“无”可用“1”
或“0”二值数字化表征，这类变量可看成离散型随机变量。

对于这种状态要素，可以用_条件
概率____选择预报因子并且用二项分布检验预报因子的可靠程度。

气温、气压与降水量等气象要
素，观测值在正、负无穷之间，这种类型要素可看成为连续型随机变量。

对于这种定量数据要素，
主要用相关系数_选择预报因子或因子集，并用___t__检验方法检验其可靠性。

28、如果序列的_自（滞后）相关系数为较大正值，表明序列具有高持续性；如果序列的滞后自相关系
数接近0或为负值，表明序列无持续性。

如果两变量本身有强持续性或高自相关，t_检验的自由
度不能用，需要计算有效自由度，取更严格的标准进行相关系数的检验，以免得到虚假的不可靠
的相关。

29、气象变量场EOF分析是把原变量场分解为空间函数和时间函数两部分，用维数较少的不相关的
典型模态，代替原始的气候变量场。

30、利用一元线性回归方法进行线性趋势分析中，回归系数b的符号说明了气候变量x的趋势倾向。

当b>0说明随时间的增加，变量x是呈（上升或下降）趋势；b值的大小反映了上升或下降的速
率，b的绝对值越大，表明直线越（倾斜或平缓）。

31、检验两地气候是否有显著差异，可针对这两个地区某气象资料的平均值和方差这两个基本统计量
进行显著性检验。

32、对多要素资料的数据矩阵进行分析时，研究变量之间的相互关系，称为R型分析，而研究样本之
间关系的称为_Q_型分析，相应的在系统聚类分析中，也可分为R型聚类和Q_型聚类。

二、名词解释
1、累积频率:变量小于某上限值的次数与总次数之比。

2、均值突变：从一个气候基本状态向另外一个气候基本状态的急剧变化
三、问答题
3、什么是偏相关系数? 当存在三个以上变量相互影响时，如（x1,x2,y）,当消除x1（或x2）的影响，
计算x2(或x1)与y的相关系数时，就称为偏相关系数。

4、试举例说明哪些方法（不少于三种）可以进行气候变化趋势分析？
答：1）线性倾向估计2）滑动平均3）三次样条函数
5、简述回归分析与相关分析的区别。

在相关分析中，解释变量X与被解释变量Y之间处于平等的位置。

而回归分析中，解释变量与被解释变量必须是严格确定的。

2 相关分析中，被解释变量Y与解释变量X全是随机变量。

而回归，被解释变量Y是随机的，解释变量X可能是随机的，可能是非随机的确定变量。

3 相关的研究主要主要是为刻画两变量间线性相关的密切程度。

而回归不仅可以揭示解释变量X和被解释变量Y的具体影响形式，而且还可以由回归方程进行预测和控制。

如果两变量间互为因果关系，解释变量与被解释变量互换位置，相关分析结果一样，回归分析结果不同。

6、如何分析两个气候变量序列的相关关系，需要注意什么？
7、整理区域资料有哪些常用的方法? 答区域平均法、综合指数法、代表台站法
四、计算分析题
已知预报量y：长江中下游夏季（6-8月）降水量，预报因子x1 ：冬季（12月-翌年2月）北太平洋涛动指数；x2：1月太平洋地区极涡面积指数；x3：5月西太平洋副高脊线，样本容量n=44。

现建立y关于x1、x2、x3的多元回归方程，分析结果如表1所示。

5)试写出回归方程的表达式。

6)简要说明回归方程是否通过显著性检验。

设显著性水平为0.05。

7)回归方程的判决系数为多少？并简要说明其代表的意义。

表1 多元回归分析结果表。