《气象统计方法》考试试题总结
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《气象统计方法》复习要点及思考题
一、填空题
1.
气候变化上通常说的异常,可以用 距平这个基本统计量来描述,它反映数据偏离平均值(气候态)的状况,把资料处理成该统计量的形式,叫做资料的中心化。
2. 距平是指要素偏离平均值(气候态)的状况,把资料处理为距平的方法叫中心化。
3. 如果一月南京气温的标准差比北京小,说明一月南京气温变化幅度比北京小,预报较为容易。
4.
对资料进行标准化可以消除单位量纲不同造成的影响,其表达式为x
,标准化以后资料的均方
差为1,平均值是_0_。
5. 频率表是用来描述 状态资料的统计特征的。
6. 一元线性回归分析中回归系数b 与相关系数r 之间的关系为b=lxy/lxx,r=lyy(1-r2)
7. 多元线性回归中常采用最小二乘法求回归系数。
8. 滑动平均是趋势拟合技术最基础的方法,它相当于低通滤波器。
9.
最后一个累积距平值为 0 。
10. 复相关系数是衡量一个变量和 多个变量之间的线性关系程度的量。
11. 变量场X 表示为 ,则第i 个特征向量对变量X
的方差贡献为 ,前P 个特征向量对变量场的累积方差贡献为 。
12. 对上题中的变量场X ,当 m>>n 时在实际计算中通常需进行时空转换。
13. 相关系数的绝对值越大,表示变量之间关系越 密切(紧密)。
14. 在事件B 已经发生的条件下计算事件A 的概率,称为事件A 在事件B 已出现条件下的 条件概率。
15. 二分类预报是指只预报事件A 出现或者不出现,又称为正反预报。
16. 在对回归问题进行方差分析时,预报量的方差可以表示成_回归方差与误差或残差方差之和。
17. 气象中一些气象要素,如冰雹、晕、雾等天气现象,气象资料中仅记录为“有”或“无”可用“1”
或“0”二值数字化表征,这类变量可看成离散型随机变量。
对于这种状态要素,可以用条件概率选择预报因子并且用二项分布检验预报因子的可靠程度。
气温、气压及降水量等气象要素,观测值在正、负无穷之间,这种类型要素可看成为连续型随机变量。
对于这种定量数据要素,主要用相关系数选择预报因子或因子集,并用t_检验方法检验其可靠性。
18. 如果序列的__自_相关系数为较大正值,表明序列具有_高持续性_;如果序列的滞后自相关系数接近0
或为负值,表明序列无持续性。
如果两变量本身有强持续性或高自相关,t_检验的自由度不能用,需要计算有效自由度,取更_严格的标准进行相关系数的检验,以免得到虚假的不可靠的相关。
1112121
2221
2
n n m m mn x x x x x x x x x ⋅⋅⋅⎛⎫
⎪
⋅⋅⋅ ⎪
= ⎪⋅⋅⋅⋅⋅⋅
⎪
⋅⋅⋅⎝⎭
X
19.气象变量场EOF分析是把原变量场分解为空间函数和时间函数两部分,用为数较少的不相关的典型模
态,代替原始的气候变量场。
20.利用一元线性回归方法进行线性趋势分析中,回归系数b的符号说明了气候变量x的趋势倾向。
当b>0
说明随时间的增加,变量x是呈(上升或下降)趋势; b值的大小反映了上升或下降的速率,b的绝对值越大,表明直线越(倾斜或平缓)。
21.检验两地气候是否有显著差异,可针对这两个地区某气象资料的平均值和方差这两个基本统计量进行
显著性检验。
22.对多要素资料的数据矩阵进行分析时,研究变量之间的相互关系,称为R型分析,而研究样本之间关
系的称为_Q型分析,相应的在系统聚类分析中,也可分为R型聚类和_Q型聚类。
二、判断题
1、相关系数是标准化变量的协方差。
( )
2、若相关系数通过显著性检验就说明总体一定存在线性相关。
( )
3、对于一元线性回归来说,回归方程的检验与相关系数的检验一致。
( )
4、预报量95%的置信区间表示真值有95%的概率落在该区间内。
( )
5、在多元线性回归方程中,若某个因子对预报量y的作用不显著,则它前面的系数近似为0。
( )
6、显著性水平α控制了犯“第二类错误”(以假为真)的概率。
( )
三、简答题
1、简述资料正态化的必要性和常用的资料正态化处理方法。
答:
必要性是:各类统计预报模型和统计检验方法(F\t\u\x2检验)要求资料是符合正态分布。
年\月平均气温\气压\多雨地区的月降水量符合.日降水和少雨地区月降水通常偏态。
旬\候降水不一定。
处理方法:1、立方根或四次方根;2.双曲正切转换(纠正课本公式)--旬降水。
3、化为有序数后的正态化转换(标准化和正态化)
2、简述显著性检验的基本思想。
答:
抽样会产生抽样误差,利用样本资料进行分析时,不能仅凭样本资料的结果就对总体特征做出判断,而要鉴别其结果是否为总体的特征。
首先对总体的参数或分布形式做出一个假设,然后利用样本信息来判断这个假设是否合理。
原理是利用“小概率事件在一次试验中几乎是不发生的”来接受假设或者否定假设,是一种带有概率性质的“反证法”。
在原假设为真时拒绝元假设,称为第一类错误(以真为假),其出现的概率通常记作a,原假设为假时接受原假设,称为第二类错误,其出现的概率通常记作B,这种限定犯第一类错误的最大概率a,不考虑犯
第二类错误的概率B的检验就称为显著性检验,概率a称为显著性水平。
3、简述利用多元线性回归方程进行预报的步骤。
答:
1) 确定预报量并选择恰当的因子
2) 根据数据计算回归系数标准方程组所包含的有关统计量(因子的交叉积、矩阵协方差阵或相关阵,以及因子与预报量交叉积向量)
3)解线性方程组定出回归系数
4)建立回归方程并进行统计显著性检验
5)利用已出现的因子值代入回归方程作出预报量的估计,求出预报值的置信区间
4、逐步回归中逐步剔除法与逐步引入法的主要缺点分别是什么?
答:
逐步剔除法的主要缺点是计算量很大
逐步引入法的主要缺点是计算量很小,但不一定保证最后的方程是最优的。
5、请写出多元回归方程中预报因子数目增多的优缺点。
答:
优点:一般而言,回归方程中包含的因子个数越多,回归平方和就越大,残差平方和越小,残差方差的估计就越小,预报值的置信区间就越小,方程一般也较容易通过检验。
缺点:1、因子增多,计算量增大,计算时间增多
2、方程中若含有对y不起作用或作用极小的因子,残差平方和不会由于这些变量的增多而减少多少,相反由于Q自由度减小,残差方差估计值增大,使预报置信区间估计值增大。
3、由于存在对预报量y影响不显著地因子,随之带来许多其他与与预报量无关的随机因素,影响回归方程的稳定性反而使预报效果下降。
6、试举例说明哪些方法(不少于三种)可以进行气候变化趋势分析?
1)线性倾向估计;2)滑动平均;3)二次平滑;4)累积距平
7、简述回归分析与相关分析的区别。
答:
(1) 相关分析中,变量 x 变量 y 处于平等的地位;回归分析中,变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化。
(2). 相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量,也可以是非随机的确定变量。
(3). 相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制。
四、 计算分析
1、已知预报量y:长江中下游夏季(6-8月)降水量,预报因子x1 : 冬季(12月-翌年2月)北太平洋涛动指数;x2:1月太平洋地区极涡面积指数;x3:5月西太平洋副高脊线,样本容量n=44。
现建立y 关于x1、x
2、x3的多元回归方程,分析结果如表2所示。
(1)试写出回归方程的表达式,并给出预报值95%的置信区间。
答:由表2,Y=287.435+2.496x1-0.195x2-2.901x3 ;
(2)简要说明回归方程是否通过显著性检验。
设显著性水平为0.05。
答:由方差分析表,在0.05显著性水平下,F 值为4.191或P 值0.011,通过显著性检验。
试问各预报因子是否显著?
(3)y 与各x 因子的复相关系数为多少?回归方程的判决系数为多少?并简要说明其代表的意义。
表2 多元回归分析结果表
df SS MS F Significance F
回归分析 3.000
201569.234 67189.745 4.191 0.011 残差 40.000 641325.198 16033.130 *** *** 总计 43.000
842894.432
***
***
****
Coefficients 标准误差 t Stat P-value Intercept 287.435 295.875 0.971 0.337 X 1 2.496 1.210 2.063 0.046 X 2 -0.195 0.217 -0.898 0.375 X 3
-2.901
1.061 -
2.733
0.009
2、试计算变量x、y 的简单相关系数,并进行显著性检验。
已知显著性水平 =0.05下的临界相关系数0.05r =
0.709。
回归统计
Multiple R 0.489 R Square 0.239 Adjusted R Square
0.182 标准误差
126.622
n 1 2 3 4 5 6 7 8
x 1015131773122
y -831946-5-2
五、综合分析题
第一模态方差贡献15.5%
(1)请判断图中EOF分析的对象是原始场、距平场还是标准化距平场?
答:是距平场
(2)请给两幅图加上图题。
答:图一 中国夏季降水异常EOF分析第一模态空间型。
图二中国夏季降水异常EOF分析第一模态时间系数。
(3)请试分析图中的特征。
答:中国夏季降水异常EOF分析第一模态空间型主要反映了长江流域与华南及华北地区的降水异常的反位相变化,而其他地方的数值较小,说明这些地方夏季降水的方差较小。
中国夏季降水异常EOF分析第一模态时间系数则具有较明显的年际变化,其值在0线上下振荡。
说明,当时间系数为正时,长江流域降水偏多时,华南及华北地区降水偏少。
这与我国夏季东部降水的三雨带变化相对应。