气象统计方法复习资料
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
学习内容:
Chapter 1-气象资料及其表示方法
Chapter 2-选择最大信息的预报因子
Chapter 3-气候稳定性检验
Chapter 4-气候趋势分析
Chapter 5-一元线性回归
Chapter 6-多元线性回归
Chapter 7-逐步回归
Chapter-8-气象变量场时空结构分离
复习题:
1、气象统计预报是利用统计学方法对气象(气候)样本进行分析来估计和推测总体的规律性。
2、突变可分为:均值突变、变率突变、趋势突变。
3、气候统计诊断分析与天气统计诊断分析的不同点是研究对象不同,一个是(气候特征),一个是(天气特征)。
相同点是数据资料都必须是(长时间)的观测数据。
4、()需要对结论进行一系列的推断,分析结论的可信程度以及是否为因果关系。
A 统计分析;B统计诊断;
5、采用统计诊断的方法研究天气、气候现象,可以用于哪些方面()<多选>。
A 了解区域性或者全球性天气、气候现象的时空分布特征、变化规律及异常程度;
B 探索气候变量及其与其它物理因素之间的联系;
C 对数值模拟结果与实际变化状况之间的差异进行统计诊断,为改进模式提供线索和指导;
6、对天气、气候现象进行统计诊断分析,一般分为四步。
首先,();其次,();再次,();最后,()。
A科学综合和诊断;B选择诊断方法;C资料预处理;D收集资料;
7、气候统计预测,一般分为四步。
首先,();其次,();再次,();最后,()。
A建立统计模型;B统计检验;C预测结论;D收集资料;
8、统计预测模型在利用大量()观测资料对气候系统内部或与其它变量之间关系的变化规律及特征分析基础上建立的,用于对()状态进行估计。
在这一预测过程中,假设气候变化的成因和物理机制至少在()期间与()期间一致;气候系统保持稳定。
A过去;B未来;C预测;D观测;
9、气候统计预测过程主要由以下4个要素构成:1、(),例如:夏季降水量,8月份高温日数、暴雨日数;2、(),通常为从某些统计上显著相关的预报因子群提取的有效信息;3、(),根据数据性质、预测对象和预测因子特点,选择合适的统计预测模型;4、(),对未来气候变化状态时间、空间、数量、性质等方面的预测。
A预测技术;B预测依据;C预测结果;D预测对象;10、气象统计研究对象可以划分为()、多要素气象资料。
例如:1950-2016年南京7月份高温日数,属于()气象资料;例如某气象站7月份日降水量与08时相对湿度,属于()气象资料。
A 单要素;B多要素;
11、根据预报(或预测、预估)对象的时间尺度可以进行如下划分:1、(),小于10天;2、(),10-30天;3、(),月、季、年;4、(),年代际或更长。
A天气预报;B延伸期预测;C气候预测;D气候变化预估;
12、()是要素总体数学期望的一个估计,反映了该要素的平均(气候)状况;()是将变量值按大小顺序排列,处于中间位置的那个数,表征变量的中心趋势;()是要素(变量)值中出现次数最多的那个数,表征最容易发生的情况。
()是变量小于某上限的次数与总次数之比。
A 平均值;
B 中位数;
C 众数;
D 累积频率;
13、观测序列为(1,3,3,3,5,6,7,8,9),平均值是(),中位数是(),众数是()
A 3;
B 5;
C 6;
D 7;
14、观测序列为(1,3,3,3,5,6,7,8,18),平均值是(),中位数是(),众数是()
A 3;
B 5;
C 6;
D 7;
15、甲地区12月份气温的均方差(标准差)为1.75,1月份气温均
方差为1.09。
乙地区12月份气温的均方差(标准差)为1.61,1月份气温均方差为2.03。
对甲地区来说,()月份气温变化幅度较大;对乙地区来说,()月份气温变化幅度较大;就12月份而言,()地区气温变化幅度较大。
A 甲;
B 乙;
C 12;
D 1;
16、累积频率是变量小于某上限的次数与总次数之比。
观测序列为(1,3,3,3,5,6,7,8,9)。
上限为4的累积频率为()/9,上限为7的累积频率为()/9。
A 2;
B 4;
C 6;
D 8;
17、()是指统计分析对象的全体。
()是指总体中的一部分。
气象上的总体指无限总体,一组气象资料就是无限总体的()。
1950-2016年南京地区夏季降水量这组气象观测资料属于()。
()的特征是客观存在的,不是随机变量。
()的特征随所取的样本而变化,与其有关的变量也称为随机变量,如平均值、均方差等。
A 总体;
B 样本;
18、在随机事件中,随着试验次数的增加,事件发生的频率趋于一个稳定值(概率)。
()是事件的总体特征;()是事件的样本值。
A 概率;
B 频率;
19、为使不同要素的观测数据在同一水平上比较,采用标准化方法,使它们变成同一水平的无单位的变量。
气象观测数据标准化后的平均
值是(),均方差是()。
A -1;
B 0;
C 1;
20、研究某一区域时,若区域中m个站气象要素变化具有较好的一致性,可以把这一区域当作一个点来研究。
可使用()法,选用最具代表性的站; 或使用()法,采用m个站的平均值。
A 区域平均;B代表站;
21、n次观测次数中,事件A出现nA次,则事件A的频率P(A)为nA/n。
观测次数n足够大,P(A)稳定接近某个常数,这就是( )。
概率描述的是总体特征,而()是样本的特征。
A 概率;
B 频率;
C 事件;
22、布袋中有4个球,分别标有A、B、C、D。
从布袋中拿出1个球。
拿到的球有()种可能。
从布袋中拿出2个球(考虑先后顺序),总共有()种可能。
从布袋中拿出2个球(不考虑先后顺序),总共有()种可能。
A 4;
B 6;
C 8;
D 12;
23、夏天某地区冰雹出现概率为0.03。
5天中有一次冰雹的概率为();至少有一次冰雹的概率为()(多选)。
A、0.03×5=0.15;
B、C51×0.031×0.974=0.1328;
C、C51×0.031×0.974+C52×0.032×0.973+C53×0.033×0.972+C54×0.034×0.971+C55×0.035×0.970=0.1413;
D、1- C50×0.030×0.975=0.1413;
24、自然界中各现象间存在普遍的关联。
这种关系可分为两种:物理意义明确,可用数学函数表达的关系称为();统计上的相互关联称为()。
A 确定性关系;
B 非确定性关系;
25、统计分析中用相关系数度量各现象(各要素)间的相关程度。
下列三个相关关系示意图中,表示非线性相关关系的是(),表示完全线性相关的是(),表示负线性相关关系的是()。
26、相关系数r的绝对值越(),表示两变量之间关系越密切。
r 越接近1.0,()相关越显著;r越接近-1.0,()相关越显著。
A 小;
B 大;
C 正;
D 负;
27、根据统计学中大样本定理,通常认为样本量n大于()才有统计意义。
当样本量较小时,计算所得相关系数可能会离总体相关系数甚远。
这时,需要对相关系数加以校正。
A 10;
B 20;
C 30;
D 40;
28、检验某一地区气候是否具有稳定性、两个地方的气候是否有显著差异可以基于均值进行检验,检验方法有()和t检验。
方差反映了某一变量观测数据的偏离程度,它也是变量稳定与否的重要测
度。
基于方差的检验方法有()和F检验。
A χ2检验;
B u检验;
C t检验;
D F检验;
29、随时间变化的一列气候数据构成了一个()。
例如:1921-2000年南京地区夏季降水量。
它的特征有:数据的取值随时间变化;数据采样可能受到不确定因素的影响;还有,()<多选>。
A 气候时间序列;
B 前后时刻的数据之间可能存在关联;
C 时间序列整体可能上有上升或下降趋势;
D 时间序列可能呈现周期性振荡;
E 从某一时刻开始,数据取值可能出现转折或突变;
30、用xi表示样本量为n的某一气候变化,用ti表示xi所对应的时间,建立xi和ti之间的一元线性回归方程:。
其中,为回归方程计算值,a为( ),b为( )回归系数。
使n对计算值( )和观测值(xi)的误差平方和达到最小,可采用( )计算出a和b。
系数b表示了()。
b符号为正,说明变量随时间t的增加呈()趋势,反之则为()趋势。
r为时间ti和观测数据xi所的相关系数。
r表示变量x与时间变化的关联程度。
要判断变化趋势的程度是否显著,就要对()进行显著性检验。
A 回归系数;
B 回归常数;
C 最小二乘法;
D 变量x随时间的趋势倾向;
E 下降;
F 上升;H 相关系数;
31、下列回归方程中,表示非线性回归的是(),表示一元线性回归的是(),表示多元线性回归的是()。
32、在气象预报中,对预报量的预报常常需要从可能影响预报量y 的诸多因素中挑选一批关系显著的作为预报因子。
在应用多元线性回
归的方法建立回归方程来做预报时,既要选择对预报量影响显著的因子,又要使回归方程的残差方差估计很小,这样才有利于气象预报。
()方法就是选择这种最优的回归方程。
一般分为三种方案:逐步剔除方案,逐步引进方案,双重检验的逐步回归方案。
从包含全部变量的回归方程中逐步剔除不显著的因子的方案是,()。
在一批待选的因子中,考查他们对预报量y的方差贡献,挑选所有因子中方差贡献最大者,经统计检验是显著的,进入回归方程,这种方案是()。
将因子一个个引入,引入因子的条件是该因子的方差贡献显著;同时,每引入一个新因子,要对老因子逐个检验,将方差贡献变为不显著的因子剔除。
这种方案是()。
A 逐步回归;
B 逐步剔除方案;
C 逐步引进方案;
D 双重检验的逐步回归方案;
33、利用一元线性回归方法进行线性趋势分析中,回归系数b的符号说明了气候变量x的趋势倾向。
当b>0说明随时间的增加,变量x是呈(上升或下降)趋势;当b<0,则变量x是呈____上升或下降)趋势。
b值的大小反映了上升或下降的速率,b的绝对值越大,表明直线越(倾斜或平滑)。
34、标准化的气象资料的平均值是0 ,均方差为 1 ,无单位。
二:简答题
1、什么是累积频率?
变量小于某上限值的次数与总次数之比。
2、什么是分布函数?
在无限总体中的累积频率
3、什么是均值突变?
从一个气候基本状态向另一个气候基本状态的急剧变化。
4、在气象中如何利用回归方程进行预报,写出预报过程。
答:1) 确定预报量并选择恰当的因子
2) 根据数据计算回归系数标准方程组所包含的有关统计量(因子的交叉积、矩阵协方差阵或相关阵,以及因子与预报量交叉积向量) 3)解线性方程组定出回归系数
4)建立回归方程并进行统计显著性检验
5)利用已出现的因子值代入回归方程作出预报量的估计,求出预报值的置信区间
5、试举例说明哪些方法(不少于三种)可以进行气候变化趋势分析?答:1)线性倾向估计2)滑动平均3)三次样条函数
6、何谓偏相关系数?
答:当存在三个以上变量相互影响时,如(x1,x2,y ),当消除x1(或x2 )的影响,计算x2 (或x1 )与y的相关系数时,就称为偏相关系数。
三、论述题:
1、简述资料正态化的必要性和常用的资料正态化处理方法。
必要性是:各类统计预报模型和统计检验方法(F\t\u\x检验)要求资料是符合正态分布。
年\月平均气温\气压\多雨地区的月降水量符合.日降水和少雨地区月
降水通常偏态。
旬\候降水不一定。
处理方法:1、立方根或四次方根;2.双曲正切转换(纠正课本公式)--旬降水。
3、化为有序数后的正态化转换(标准化和正态化)
2、简述显著性检验的基本思想。
抽样会产生抽样误差,利用样本资料进行分析时,不能仅凭样本资料的结果就对总体特征做出判断,而要鉴别其结果是否为总体的特征。
首先对总体的参数或分布形式做出一个假设,然后利用样本信息来判断这个假设是否合理。
原理是利用“小概率事件在一次试验中几乎是不发生的”来接受假设或者否定假设,是一种带有概率性质的“反证法”。
在原假设为真时拒绝元假设,称为第一类错误(以真为假),其出现的概率通常记作a,原假设为假时接受原假设,称为第二类错误,其出现的概率通常记作B,这种限定犯第一类错误的最大概率a,不考虑犯第二类错误的概率B的检验就称为显著性检验,概率a称为显著性水平。
3、简述利用多元线性回归方程进行预报的步骤。
1) 确定预报量并选择恰当的因子
2) 根据数据计算回归系数标准方程组所包含的有关统计量(因子的交叉积、矩阵协方差阵或相关阵,以及因子与预报量交叉积向量) 3)解线性方程组定出回归系数
4)建立回归方程并进行统计显著性检验
4、逐步回归中逐步剔除法与逐步引入法的主要缺点分别是什么?
逐步引入法的主要缺点是计算量很小,但不一定保证最后的方程是最
优的。
5、请写出多元回归方程中预报因子数目增多的优缺点。
优点:一般而言,回归方程中包含的因子个数越多,回归平方和就越大,残差平方和越小,残差方差的估计就越小,预报值的置信区间就越小,方程一般也较容易通过检验。
缺点:a、因子增多,计算量增大,计算时间增多
b、方程中若含有对y不起作用或作用极小的因子,残差平方和不会由于这些变量的增多而减少多少,相反由于Q自由度减小,残差方差估计值增大,使预报置信区间估计值增大。
c、由于存在对预报量y影响不显著地因子,随之带来许多其他与与预报量无关的随机因素,影响回归方程的稳定性反而使预报效果下降。
6、简述回归分析与相关分析的区别。
(1) 相关分析中,变量x 变量y 处于平等的地位;回归分析中,变量y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化。
(2). 相关分析中所涉及的变量x 和y 都是随机变量;回归分析中,因变量y 是随机变量,自变量x 可以是随机变量,也可以是非随机的确定变量。
(3). 相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量x 对变量y 的影响大小,还可以由回归方程进行预测和控制。
7、整理区域资料有哪些常用的方法?
区域平均法、综合指数法、代表台站法
四、计算题
1、求相关系数及其统计显著性检验
2、求偏相关系数
3、气候稳定性检验
4、天气指标可靠性检验
5、线性回归
6、主成分分析和EOF分解
7、主成分方法和EOF分解的推导
感谢下载!
欢迎您的下载,资料仅供参考。