统计学思考题答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4、1一组数据的分布特征可以从哪几个方面进行测度?
数据分布特征可以从三个方面进行测度与描述:一就是分布的集中趋势,反映各数据向其中心值靠拢或集中的程度;二就是分布的离散程度,反映各数据远离其中心值的趋势;三就是分布的形状,反映数据分布的偏态与峰态。
2、 4、5简述众数、中位数与平均数的特点与应用场合。
众数就是一组数据分布的峰值,不受极端值的影响,缺点就是具有不唯一性。众数只有在数据量较多时才有意义,数据量较少时不宜使用。主要适合作为分类数据的集中趋势测度值。
中位数就是一组数据中间位置上的代表值,不受极端值的影响。当数据的分布偏斜较大时,使用中位数也许不错。主要适合作为顺序数据的集中趋势测度值。
平均数对数值型数据计算的,而且利用了全部数据信息,在实际应用中最广泛。当数据呈对称分布或近似对称分布时,三个代表值相等或相近,此时应选择平均数。但平均数易受极端值的影响,对于偏态分布的数据,平均数的代表性较差,此时应考虑中位数或众数。
4、7标准分数有哪些用途?
标准分数给出了一组数据中各数值的相对位置。在对多个具有不同量纲的变量进行处理时,常需要对各变量进行标准化处理。它还可以用来判断一组数据就是否有离群数据。
7、3怎样理解置信区间?
置信区间:由样本统计量所构造的总体参数的估计区间
7、4解释95%的置信区间。
95%的置信区间指用某种方法构造的所有区间中有95%的区间包含总体参数的真值。
7、5 Za/2的含义就是什么
含义:Za/2就是标准正态分布上侧面积为a/2的z值,公式就是统计总体均值时的边际误差。
7、6 解释独立样本与匹配样本的含义。
独立样本:如果两个样本就是从两个总体中独立抽取的,即一个样本中的元素与另一个样本中的元素相互独立。
匹配样本:一个样本中的数据与另一个样本中的数据相对应。
7、8简述样本量与置信水平、总体方差、边际误差的关系。
样本量越大置信水平越高,总体方差与边际误差越小
10、1什么就是方差分析?它研究的就是什么?
答:方差分析就就是通过检验各总体的均值就是否相等来判断分类型自变量对数值型因变量就是否有显著影响。它所研究的就是非类型自变量对数值型因变量的影响。
10、4方差分析中有哪些基本假定?
答:方差分析中有三个基本假定:
(1)每个总体都应服从正态分布
(2)各个总体的方差σ2必须相同
(3)观测值就是独立的
说明误差分解的基本原理
就是通过计算来比较因某一特定因素带来的样本值的差异与随机偶然因素对样本值的差异的大小,从而判断该因素对总体就是否有统计意义。
解释主效应与交互效应
在多因素实验研究中,主效应就就是在考察一个变量就是否会对因变量的变化发生影响的时候,不考虑其她研究变量的变化,或者说将其她变量的变化效应平均掉。换句话说,就就是其她研究变量都不变化的情况下,单独考察一个自变量对因变量的变化效应。
交互效应,则就是反映两个或两个以上自变量相互依赖、相互制约,共同对因变量的变化发生影响。换句话说,如果一个自变量对因变量的影响效应会因另一个自变量的水平不同而有所不同,则我们说这两个变量之间具有交互效应。
10、15简述完全随机化设计、随机化区组设计、因子设计的含义与区别。
(4)答:完全随机化设计就是将k种“处理”随机地指派给试验单元的设计。
随机化区组设计就是先按一定规则将试验单元划分为若干同质组,称为
“区组”,然后再将各种处理随机地指派给各个区组。因子设计指考虑两个因素(可推广到多个因素)的搭配试验设计。
区间估计的基本原理就是什么?
参数估计一般就是指根据样本信息,对总体分布中的未知参数θ进行估计,而我们通常都就是对均值或方差进行估计。区间估计就是参数估计的一种,它就是指对于给定的置信度1-α,总体参数θ的取值在某一区间内的概率
就是1-α,而这一置信区间正就是我们需要求解的。
用公式表示就就是:P{θ1<θ<θ2}=1-α,其中θ1、θ2就是两个统计量。(θ1,θ2)就就是置信区间,显然因为就是来自于样本,而抽样带有随机性,所以它就
是一个随机区间。
置信区间代表的意义就就是:样本容量固定为n,假如对总体进行N=1000次抽样,就得到了1000个置信区间,这些区间有的包含θ的真实值,有的不包含。但假设当置信度1-α=95%时,这一千个区间就大约有1000*95%=950个包含了θ的真实值。
简述评价估计量的标准
1、无偏性:无偏性不就是要求估计量与总体参数不得有偏差,因为这就是不可能的,既然就是抽样,必然存在抽样误差,不可能与总体完全相同。无偏性指的就是如果对这同一个总体反复多次抽样,则要求各个样本所得出的估计量(统计量)的平均值等于总体参数。符合这种要求的估计量被称为无偏估计量。
2、有效性:估计量与总体之间必然存在着一定的误差,衡量这个误差大小的一个指标就就是方差,方差越小,估计量对总体的估计也就越准确,这个估计量也就越有效。
3、一致性:一致性指的就是当样本量逐渐增加时,样本的估计量(统计量)能够逐渐逼近总体参数。
解释置信水平的含义
置信水平就是指总体参数值落在样本统计值某一区内的概率;而置信区间就是指在某一置
信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。
什么就是P 值?利用P 值进行检验与利用统计量进行检验有什么不同
犯第I 类错误的真实概率就就是P 值。用统计术语来说,如果原假设Ho 就是正确的,所得到的样本结果会像实际观测结果那么极端或更极端的概率成为P 值,也称为观察到的显著性水平。
1、P 值决策优先于统计量决策。与传统的统计量相比,P 值决策提供了更多的信息。
2、根据统计量决策,如果拒绝原假设,也仅仅就是知道犯错误的可能性就是α那么大,但究竟就是多少却不知道。而P 值则就是算出的犯第I 类错误的实际概率。
在假设检验中,为什么采取 不拒绝原假设 而不采取 接受原假设
1. “接受”的说法有时会产生误导
2. 采用“不拒绝”的表述方法更合理一些,因为这种表述意味着样本提供的证据不够强
大,因而没有足够的理由拒绝,这不等于已经证明原假设正确
为什么说假设检验不能证明原假设正确
1. 假设检验的目的主要就是收集证据拒绝原假设,而支持您所倾向的备择假设
2. 假设检验只提供不利于原假设的证据。因此,当拒绝原假设时,表明样本提供的证据
证明它就是错误的,当没有拒绝原假设时,我们也没法证明它就是正确的,因为假设检验的程序没有提供它正确的证据
样本量的大小与显著性有怎样的关系
通常在做某种统计推断时,显著性水平要求越高,要达到该显著性水平的样本量越大。 样本量越大,检验统计量的值夜就越大,P 值就越小,就越有可能拒绝原假设。反之则相反。
解释原假设与备择假设
原假设:研究者想收集证据予以反对的假设。
备择假设:研究者想收集证据予以支持的假设。
什么就是标准化检验统计量?为什么要对统计量进行标准化?
标准化检验统计量就是根据样本观测结果计算出对原假设与备择假设作出决策的检验统计量,对样本估计量标准化的结果,它反映了点估计量与假设的总体参数相比相差多少个标准差的距离。
点估计量的抽样标准差假设值
—点估计量标准化检验统计量=
没标准化的统计量不能直接作为判断的依据,只有将其标准化后,才能用于度量它与原假设的参数值之间的差异程度。
怎样理解显著性水平
通常以α表示,就是一个临界概率值。它表示在“统计假设检验”中,用样本资料推断总体时,犯拒绝“假设”错误的可能性大小。α越小,犯拒绝“假设”的错误可能性越小。
6第I 类错误与第II 类错误分别就是指什么?它们发生的概率大小之间存在怎样的关系?