南医大统计期末考试
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
考点记忆
1、定量资料、定性资料、等级资料分析(t检验、秩和检验、χ2检验);
2、相关与回归的分析,r 与b 的联系、区别、公式计算及表达意义;
3、stata软件分析结果的理解(特别重要,英文要看得懂,分值也大!)
题型:选择、名解、计算题(包括stata结果分析)、问答题。
计算题涉及stata结果分析t检验(假设检验过程,t检验的应用条件和不成立时如何分析数据)
秩和检验(编秩,实际秩和与理论秩和计算)
χ2检验
回归分析直线方程和b值及意义。
名解
1、检验统计量:用于假设检验计算的统计量。
2、检验效能:通常把1-β称为检验效能(也称把握度),它的意义是:当两总体确有差别时,按规定的检验水准.α能够发现该差别的能力.
3、假设检验中P值:就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。
也可以在假设为真时的前提下,检验统计量大于或等于实际观测值的概率。
4、抽样误差:抽样方法本身所引起的误差。
5、剩余标准差:扣除X的影响后,Y方面的变异;或在引入回归方程后,Y方面的变异。
问答题
1、直线回归与相关的区别和联系
1.区别:
①资料要求不同:直线回归分析中,若为可精确测量和严格控制的变量,则对应于每个的值要求服从正态分布;若、都是随机变量,则要求、服从双变量正态分布。
直线相关分析要求服从双变量正态分布;
②应用目的不同:说明两变量间相关关系用相关,此时两变量的关系是平等的;说明两变量间的数量变化关系用回归,用以说明如何依赖于的变化而变化;
③指标意义不同:说明具有直线关系的两变量间相互关系的方向与密切程度;表示变化一个单位时的平均变化量;
④计算不同:,;
⑤取值范围不同:−1≤≤1,;
⑥单位不同:没有单位,有单位。
2.联系:
①二者理论基础一致,皆依据于最小二乘法原理获得参数估计值;
②对同一双变量资料,回归系数与相关系数的正负号一致。
>0与>0,均表示两变量、呈同向变化;同理,<0与<0,表示变化的趋势相反;
③回归系数与相关系数的假设检验等价。
即对同一双变量资料,。
由于相关系数较回归系数的假设检验简单,在实际应用中,常以相关系数的假设检验代替回归系数的假设检验;
④用回归解释相关。
由于决定系数,当总平方和固定时,回归平方和的大小决定了相关的密切程度,回归平方和越接近总平方和,则越接近1,说明引入相关的效果越好。
例如,当=0.20,n=100时,按检验水准0.05拒绝,接受,认为两变量有相关关系。
但=0.202=0.04,表示回归平方和在总平方和中仅占4%,说明两变量间的相关关系实际意义不大。
2、以成组设计的两样本均数为例,说明样本容量的确定的影响因素
(1) 研究对象的变化程度;
(2) 所要求或允许的误差大小(即精度要求);
(3) 要求推断的置信程度。
也就是说,当所研究的现象越复杂,差异越大时,样本量要求越大;当要求的精度越高,可推断性要求越高时,样本量越大。
(4) 抽样方法;
(5) 问卷的回收率或访问的成功率高低。
3、以样本均数和总体均数为例,试说明区间估计与假设检验的联系与区别
抽样估计与假设检验都是统计推断的重要内容。
参数估计是根据样本统计量估计总体参数的真值;假设检验是根据样本统计量来检验对总体参数的先验假设是否成立。
㈠、区间估计与假设检验的主要区别
1.区间估计通常求得的是以样本估计值为中心的双侧置信区间,而假设检验以假设总体参数值为基准,不仅有双侧检验也有单侧检验;
2.区间估计立足于大概率,通常以较大的把握程度(置信水平)1-α去保证总体参数的置信区间。
而假设检验立足于小概率,通常是给定很小的显著性水平α去检验对总体参数的先验假设是否成立。
㈡、区间估计与假设检验的联系
1.区间估计与假设检验都是根据样本信息对总体参数进行推断,都是以抽样分布为理论依据,都是建立在概率基础上的推断,推断结果都有一定的可信程度或风险。
2.对同一问题的参数进行推断,二者使用同一样本、同一统计量、同一分布,因而二者可以相互转换。
区间估计问题可以转换成假设问题,假设问题也可以转换成区间估计问题。
区间估计中的置信区间对应于假设检验中的接受区域,置信区间以外的区域就是假设检验中的拒绝域。