统计学复习重点(有修正)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学复习重点
一、填空,选择
1、根据(样本信息)来推断(总体特征)的方法即抽样研究。
2、为保证样本的代表性,抽样时必须遵循(随机化)原则。
3、资料可分为(定量资料)和(定性资料)两种类型,也可分为(计量资料)、
(计数资料)和(等级资料)三种类型
4、按误差产生的原因和性质可粗分为(随机误差)和(非随机误差)。
5、抽样误差产生的本质原因是(个体变异)
6、非随机误差可分为(系统误差)和(非系统误差)
7、医学统计工作的基本步骤:(设计)(收集资料)(整理资料)(分析资料)
8、统计分析包括(统计描述)和(统计推断)
9、连续型变量频数表编制步骤:(求极差)(确定组段数和组距)(根据组距写
出组段)(分组划计并统计频数)
10、统计描述是用(统计指标)、(统计表)、(统计图)描述资料的数据特征
及分布规律。
11、频数分布表也叫(直方图)。
12、频数分布的类型可分为(对称分布)和(偏态分布)
13、频数分布的重要特征是(离散趋势)和(集中趋势)
14、统计推断包括(参数估计)和(假设检验)
15、计量资料集中趋势的描述指标为(平均数)
计量资料集中趋势的描述指标为(算数均数)(几何均数)(中位数)
16、对数正态分布图形属于(右偏态/正偏态)分布
17、描述血清抗体滴度平均效价的集中趋势,应选择(几何均数)指标。
18、描述端点无确切值资料的集中趋势,应选择(中位数)指标
19、描述计量资料离散趋势的统计学指标为(级差)(四分位数间距)(方差)
(标准差)(变异系数)
20、(均数)和(标准差)结合在一起,是对一个正态分布资料的完整统计
学描述
21、(中位数)和(四分位数间距)结合在一起,是对一个偏态分布资料的
完整统计学描述
22、当比较两个观察指标的离散趋势,而观察指标单位不同或均数相差悬殊
时,如儿童和成人身高,体重和身高,应采用(变异系数)指标
23、变异系数越大,表示数据的变异度越(大),数据越(分散)
24、Φ(u)的含义是(标准正态曲线下,从-∞到u的面积)
25、均数抽样误差是由(均数标准误)来衡量。
26、标准差体现的是(个体值/原始观察值)的离散度,标准误体现的是(样
本均数)的离散度
27、参数估计有(点估计)和(区间估计)两种方法
28、可信区间的两个要素(准确度)(精密度)
29、从专业上,一种方法的结果不可能高于/低于另一种方法时,用(单侧检
验)
30、若两组样本量小,且方差不齐时,可采用(数据变换)(t’检验)(秩转
换的非参数检验)
31、假设检验采用(小概率反证法)的思想
32、统计学的结论都有(概率性),故不能使用“一定”、“必定”等词
33、n确定时,α↑,则β(↓),α↓,则β(↑),使αβ均↓的
方法是(n↑)
34、变量变换的方法有(对数变换)(平方根变换)(平方根返弦变换)(倒数
变换)
35、完全随机设计方差分析中,(处理因素)和(随机因素)共同造成了组间
差异。(随机因素)造成了组内变异
36、随机区组设计中,SS区组与SS误差之和等于完全随机设计中的(SS组内)
37、定性资料统计描述用(相对数),常用的指标有(率)(构成比)(相对比)
38、由于随机变量有(连续型)和(离散型),所以概率分布可分为(连续型
分布)和(离散型分布)
39、X2、u分布、t分布、F分布属于(连续型分布)
二项分布、Possion分布、负二项分布属于(离散型分布)
40、回归分析应用的是(最小二乘法)原理。
41、二项分布的两个参数是(n)(π)
42、常用的方差分析两两比较的方法有(LSD-t检验)(Dunnet-t检验)(SNK-q)
43、X2的取值范围(0< X2<+∞)
44、标准化回归系数越大说明(相应变量对y的作用越大)
二、判断:
1、抽样误差属于随机误差。(√)
2、随机误差不可避免。(√)
3、随机误差符合均数为0的正态分布。(√)
4、频率等于概率。(X)
5、随机就是随意或随便。(X)
6、正态分布属于对称分布的一种。(√)
7、计算算数平均数时,频数表法比直接计算更准确(X )
8、几何均数是主要描述正态分布资料集中趋势的指标(X )
9、正常人就是健康人(X)
10、最大值是100,最小值是1,极差是1-100(X)
11、95%的可信区间就是包含95%的总体参数(X)
12、95%的可信区间表示总体参数落在该范围的可能性有95%(X)
13、当假设检验的结论为统计学有差异时,可以理解为差异大(X)
14、随机区组设计中,每个区组受试对象数目等于处理组数。(√)
15、随机区组设计中,处理组中受试对象的数目等于区组数。(√)
16、P值越小,发生I类错误的可能性越小。(X)
三、简答
1、频数表和频数分布图的用途
答:①描述频数分布的类型②描述频数分布的特征③便于发现一些特大或特小的离群值④便于进一步做统计分析和处理。
2、正态分布的特征
答:①在直角坐标轴的横轴上方呈钟形曲线,两端与X轴无限接近但永不相交,
以x=μ为对中心左右对称
②在x=μ处,f(x)取值最大
③正态分布有两个参数,位置参数μ,和形态参数σ
若固定σ,μ变大,曲线沿x轴向右平移;μ变小,曲线沿x轴向左平移
若固定μ,σ越大,曲线越平坦,表示数据越分散;σ越小,曲线越陡峭,表示数据越集中
④正态曲线下的面积分布有一定规律
a.X轴与正态曲线所夹面积恒等于1或100%
b.区间μ±σ面积为68.17%,区间μ±1.96σ面积为95.00%,区间μ±2.58σ面积为99.00%
3、正态分布的应用
答:①估计频数分布②是许多统计方法的基础③制定医学参考值范围质量控制4、t分布特征
答:①单峰分布,以0为中心左右对称②t分布曲线的形态取决于自由度γ的大小,γ大则峰高尾低,γ小则峰低尾高③当γ→∞时,t分布逼近正态分布。
5、假设检验的基本步骤
答:①建立假设,确定检验水平②计算检验统计量③确定P值,做出推断结论。
6、配对设计的三种形式
答:①两个同质受试对象分别接受两种不同的处理。②同一受试对象分别接受两种不同的处理③同一受试对象处理前后
7、简述相对数应用的注意事项
答:①构成比不能代替率。②计算相对数应该有足够的量③正确计算合计率④注意资料的可比性⑤对比不同时期资料,应注意客观条件是否相同⑥样本构成比有抽样误差,需要进行其差异的假设检验
8、二项分布的适用条件
9、相对数应用的注意事项
10、统计表制表原则(注意数字的要求)
11、多元线性回归应满足的条件:独立、正态、线性、方差齐
12、多元线性回归自变量选择方法
四、计算:t检验、卡方检验、秩和检验、线性回归与相关
1、t检验
(1)某医生随机抽取某院12名难产儿,测得其出生体重如表1所示,假定资料服从正态分布,请回答下述问题:
答:用均数和标准差进行描述。
==3.6425 =0.4369
②试估计该院难产儿出生体重的抽样误差。
=0.1261