统计学重点知识点

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基本统计方法

第一章概论

1. 总体(Population ):根据研究目的确定的同质对象的全体(集合);样本(Sample):从总体中随机抽取的部分具有代表性的研究对象。

2. 参数(Parameter):反映总体特征的统计指标,如总体均数、标

准差等,用希腊字母表示,是固定的常数;统计量(Statistic):反映

样本特征的统计指标,如样本均数、标准差等,采用拉丁字字母表示,是在参数附近波动的随机变量。

3. 统计资料分类:定量(计量)资料、定性(计数)资料、等级资料。

第二章计量资料统计描述

1. 集中趋势:均数(算术、几何)、中位数、众数

2. 离散趋势:极差、四分位间距(QR=P75-P25 )、标准差(或方差)、变异系数(CV)

3. 正态分布特征:①X轴上方关于X=对称的钟形曲线;②X=时, f(X)取得最大值;③有两个参数,位置参数和形态参数:④曲线下面积为1,区间士的面积为68.27%,区间士1.96的面积为95.00%, 区间士2.58的面积为

99.00%。

4. 医学参考值范围的制定方法:正态近似法:X u /2S ;百分位数法:

P2.5-P97.5。

第三章总体均数估计和假设检验

1. 抽样误差(Sampling Error ):由个体变异产生、随机抽样造成的样本统计量与总体参数的差异。抽样误差不可避免,产生的根本原因是生物个体的变异性。

2. 均数的标准误(Standard error of Mean, SEM):样本均数的标准

差,计算公式:X/用。反映样本均数间的离散程度,说明抽样

误差的大小。

3. 降低抽样误差的途径有:①通过增加样本含量n;②通过设计减少

S。

4. t分布特征:

①单峰分布,以0为中心,左右对称;

②形态取决于自由度,越小,t值越分散,t分布的峰部越矮而尾部翘得越

高;

③当逼近X,S X逼近X, t分布逼近U分布,故标准正态分布是t 分布的特例。

5. 置信区间(Con fide nee In terval , Cl):按预先给定的概率(1-) 确定的包含总体参数的一个范围,计算公式:X t /2, S X或X u /2, S X。

95%CI含义:从固定样本含量的已知总体中进行重复抽样试验,根据每个样本可得到一个置信区间,则平均有95%的置信区间包含了总体参数。

6. 假设检验的基本原理:小概率反证法的思想。

①反证法:从问题的对立面(H o)出发间接判断要解决的问题(H i) 是否成立。

②小概率事件:在H0 成立的条件下计算检验统计量,根据

概率分布确定检验水准下P值大小,判断是否为小概率事件(通常P W 视为小概率事件,通常取),是则拒绝H o,接受H l;否则尚不

能拒绝H0。

7•假设检验一般步骤:①建立假设(反证法,H o和H i),确定检验

水准();②计算统计量:u, t,F;③确定概率值P,做出推断结论。

8. t 检验需满足的条件:比较的两个样本相互独立、均服从正态分布。

9. P 的含义:是指从H o 规定的总体随机抽样,抽得等于及大于(或/ 和等于及小于)现有样本获得的检验统计量(如t、u 等)值的概率。

10. I型错误(Type I error):拒绝了实际上成立的H o,这类“弃真”的错误称为I型错误,1型错误的大小为检验水准。H型错误

(Type II error):接受了实际上不成立的H o,这类“存伪”的错误称为H型错误,I型错误的大小用表示,1-表示检验效能。越小,越大,增大样本量可以同时降低和。

11. 置信区间和假设检验的区别和联系:①可以通过判断置信区间是

否包含零假设,判断单样本均数是否来自已知的总体; ②置信区间不但能回答差别有无统计学意义,还可提示差别有无实际意义。③假设检验可提供置信区间不能提供的信息,如P值和检验效能等。

第四章方差分析

1. 方差分析的基本思想:根据研究目的和设计类型,把所有测量值的总变异按照处理因素和水平等分解成两部分(组内变异和组间变异)

或更多部分,同时把对自由度相应进行分解,再进行比较,评价由处

理因素引起的变异是否具有统计学意义。

2. 方差分析的应用条件:各样本是相互独立的随机样本,均来自正

态分布的总体,各样本的总体方差相等(具有方差齐性)。

3. 方差分析表:

4. g=2时,随机区组设计的方差分析与配对设计资料t检验等价,

t JF。

5. 多个样本均数间的多重比较:①LSD-t检验,即最小显著差异t检

验,适用于一对或几对在专业上有特殊意义的样本均数间的比较;②Dunnett-t检验:适用于g-1个实验组与一个对照组均数差别的多重比较;

③SNK-q检验:适用于多个样本均数两两之间的全面比较。

第五章计数资料的统计描述

1. 相对数的类型:强度相对数(率,如死亡率、发病率等);结构相对数(构成比);相对比(如性别比等)

2. 应用相对数的注意事项:①结构相对数不能代替强度相对数;②

计算相对数应有足够的数量;③正确计算合计率;④注意资料的可比性;⑤对比不同时期资料应注意客观条件是否相同;⑥样本率(或构

成比)的抽样误差

3. 标准化率(Standardization rate ):采用标准化法进行计算,消除数据内部

构成的差异,使标化后的合计率具有可比性,这种经过标化后的合计率称为标准化率。

4. 标准化率的注意事项:①只适用于内部构成不同,影响总率的可比性的问题;②选择的标准不同,计算得到的标准化率也不同,多个标准化率比较时,应选同一标准;③标准化率已经不再反映当地的实际水平;④样本标准化率是样本值,存在抽样误差。比较两样本标准化率,当样本量较小时,需做假设检验。

第六章几种离散型变量的分布及应用

1. 二项分布X〜B(n,)的适用条件:①每次试验只发生两种对立的可能结果之一;②每次试验产生某结果的概率固定不变;③重复试验是相互独立的。

2. 二项分布的性质:①阳性次数X的总体均数( n )、标准差

( Q(1一));②样本率p的均数(p )、标准差(s p.._P(1—p),

即率的标准误、。③二项分布的正态近似条件:np和n(1-p)均大于5。

3. 泊松分布X〜P()的性质:①总体均数和总体方差2相等;②当

n很大,很小,且np二为常数时,二项分布近似泊松分布;③>

20时,泊松分布近似正态分布;④泊松分布具备可加性。

第七章2检验

1. 2检验的基本思想:根据2分布特征,通过比较实际频数与理论频数的差异,确定在成立的条件下该差异由抽样误差造成是否为小概率事件,进而判断差异是否具有统计学意义。2值反映了实际频数与理论频数的吻合程度。

2. R XC列联表中的各格子T A1,并且1

理论频数增大;②根据专业知识,删除或合并行列;③采用Fisher 确切概率法分

相关文档
最新文档