统计学知识点总结

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)计算相对数时分母不宜过小 样本量较小时以直接报告绝对数为宜。 (3)观察单位数不等的几个相对数,不能直接相加求其平均水平。 (4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。
3. 常用统计图有哪些?分别适用于什么分析目的?
常用统计图的适用资料及实施方法
图 形 适用资料
实施方法
条图 直方图
第 5 章 假设检验
1.试述假设检验中 α 与 P 的联系与区别。 区别:(1) 值是事先确定的一个小的概率值。为一次检验中,甘愿冒的风险。
(2)P 值是在 H0 成立的条件下,出现当前检验统计量以及更极端状况的概率。为一次
检验中,实际冒的风险。
联系:以 t 检验为例,P、a 都可以用 t 分布尾部面积大小表示。P≤ 时,拒绝 H0 假设。
①不同量纲的变量间比较;②量纲相同但 变异系数 标准差与均数的相对比
数量级相差悬殊的变量间比较
定性资料:阳性事件的概率,概率分布,强度和相对比。
2. 应用相对数时应注意哪些问题?
答:(1)防止概念混淆 相对数的计算是两部分观察结果的比值,根据这两部分观察结果的 特点,就可以判断所计算的相对数属于前述何种指标。
第 2 章 统计描述
1. 对定量资料进行统计描述时,如何选择适宜的指标?
定量资料统计描述常用的统计指标及其适用场合
描述内容 指 标 意 义
适用场合
平均水平 均 数 个体的平均值
对称分布
几何均数 平均倍数
取对数后对称分布
中 位 数 位次居中的观察值
①非对称分布;②半定量资料;③末端开 口资料;④分布不明
组间数量对比
用直条高度表示数量大小
定量资料的分布 用直条的面积表示各组段的频数或频率
百分条图 饼图 线图
构成比
用直条分段的长度表示全体中各部分的构成比
构成比
用圆饼的扇形面积表示全体中各部分的构成比
定量资料数值变动 线条位于横、纵坐标均为算术尺度的坐标系
半对数线图 定量资料发展速度 线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系
统计检验能够发现这种差异(拒绝零假设 H0 : 0 )的概率,一般情况下要求检验功效应
在 0.8 以上。
影响检验功效的四要素为总体参数的差异 、总体标准差 、检验水准 及样本量 n。
6.简述假设检验的基本思想。
假设检验是在 H0 成立的前提下,从样本数据中寻找证据来拒绝 H0 、接受 H1 的一种
散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系
箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置
茎 叶 图 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数
第 3 章 概率分布
1. 服从二项分布及 Poisson 分布的条件分别是什么? 二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;
4.方差分析的应用? ①多组定量资料比较,即两个或两个以上均数的比较 ②方差齐性检验 ③两个或多个研究因素的交互作用 ④回归方程的线性假设检验
⑴Ⅰ类错误:如果检验假设 H0 实际是正确的,由样本数据计算获得的检验统计量得出拒绝
H0 的结论,此时就犯了错误,统计学上将这种拒绝了正确的零假设 H0 (弃真)的错误称为 Ⅰ类错误。Ⅰ类错误的概率用 表示。
⑵Ⅱ类错误:若检验假设 H0 原本不正确( H1 正确),由样本数据计算获得的检验统计量得出
“反证”方法。如果从样本数据中得到的证据不足,则只能不拒绝 H0 ,暂且认为 H0 成立,即
样本与总体间的差异仅仅是由于抽样误差所引起。拒绝 H0 是根据某个界值,即根据小概率
事件确定的。所谓小概率事件是指如果比检验统计量更极端(即绝对值更大)的概率较小,比 如小于等于 0.05,则认为零假设的事件在某一次抽样研究中不会发生,此时有充分理由拒绝
③各次试验独立。
Poisson 分布成立的条件:除二项分布成立的三个条件外,还要求试验次数 n 很大,而所 关心的事件发生的概率 很小。
2. 二项分布、Poisson 分布分别有什么特征? ①二项分布、Poisson 分布都是离散型分布。 ②二项分布的形状取决于 π 与 n 的大小。π=0.5 时,不论 n 大小,对称分布。π≠0.5 时,图形 呈偏态,随 n 增大而逐渐对称。当 n 足够大,π 或 1-π 不太小,二项分布近似正态。 ③Poisson 分布 μ 越小,分布越偏。μ 越大,分布越对称。当 n 足够大时,分布接近正态。
不拒绝 H0 (纳伪)的结论,此时就犯了Ⅱ类错误。Ⅱ类错误的概率用 表示。
在假设检验时,应兼顾犯Ⅰ类错误的概率( )和犯Ⅱ类错误的概率( )。犯Ⅰ类错误
的概率( )和犯Ⅱ类错误的概率( )成反比。如果把Ⅰ类错误的概率定得很小,势必增加
犯Ⅱ类错误的概率,从而降低检验效能;反之,如果把Ⅱ类错误的概率定得很小,势必增加犯
1.分布未知或偏态分布资料 2.总体
方差不齐 3.等级资料 4.开口资料
检验方法
1.t 检验 2.u 检验 3.方差分析
1.符号秩和检验(配对资料) 2.秩和检验 3.K-W检验(多组资料)
优点:充分利用原始数据信息,检验效 能高 缺点:受资料总体分布限定
优点:不受资料总体分布限定 缺点:只利用秩次,损失原始数据,检 验效能低。
(2)精密度是置信区间宽度的一半,意指置信区间的两端点值离样本统计量(如 X 、p)的
距离。从精密度的角度看,置信区间宽度愈窄愈好。 (3)在抽样误差确定的情况下,两者是相互矛盾的。为了同时兼顾置信区间的准确度与精密 度,可适当增加样本含量。 3、参考值范围估计的基本步骤 ① 从正常人的总体中进行随机抽样 ② 对选定的正常人进行准确的测定 ③ 确定取单侧还是双侧范围 ④ 确定范围 常用 95%。 ⑤ 根据资料的分布类型选用恰当的界值估计方法
联系 1.标准误大小与标准差成正比;2.n 一定时,标准差越大,标准误也越大。
3. 简述置信区间与医学参考值范围的区别。
区别 含义
用途 计算公式
置信区间 总体参数的波动范围,即按事先给
定的概率 100(1)%所确定的包 含未知总体参数的一个波动范围
估计未知总体均数所在范围
参考值范围 个体值的波动范围,即按事先给
标准误的用途: ① 衡量样本均数的可靠性 ① 与样本均数结合,估计总体均数的置信区间 ① 可用于进行均数的假设检验
标准误与标准差的区别与联系
标准差
标准误
区别 含义 描述个体观察值的离散程度 反应总体参数被估计的精确程度
范畴 统计描述
统计推断
用途 估计参考值范围
估计置信区间
n n 越大,标准差越稳定
n 越大,标准误越小
4.配对定量资料的比较 (1)配对资料的 t 检验(差值服从正态) (2)符号秩和检验(不正){p 值确定类似于 t 检验}
5.两 poisson 分布资料的比较 Z 检验
第 7 章 多组定量资料的比较
1. 方差分析的基本思想和应用条件是什么? 基本思想 将处理间平均变异与误差平均变异比较。根据试验设计的类型和研究目的,将全部观测值总 的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可 由某个因素的作用加以解释,通过比较不同变异来源的均方,借助 F 分布做出统计推断,从 而推论各种研究因素对试验结果有无影响。 应用条件 ① 各样本是相互独立的随机样本,均服从正态分布; ② 各样本的总体方差相等,即方差齐性。 2.方差分析的步骤 ① 建立假设检验和检验水准(H0:总体均数都相等) ② 计算统计量 F ③ 确定 P 值和作出推断结论 ④ 作两两均数之间的比较(若 P>0.05,可省略此步) 3. 多组定量资料比较时,统计处理的基本流程是什么? 多组定量资料比较时首先应考虑用方差分析。 (1)若方差齐性,且各样本均服从正态分布,选单因素方差分析。 (2)若方差不齐,或某样本不服从正态分布,选 Kruskal-Wallis 秩和检验,或通过某种形式的 数据变换使其满足方差分析的条件。 若方差分析或秩和检验结果有统计学意义,则需选择合适的方法(如 Bonferonni、LSD 法等) 进行两两比较。
定的范围 100(1)%所确定 的“正常人”的解剖、生理、生 化指标的波动范围 供判断观察个体某项指标是否 “正常”时参考(辅助诊断)
未知:
X
t / 2,
S X
正态分布: X Z /2S
已知或未知但 n≥30,有
偏峰分布:PX~P100X
X Z / 2 X 或 X Z / 2S X
4 何谓置信区间准确度与精确度?如何协调两者间的关系。 置信区间有准确度与精密度两个要素。 (1)准确度由置信度 (1-α) 的大小确定,即由置信区间包含总体参数的可能性大小来反映。 从准确度的角度看,置信度愈接近于 1 愈好,
Βιβλιοθήκη Baidu
第6章 两样本定量资料的比较
1. 对于完全随机设计两样本定量资料的比较,如何选择统计方法? 答:完全随机设计两样本定量资料比较统计方法的选择最关键的是看是否满足正态性
(样本量较大时不必进行正态性检验)和方差齐性。如果资料来自正态总体且总体方差齐,采 用 t 检验;如果满足正态性但总体方差不齐,采用 t′检验;当两者都不满足时,才考虑选用秩 和检验。当然,我们也可采用变量变换的方法使其满足 t 或 t′检验的条件。
众 数 频数最多的观察值
不拘分布形式,概略分析
调和均数 基于倒数变换的平均值 正偏峰分布资料
变 异 度 全 距 观察值取值范围
不拘分布形式,概略分析
标准差 (方 差) 四分位数 间距
观察值平均离开均数的 程度
居中半数观察值的全距
对称分布,特别是正态分布资料
①非对称分布;②半定量资料;③末端开 口资料;④分布不明
2.t 检验有几种,适用条件是什么? t 检验是以 t 分布为理论基础。小样本时,要求资料符合正态分布和方差齐性。一般有以 下三种: ① 样本均数与总体均数的比较 ① 配对资料的比较 ① 两个样本均数的比较 此外,还有相关系数,回归系数的 t 检验。
3.两组定量独立样本的比较 (1)两独立样本的 t 检验(满足正态性和方差齐性) (2)校正的 t 检验(正态但方差不齐) (3)u 检验(大样本,且方差齐) (4)秩和检验(小样本,不正不齐){p 值确定分为 T 值在范围内还是范围外}
Ⅰ类错误的概率,从而降低了置信度。为了同时减小 和 ,只有通过增加样本含量,减少
抽样误差大小来实现。
5.试述检验功效的概念和主要影响因素。
答:拒绝不正确的 H0 的概率,在统计学中称为检验功效(power of test),记为1 。检
验功效的意义是:当两个总体参数间存在差异时(如备择假设 H1 : 0 成立时),所使用的
H0 ,即有足够证据推断差异具有统计学意义。
7. 建设检验四步骤:
① 建立检验假设 H0 和备择假设 H1(判断是单侧检验还是双侧检验再作假设) ① 确定检验水准
① 选定检验方法和计算检验统计量
① 确定 P 值和作出推断结论
8.参数及非参数检验优缺点
参数检验
非参数检验
适用条件 资料正态分布,方差齐性
1. 标准误与标准差的区别
(1)标准差反映个体值散布的程度;标准误反映精确知道总体参数的程度。
(2)标准误小于标准差。
(3)样本含量越大,标准误越小,其样本均数更有可能接近于总体均数,随着样本含量的增大, 标准差有可能增大,也有可能减小。
(4)用途不同。
标准差的用途: ① 反映一组资料的离散程度 ① 计算变异系数 ① 结合均数与正态分布的规律,估计参考值范围
2. 试述假设检验与置信区间的联系与区别。 联系:区间估计与假设检验是由样本数据对总体参数做出统计学推断的两种主要方法。 区别:置信区间用于说明量的大小,即推断总体参数的置信范围;
假设检验用于推断质的不同,即判断两总体参数是否不等。 3. 怎样正确运用单侧检验和双侧检验?
需要根据数据的特征及专业知识进行确定。若比较甲、乙两种方法有无差异,则应选用 双侧检验。若需要区分何者为优,,则应选用单侧检验。在没有特殊专业知识说明的情况下, 一般采用双侧检验即可。 4. 试述两类错误的意义及其关系。
4、 正态分布应用 ① 估计变量值的频数分布 ② 制定参考值范围 ③ 质量控制 ④ 正态分布是很多统计方法的基础
5. 正态分布特征 ① 以均数为中心,左右对称 ② 正态曲线在横轴上方均数处取得最高点 ③ 正态分布有两个参数,即均数(位置参数)和标准差(变异度参数) ④ 正态曲线下面积有一定规律
第 4 章 参数估计
相关文档
最新文档