医学统计学重点(精.选)

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

1.变异：同质事物之间的差异。

2.频数散布的两个特点：集中地点，失散趋向
3.数据散布的种类：对称散布和非对称散布。

非对称散布又称偏态散布，包含正偏态和负偏
态。

单峰散布，双峰散布，多峰散布。

4.统计描绘：用统计表、统计图和统计指标等方法对资料的数目特点与散布规律进行描绘。

5.集中地点的描绘，集中地点指标又称均匀数指标。

有哪些及合用条件？
（1）算数均匀数：最合用于单峰对称散布资料的均匀水平的描绘，特别是正态散布资料
（2）几何均匀数：合用于①等比资料②对数正态散布资料
（3）中位数和百分位数：合用于①偏态散布的资料②张口资料③资料散布不明等
6.失散趋向的描绘
（1）全距亦称极差，合用于单峰小样本资料
（2）四分位数间距，合用于单峰小样本资料
（3）方差和标准差，合用于对称散布特别是正态散布资料
（4）变异系数，常用于① 比较胸怀衡单位不一样的两组或多种资料的变异度② 比较均数相差悬殊的两组或多组资料的变异度
7.常用相对数（ 1）率，是二分类指标（2）组成比（ 3）比
8.正确应用相对数应注意几个问题：
（1）计算相对数的分母不宜过小
（2）剖析时不可以以组成比取代率
（3）对察看单位数不等的几个率，不可以直接相加求其总率
（4）计算率时要注意资料的同质性，对照剖析时应注意资料的可比性
（5）也有抽样偏差，需要假定查验。

9.率的标准法
（1）基本思想：采纳一致的标准，以除去病情组成不一样对治愈率比较的影响，使算得的
标准化治愈率有可比性。

（2）目的：控制混淆因素对研究结果的影响。

10.正态散布
（1）观点 P16
（2）标准正态散布，u 变换： u= X
,u 是标准正态离差，μ是均数，σ是标准差。

u～ N（ 0， 1）
（3）正态散布的特点：
①是单峰散布，顶峰地点在均数X=μ处。

② 以均数为中心，左右完整对称。

③ 取决于两个参数，均数μ和标准差σ。

μ为地点参数，μ越大，则曲线沿横轴向右挪动；μ越小，则曲线沿横轴向左挪动。

σ为形态参数，表示数据的失散程度，若σ小，则曲线形态“瘦高”；σ大，则曲线形态“矮胖” 。

④ 有些指标不听从正态散布，但经过适合的变换后听从正态散布，如对数正态散布。

⑤正态散布曲线下的面积是有规律的：总面积恒定为 1，对称地区面积相等，对应地区面积相等。

（4）几个 u 界值：① 90％：两侧u=单侧u=1.64
0.10.05
② 95％：两侧u0 .05 =单侧u0.025 =1.96
③ 99％：两侧u0 .01 =单侧u0.005 =2.58
11.二项散布
（1）样本率的标准差p 的预计值s p计算公式：s p=
p(1 p)
， p 是样本率
n
（2）样本个数 n 和概率π怎样影响二项散布的图形？
给定 n 后，形状取决于π。

当π =0.5 时，散布对称；当π <0.5 时散布呈正偏态；当
π >0.5
时散布呈负偏态。

随n 的增大，散布渐渐迫近正态散布。

假如nπ或 n(1- π ) 大于 5 时，则可用正态近似原理办理二项散布的有关问题。

（3）应用条件：对峙性，重复性，独立性。

12.Poisson散布
(1)观点，描绘稀有事件发生次数的概率散布，是特别的二项散布。

(2)均数与方差相等，均为λ。

(3)形状取决于λ的大小，为正偏态散布，λ越小散布越偏；跟着λ的增大，散布渐渐趋于
对称，当λ =20 时，已基本靠近对称散布；当λ≥50时，可按正态散布原理办理Poisson分布的有关问题。

(4)Poisson散布拥有可加性。

(5)应用条件：对峙性，重复性，独立性。

即事件的发生是互相独立的，且发生的概率不变，
结果是二分类的（发生或不发生）
13.参照值范围
（1 ）观点：绝大部分正常人某指标的颠簸范围。

（2 ）正态散布法计算100 （ 1—α）％正常值范围：两侧X u S
单侧X —u S（高侧）
X +u S（低侧）
注意α取值：两侧95％X 1.96 S
单侧 95％高侧 < X— 1.64S
低侧 > X +1.64S
（3 ）百分位数法：知道求得第几个百分位数P26
14.抽样偏差
（1）观点：因为个体变异的存在，由抽样惹起的样本统计量与整体参数间的差异。

（2）产生的两个必备条件：①抽样研究②个体变异，是根来源因
（3）中心极限制理的涵义
① 从均数为μ、标准差为σ的正态整体中独立、重复、随机抽取含量为n 的样本，样本均
数的散布仍为正态散布，其均数为μ，标准差为
2 x。

X～N(μ , x ) → X～ N(μ , x )
② 即便从非正态整体（均数为μ、标准差为σ）中独立、重复、随机抽取含量
为n 的样本，
只需样本含量足够大（如n≥50 ），样本均数也近似听从均数为μ，标准差
为x 的正态散布。

（4 ）标准误意义： 1.用来权衡抽样偏差的大小
2. x =标准误与个体变异σ成正比，与样本含量n 的平方根成反比
n
（5 ）标准误的预计值的计算公式：样本标准差s 取代整体标准差σ，s x = s
n
（6 ）标准差与标准误的关系
差异
标准差 s 标准误
s
x
意义个体变异
统计量的抽样偏差
用途
正常值范围 ( x 1.96s)
整体均数的可信区间 ( x 1.96
s x
)
与 n 关系
n ,s 趋于稳固
n ,
s x
趋于
联系： ① 二者都是变异指标，说明个体之间的变异用标准差，说明统计量之间的变异用标准误；
② 当样本量不足时，标准差大，标准误也大，均数的标准差与标准误成正比。

s x
=
s n
15. 医学统计学：运用概率论和数理统计等数学的原理和方法，研究医学领域中资料的收集、整
理、剖析和推测的一门学科。

16. 三类资料： ① 定量资料（数值资料） ② 定性资料（无序分类资料） ③ 等级资料（有序分类
资料）
17. 整体：按研究目的所确立的研究对象中，全部察看单位某项指标取值的会合。

18. 样本：从研究整体中，随机抽取拥有代表性的部分察看单位某项指标取值的会合。

19. 同质性：拥有相同性质的事物。

20. 参数：描绘某整体特点的指标。

21. 统计量：描绘某样本特点的指标。

22. 概率：随机事件发生可能性大小的一个胸怀，取值范围为0≤P ≤1 23. 小概率事件：发生概率 ≤0.05 的事件。

24. 小概率原理：小概率事件发生的可能性很小，从而以为其在一次抽样中不行能发生。

25. 理解和解说可信区间
26. 统计推测：依据样本所供给的信息，以必定的概率推测整体的性质。

包含双方面的内容：
参数预计和查验假定。

27. 可信区间的两个因素：靠谱性，精准性
28. 均数的可信区间：从正态散布整体
N( μ，
2
)中随机抽取一个样本，则 t=
X -
听从自
s x
---
由度 ν=n-1 的 t 散布。

整体均数的（ 1- α）可信区间定义为（ X — t
，
s x
，X
+
t ，
s x
）。

t 散布，相应的 100（ 1- α）％可信区间为（ X —
x
，
X + u
s ）。

x
29. 率的可信区间：
（1 ）率的标准差又称率的标准误，为
s
p
=
p(1 p)
n
（2）整体率π的区间预计用正态近似法的条件：样本含量 n 足够大，且样本率 p 和（ 1-p ）
都不太小时，如 np 和 n （ 1-p ）均大于 5 时，π的可信区间为（p —
u s
p
，p+
u s
p
）。

30. 事件数的可信区间：当 X ≤50 也能够查附表 7“ Poisson 散布λ的可信区间” ，获得λ的 95％或 99％可信区间。

31. 假定查验
（ 1 ）基本思想：
（ 2 ） 4 个基本步骤：
① 成立查验假定： H 0 ：
1
=
2
= 3 =
H 1 ： 1 、 2 、
3 之间不等或不全相等。

② 确立查验水平（拒绝
H 0 时的最大同意偏差
α）
③ 计算查验统计量并求
P 值
④ 界定 P 值并作结论（要回下结论）
： P ≤α，拒绝 H 0 ，接受 H 1 ；
P >α，不拒绝 H 0 。

（3 ）Ⅰ型错误： H 0 真切时被拒绝。

P>0.05 却拒绝 H0 接受 H1 （4 ）Ⅱ型错误： H 0 不真切时不拒绝。

H1 真切即 P<0.05 却不拒绝 H0
（5 ）查验功能：Ⅱ型错误率
β表示失掉对真切的 H 1 作出必定结论之概率，故 1- β就是
对
真切的 H 1 作出必定结论之概率，常被用来表达某假定查验方法的查验功能，即假定查验对真切的 H 1 作出必定结论之掌握程度。

（ 6 ）Ⅰ型错误与Ⅱ型错误的关系P51
（ 7 ）单侧查验与两侧查验的关系
（ 8 ）假定查验与可信区间的关系
32. 怎么做题？
判断资料种类→设计方法→计算自由度→确立 P 值→下结论
33. 划分派对和成组
配对：同质性差，要算差值① 自己配对② 一般有编号
成组：① 无原始数据（还有均数）② 两组样本含量不等，不可以配对③ 无编号
34.t 查验
（1）应用条件：独立性，正态性，方差齐性
（2）两样本均数比较方差不齐时t’查验
（3）两样本几何均数比较：取对数，t 查验，不用反对数
35.方差剖析，多个均数比较
（1）总变异 SS总：= SS组间+ SS组内办理因素、个体差异、随机因素，共同致使的差异。

（2）组间变异 SS组间：多个组的办理因素不一样和随机偏差，致使的差异。

（3）组内变异 SS组内：组内个体差异和其余随机因素，致使的差异。

（4）三种变异的关系：SS
=SS组间+SS组内，总=组间+组内
总
F MS
组间/MS组内
（5）单因素方差剖析表和两因素方差剖析表
36.多个样本均数的两两比较，对照的组数k 大于 2 ，分别 t 查验则需经过 m=k （ k-1 ） /2 次
比较，若每次比较的第一类错误率为α，则多次比较后，起码犯一次序一类错误的概率为
m
1 （1-），比早先设计的α要大。

37.变量变换目的
38.F 值、 t 值、 q 值、 q’值之间的关系
（1）两样本均数比较时， F =t。

用q查验或q'查验也获得相同的结论。

说明在两样本均数比较时， t 查验、 F 查验、 q 查验和 q' 查验是等价的。

（2）当组数k>2 时， q' 查验的查验功能高于q 查验，所以当实验研究设计为一个比较组与
多个实验组均数比较时，q' 查验科获得较高的功能。

定性资料的剖析
39.假定查验步骤 P73
2
40.查验
（ 1 ）基本思想：
（ 2 ）应用条件：
① n ≥40 ，T ≥5，用
2
查验
② n ≥40 但 1 ≤T<5，需用校订
2
查验
③ T<1 或 n<40，改用切实概率法。

（3 ）理论频数 T 的计算公式：
T
RC
=
n R n C n
（4 ） R ×C 表的自由度ν =（行数 -1 ）（列数 -1 ），故四格表ν =1 （5）要记的
2
界值：
2
=3. 84
0.05，1
41. 配对
2
查验的应用条件： b 、 c 为结果不一样部分（甲阳乙阴、甲阴乙
阳）
2
① b+c ≥40 时不用校订
2
= b
c ν =1
b c
2
② 20≤b+c ≤40 时要校订 2
b -
c - 1
=
ν =1
b c
42.R ×C 表的应用条件：
① 多个率或组成比的比较，其自由度大于1
② R ×C 表中不宜有
1 以上格子的理论频数小于 5，或不宜有一个理论频数小于1
5
43. 对理论频数太小的样本的办理方法： ① 增添样本例数
② 删去理论频数太小的行或列
③ 将太小理论频数所在的行或列的实质频数，与性质邻近的邻行或邻列的频数，归并。

44. 参数查验：以特定的整体散布（如正态散布、二项散布）作为前提，对整体的参数进行
的假定查验，限制条件：整体正态散布、整体方差齐性。

45. 非参数查验：不依靠于整体的散布种类，不针对整体参数，只针对整体散布能否相同的查验方法；常用于解决整体散布未知的统计问题。

46. 秩和查验
（1 ）基本思想：两组秩和相加等于 N(N+1)/2 。

( n 1 + n 2 =N)
（2 ）两组比较的秩和查验
①基本思想：若 A 、B 两组等级散布相同，则含量为n1的样本之实质秩和T 与其理论秩和n1(N+1)/2之差 T n1 ( N 1) / 2 纯系抽样偏差所致，所以差值不会很大，差值越大的概率越小。

②方法步骤： P88 认真弄理解
1°成立查验假定：H 0：两组散布相同；
H 1：两组散布不一样。

α=0.05
2°编秩
3°求秩和 T
4°确立查验统计量T
5°确立 P 值，作出推测性结论
（3）配对秩和查验：设 n 为非 0 差值的个数，则T + T =n （ n+1 ） /2。

（4）秩和查验的使用范围：理论上可用于随意散布的资料
① 等级资料
② 定量资料，张口资料
③ 定量资料，散布极度偏态，或个别数值偏离过大而不属于“过错偏差”者
④ 定量资料，各组失散程度相差悬殊，即便经变量变换，也难以达到方差齐性
⑤ 定量资料，散布型还没有确知
⑥ 兼有等级和定量性质的资料
（5）秩和查验的优弊端： P95
47. 直线有关
（1）观点：用来描绘两个呈正态散布的变量之间的线性共变关系。

（2）应用条件：双变量正态散布
48.有关系数
（1 ）观点：表达两变量间线性有关的程度和方向的一个统计指标。

（2 ）特点：①无量纲
②取值范围为 -1 ≤r≤1 。

有关系数小于0 为负有关；大于0 为正有关；等于0 为零有关
③有关系数的绝对值越大，表示两变量间的有关程度越亲密；有关系数越靠近于0，表示
有关越不亲密。

（3 ）有关系数的假定查验用
t 查验
1- r 2 s r 为有关系数的标准误
s r =
n - 2
r 有公式
r
= r /
1 - r 2
t=
s r
n - 2
① 成立查验假定： H 0 ：ρ =0 ，与无有关关系；
H 1 ：ρ ≠0，与有有关关系。

α=0.05
② 计算查验统计量 s r ， r ， t ，ν =n-2
③ 作结论：按ν =8 查 t 界值表得 P<0.001 。

按 α=0.05 水平拒绝 H 0 ，接受 H 1 。

故可以为
与之间有正有关关系。

50. 何时用等级有关？
51. 直线回归
（1 ）自变量 x ，应变量 y
（2 ）直线回归方程的一般表达式： ?
Y =a+bX
a 、
b 是决定回归直线的两个参数： a 为回归直线在 y 轴上的截距； b 为回归系数，即回归直
线的斜率。

（3 ） b 的意义：表示自变量增添一个单位时，应变量的均匀改变量。

要会解说，比如
b=0.2385 （ 103 cm 2 /kg ），表示体重增添 1（ kg ），则体表面积均匀递加 0.2385 （ 103 cm 2 ）。

（4 ? ? =5.3832（ 10 3 2
），） Y 的意义：表示给定 X 时 Y 的均匀值的预计。

比如 X=12（kg ）时，Y
cm 其意义是：全部体重为
12（ kg ）的 3 岁男童，预计其均匀体表面积为
5.3832 （ 103 cm 2 ）。

（5 ） Y- Y?的意义：称为节余、残差，是 y 的察看值与对应的预计值之差。

在回归图中表示
?
各散点到回归直线的纵向距离。

（ Y Y ）=0
（6 ）
?
Y Y
2
的意义：节余平方和。

坐标系中，每一条直线均可计算散点到该直线的
纵向距离之平方和；但只有各散点到回归直线的纵向距离之平方和，
即
?
Y Y
最小的。

以此为准则，可导出
a 、
b 的最小二乘预计（公式）。

2
是独一
52. 回归系数的假定查验用
t 查验
（1 ） s Y? X 为节余标准差，常用于评论啊回归方程的拟合精度。

扣除
x 的影响后， y 自己的
(Y
? 2
变异程度。

s Y? X =
残差
Y) =
n
2
自由度
（2 ） s b 为样本回归系数的标准误
s b = s Y? X /
l
XX
（3 ） ① 查验假定： H 0 ：整体回归系数 β=0 ，即与无回归关系；
H 1 ：整体回归系数 β≠0，即与有回归关系。

α=0.05 。

② 计算查验统计量： s Y? X ，
s b ， t b =
b - 0
，ν =n-2
s b
③ 作结论：按ν =8 查 t 界值表得 P<0.001 。

按 α=0.05 水平拒绝 H 0 ，接受 H 1 。

故可以为与有回归关系。

（4 ） t
r = t b ，因为自由度相同，故回归系数能否为 0 的假定查验与有关系数能否为
0 的假
设查验是等价的。

有关系数的假定查验更简单。

53. 应变量总变异的分解
2
?
(Y Y)=
(Y Y)
2
?
2
+
Y Y
SS 总
= SS 回
+ SS
剩
总
=
回
+
剩
；
总
=n-1 ；
回
=1 ；
剩
=n-2
54. 回归方程的方差剖析要会填表 P125
t r
= t b
=
F ，即在直线有关与回归剖析中，
有关系数的 t 查验、回归系数的 t 查验、回归方
程的方差剖析是等价的。

55. 直线回归与直线有关的差异及联系
（1）差异
医学统计学要点(精.选)
医学统计学
①对资料的要求：回归只需求应变量y 是随机变量且听从正态散布，变量x 有两种：精准丈量和严格控制的变量（Ⅰ型回归）、随机变量（Ⅱ型回归）。

有关：x、y均为随机变量且听从双变量正态散布
② 应用：回归反应两变量间的依存关系；有关反应两变量间的互相关系。

③计量单位： r 没有单位； b 的单位是： y 单位 /x 单位
（2）联系
①正负符号：在同一资料，r 与 b 的正负符号相同。

②假定查验：在同一资料，r 与 b 的假定查验等价。

③换算关系： P132
56.回归剖析应用条件：线性、独立、正态、等方差
57.研究设计的三因素：研究因素、受试对象、实验效应
58.研究可分为 2 种性质：前瞻性和回首性；又可分为两类：试验和检查。

所以，研究设计
的形式组合有 4 种。

59.试验研究与检查研究的差异：
（1）研究条件
（2）察看对象
（3）例数
60.研究设计的基来源则：比较、随机、重复。

最新文件仅供参照已改成word文本。

方便改正
word.
11 / 11。