医学统计学重点(精.选)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.变异:同质事物之间的差异。
2.频数散布的两个特点:集中地点,失散趋向
3.数据散布的种类:对称散布和非对称散布。
非对称散布又称偏态散布,包含正偏态和负偏
态。
单峰散布,双峰散布,多峰散布。
4.统计描绘:用统计表、统计图和统计指标等方法对资料的数目特点与散布规律进行描绘。
5.集中地点的描绘,集中地点指标又称均匀数指标。
有哪些及合用条件?
(1)算数均匀数:最合用于单峰对称散布资料的均匀水平的描绘,特别是正态散布资料
(2)几何均匀数:合用于①等比资料②对数正态散布资料
(3)中位数和百分位数:合用于①偏态散布的资料②张口资料③资料散布不明等
6.失散趋向的描绘
(1)全距亦称极差,合用于单峰小样本资料
(2)四分位数间距,合用于单峰小样本资料
(3)方差和标准差,合用于对称散布特别是正态散布资料
(4)变异系数,常用于① 比较胸怀衡单位不一样的两组或多种资料的变异度② 比较均数相差悬殊的两组或多组资料的变异度
7.常用相对数( 1)率,是二分类指标(2)组成比( 3)比
8.正确应用相对数应注意几个问题:
(1)计算相对数的分母不宜过小
(2)剖析时不可以以组成比取代率
(3)对察看单位数不等的几个率,不可以直接相加求其总率
(4)计算率时要注意资料的同质性,对照剖析时应注意资料的可比性
(5)也有抽样偏差,需要假定查验。
9.率的标准法
(1)基本思想:采纳一致的标准,以除去病情组成不一样对治愈率比较的影响,使算得的
标准化治愈率有可比性。
(2)目的:控制混淆因素对研究结果的影响。
10.正态散布
(1)观点 P16
(2)标准正态散布,u 变换: u= X
,u 是标准正态离差,μ是均数,σ是标准差。
u~ N( 0, 1)
(3)正态散布的特点:
①是单峰散布,顶峰地点在均数X=μ处。
② 以均数为中心,左右完整对称。
③ 取决于两个参数,均数μ和标准差σ。
μ为地点参数,μ越大,则曲线沿横轴向右挪动;μ越小,则曲线沿横轴向左挪动。
σ为形态参数,表示数据的失散程度,若σ小,则曲线形态“瘦高”;σ大,则曲线形态“矮胖” 。
④ 有些指标不听从正态散布,但经过适合的变换后听从正态散布,如对数正态散布。
⑤正态散布曲线下的面积是有规律的:总面积恒定为 1,对称地区面积相等,对应地区面积相等。
(4)几个 u 界值:① 90%:两侧u=单侧u=1.64
0.10.05
② 95%:两侧u0 .05 =单侧u0.025 =1.96
③ 99%:两侧u0 .01 =单侧u0.005 =2.58
11.二项散布
(1)样本率的标准差p 的预计值s p计算公式:s p=
p(1 p)
, p 是样本率
n
(2)样本个数 n 和概率π怎样影响二项散布的图形?
给定 n 后,形状取决于π。
当π =0.5 时,散布对称;当π <0.5 时散布呈正偏态;当
π >0.5
时散布呈负偏态。
随n 的增大,散布渐渐迫近正态散布。
假如nπ或 n(1- π ) 大于 5 时,则可用正态近似原理办理二项散布的有关问题。
(3)应用条件:对峙性,重复性,独立性。
12.Poisson散布
(1)观点,描绘稀有事件发生次数的概率散布,是特别的二项散布。
(2)均数与方差相等,均为λ。
(3)形状取决于λ的大小,为正偏态散布,λ越小散布越偏;跟着λ的增大,散布渐渐趋于
对称,当λ =20 时,已基本靠近对称散布;当λ≥50时,可按正态散布原理办理Poisson分布的有关问题。
(4)Poisson散布拥有可加性。
(5)应用条件:对峙性,重复性,独立性。
即事件的发生是互相独立的,且发生的概率不变,
结果是二分类的(发生或不发生)
13.参照值范围
(1 )观点:绝大部分正常人某指标的颠簸范围。
(2 )正态散布法计算100 ( 1—α)%正常值范围:两侧X u S
单侧X —u S(高侧)
X +u S(低侧)
注意α取值:两侧95%X 1.96 S
单侧 95%高侧 < X— 1.64S
低侧 > X +1.64S
(3 )百分位数法:知道求得第几个百分位数P26
14.抽样偏差
(1)观点:因为个体变异的存在,由抽样惹起的样本统计量与整体参数间的差异。
(2)产生的两个必备条件:①抽样研究②个体变异,是根来源因
(3)中心极限制理的涵义
① 从均数为μ、标准差为σ的正态整体中独立、重复、随机抽取含量为n 的样本,样本均
数的散布仍为正态散布,其均数为μ,标准差为
2 x。
X~N(μ , x ) → X~ N(μ , x )
② 即便从非正态整体(均数为μ、标准差为σ)中独立、重复、随机抽取含量
为n 的样本,
只需样本含量足够大(如n≥50 ),样本均数也近似听从均数为μ,标准差
为x 的正态散布。
(4 )标准误意义: 1.用来权衡抽样偏差的大小
2. x =标准误与个体变异σ成正比,与样本含量n 的平方根成反比
n
(5 )标准误的预计值的计算公式:样本标准差s 取代整体标准差σ,s x = s
n
(6 )标准差与标准误的关系
差异
标准差 s 标准误
s
x
意义 个体变异
统计量的抽样偏差
用途
正常值范围 ( x 1.96s)
整体均数的可信区间 ( x 1.96
s x
)
与 n 关系
n ,s 趋于稳固
n ,
s x
趋于
联系: ① 二者都是变异指标,说明个体之间的变异用标准差,说明统计量之间的变异用标准误;
② 当样本量不足时, 标准差大, 标准误也大, 均数的标准差与标准误成正比。
s x
=
s n
15. 医学统计学: 运用概率论和数理统计等数学的原理和方法, 研究医学领域中资料的收集、整
理、剖析和推测的一门学科。
16. 三类资料: ① 定量资料(数值资料) ② 定性资料(无序分类资料) ③ 等级资料(有序分类
资料)
17. 整体:按研究目的所确立的研究对象中,全部察看单位某项指标取值的会合。
18. 样本:从研究整体中,随机抽取拥有代表性的部分察看单位某项指标取值的会合。
19. 同质性:拥有相同性质的事物。
20. 参数:描绘某整体特点的指标。
21. 统计量:描绘某样本特点的指标。
22. 概率:随机事件发生可能性大小的一个胸怀,取值范围为0≤P ≤1 23. 小概率事件:发生概率 ≤0.05 的事件。
24. 小概率原理:小概率事件发生的可能性很小,从而以为其在一次抽样中不行能发生。
25. 理解和解说可信区间
26. 统计推测: 依据样本所供给的信息, 以必定的概率推测整体的性质。
包含双方面的内容:
参数预计和查验假定。
27. 可信区间的两个因素:靠谱性,精准性
28. 均数的可信区间:从正态散布整体
N( μ,
2
)中随机抽取一个样本,则 t=
X -
听从自
s x
---
由度 ν=n-1 的 t 散布。
整体均数的( 1- α)可信区间定义为 ( X — t
,
s x
,X
+
t ,
s x
)。
t 散布,相应的 100( 1- α)%可信区间为 ( X —
x
,
X + u
s )。
x
29. 率的可信区间:
(1 )率的标准差又称率的标准误,为
s
p
=
p(1 p)
n
(2)整体率π的区间预计用正态近似法的条件:样本含量 n 足够大,且样本率 p 和( 1-p )
都不太小时, 如 np 和 n ( 1-p )均大于 5 时,π的可信区间为 (p —
u s
p
,p+
u s
p
)。
30. 事件数的可信区间:当 X ≤50 也能够查附表 7“ Poisson 散布λ的可信区间” ,获得λ的 95%或 99%可信区间。
31. 假定查验
( 1 )基本思想:
( 2 ) 4 个基本步骤:
① 成立查验假定: H 0 :
1
=
2
= 3 =
H 1 : 1 、 2 、
3 之间不等或不全相等。
② 确立查验水平(拒绝
H 0 时的最大同意偏差
α)
③ 计算查验统计量并求
P 值
④ 界定 P 值并作结论(要回下结论)
: P ≤α,拒绝 H 0 ,接受 H 1 ;
P >α,不拒绝 H 0 。
(3 )Ⅰ型错误: H 0 真切时被拒绝。
P>0.05 却拒绝 H0 接受 H1 (4 )Ⅱ型错误: H 0 不真切时不拒绝。
H1 真切即 P<0.05 却不拒绝 H0
(5 )查验功能:Ⅱ型错误率
β表示失掉对真切的 H 1 作出必定结论之概率,故 1- β就是
对
真切的 H 1 作出必定结论之概率,常被用来表达某假定查验方法的查验功能,即假定查验对 真切的 H 1 作出必定结论之掌握程度。
( 6 )Ⅰ型错误与Ⅱ型错误的关系P51
( 7 )单侧查验与两侧查验的关系
( 8 )假定查验与可信区间的关系
32. 怎么做题?
判断资料种类→设计方法→计算自由度→确立 P 值→下结论
33. 划分派对和成组
配对:同质性差,要算差值① 自己配对② 一般有编号
成组:① 无原始数据(还有均数)② 两组样本含量不等,不可以配对③ 无编号
34.t 查验
(1)应用条件:独立性,正态性,方差齐性
(2)两样本均数比较方差不齐时t’查验
(3)两样本几何均数比较:取对数,t 查验,不用反对数
35.方差剖析,多个均数比较
(1)总变异 SS总:= SS组间+ SS组内办理因素、个体差异、随机因素,共同致使的差异。
(2)组间变异 SS组间:多个组的办理因素不一样和随机偏差,致使的差异。
(3)组内变异 SS组内:组内个体差异和其余随机因素,致使的差异。
(4)三种变异的关系:SS
=SS组间+SS组内,总=组间+组内
总
F MS
组间/MS组内
(5)单因素方差剖析表和两因素方差剖析表
36.多个样本均数的两两比较,对照的组数k 大于 2 ,分别 t 查验则需经过 m=k ( k-1 ) /2 次
比较,若每次比较的第一类错误率为α,则多次比较后,起码犯一次序一类错误的概率为
m
1 (1-),比早先设计的α要大。
37.变量变换目的
38.F 值、 t 值、 q 值、 q’值之间的关系
(1)两样本均数比较时, F =t。
用q查验或q'查验也获得相同的结论。
说明在两样本均数比较时, t 查验、 F 查验、 q 查验和 q' 查验是等价的。
(2)当组数k>2 时, q' 查验的查验功能高于q 查验,所以当实验研究设计为一个比较组与
多个实验组均数比较时,q' 查验科获得较高的功能。
定性资料的剖析
39.假定查验步骤 P73
2
40.查验
( 1 )基本思想:
( 2 )应用条件:
① n ≥40 ,T ≥5,用
2
查验
② n ≥40 但 1 ≤T<5,需用校订
2
查验
③ T<1 或 n<40,改用切实概率法。
(3 )理论频数 T 的计算公式:
T
RC
=
n R n C n
(4 ) R ×C 表的自由度ν =(行数 -1 )(列数 -1 ),故四格表ν =1 (5)要记的
2
界值:
2
=3. 84
0.05,1
41. 配对
2
查验的应用条件: b 、 c 为结果不一样部分(甲阳乙阴、甲阴乙
阳)
2
① b+c ≥40 时不用校订
2
= b
c ν =1
b c
2
② 20≤b+c ≤40 时要校订 2
b -
c - 1
=
ν =1
b c
42.R ×C 表的应用条件:
① 多个率或组成比的比较,其自由度大于1
② R ×C 表中不宜有
1 以上格子的理论频数小于 5,或不宜有一个理论频数小于1
5
43. 对理论频数太小的样本的办理方法: ① 增添样本例数
② 删去理论频数太小的行或列
③ 将太小理论频数所在的行或列的实质频数,与性质邻近的邻行或邻列的频数,归并。
44. 参数查验:以特定的整体散布(如正态散布、二项散布)作为前提,对整体的参数进行
的假定查验,限制条件:整体正态散布、整体方差齐性。
45. 非参数查验:不依靠于整体的散布种类,不针对整体参数,只针对整体散布能否相同的查验方法;常用于解决整体散布未知的统计问题。
46. 秩和查验
(1 )基本思想:两组秩和相加等于 N(N+1)/2 。
( n 1 + n 2 =N)
(2 )两组比较的秩和查验
①基本思想:若 A 、B 两组等级散布相同,则含量为n1的样本之实质秩和T 与其理论秩和n1(N+1)/2之差 T n1 ( N 1) / 2 纯系抽样偏差所致,所以差值不会很大,差值越大的概率越小。
②方法步骤: P88 认真弄理解
1°成立查验假定:H 0:两组散布相同;
H 1:两组散布不一样。
α=0.05
2°编秩
3°求秩和 T
4°确立查验统计量T
5°确立 P 值,作出推测性结论
(3)配对秩和查验:设 n 为非 0 差值的个数,则T + T =n ( n+1 ) /2。
(4)秩和查验的使用范围:理论上可用于随意散布的资料
① 等级资料
② 定量资料,张口资料
③ 定量资料,散布极度偏态,或个别数值偏离过大而不属于“过错偏差”者
④ 定量资料,各组失散程度相差悬殊,即便经变量变换,也难以达到方差齐性
⑤ 定量资料,散布型还没有确知
⑥ 兼有等级和定量性质的资料
(5)秩和查验的优弊端: P95
47. 直线有关
(1)观点:用来描绘两个呈正态散布的变量之间的线性共变关系。
(2)应用条件:双变量正态散布
48.有关系数
(1 )观点:表达两变量间线性有关的程度和方向的一个统计指标。
(2 )特点:①无量纲
②取值范围为 -1 ≤r≤1 。
有关系数小于0 为负有关;大于0 为正有关;等于0 为零有关
③有关系数的绝对值越大,表示两变量间的有关程度越亲密;有关系数越靠近于0,表示
有关越不亲密。
(3 )有关系数的假定查验用
t 查验
1- r 2 s r 为有关系数的标准误
s r =
n - 2
r 有公式
r
= r /
1 - r 2
t=
s r
n - 2
① 成立查验假定: H 0 :ρ =0 , 与 无有关关系;
H 1 :ρ ≠0, 与 有有关关系。
α=0.05
② 计算查验统计量 s r , r , t ,ν =n-2
③ 作结论: 按ν =8 查 t 界值表得 P<0.001 。
按 α=0.05 水平拒绝 H 0 ,接受 H 1 。
故可以为
与 之间有正有关关系。
50. 何时用等级有关?
51. 直线回归
(1 )自变量 x ,应变量 y
(2 )直线回归方程的一般表达式: ?
Y =a+bX
a 、
b 是决定回归直线的两个参数: a 为回归直线在 y 轴上的截距; b 为回归系数, 即回归直
线的斜率。
(3 ) b 的意义:表示自变量增添一个单位时,应变量的均匀改变量。
要会解说,比如
b=0.2385 ( 103 cm 2 /kg ),表示体重增添 1( kg ),则体表面积均匀递加 0.2385 ( 103 cm 2 )。
(4 ? ? =5.3832( 10 3 2
), ) Y 的意义:表示给定 X 时 Y 的均匀值的预计。
比如 X=12(kg )时,Y
cm 其意义是:全部体重为
12( kg )的 3 岁男童,预计其均匀体表面积为
5.3832 ( 103 cm 2 )。
(5 ) Y- Y?的意义:称为节余、残差,是 y 的察看值与对应的预计值之差。
在回归图中表示
?
各散点到回归直线的纵向距离。
( Y Y )=0
(6 )
?
Y Y
2
的意义:节余平方和。
坐标系中,每一条直线均可计算散点到该直线的
纵向距离之平方和; 但只有各散点到回归直线的纵向距离之平方和,
即
?
Y Y
最小的。
以此为准则,可导出
a 、
b 的最小二乘预计(公式) 。
2
是独一
52. 回归系数的假定查验用
t 查验
(1 ) s Y? X 为节余标准差,常用于评论啊回归方程的拟合精度。
扣除
x 的影响后, y 自己的
(Y
? 2
变异程度。
s Y? X =
残差
Y) =
n
2
自由度
(2 ) s b 为样本回归系数的标准误
s b = s Y? X /
l
XX
(3 ) ① 查验假定: H 0 :整体回归系数 β=0 ,即 与 无回归关系;
H 1 :整体回归系数 β≠0,即 与 有回归关系。
α=0.05 。
② 计算查验统计量: s Y? X ,
s b , t b =
b - 0
,ν =n-2
s b
③ 作结论: 按ν =8 查 t 界值表得 P<0.001 。
按 α=0.05 水平拒绝 H 0 ,接受 H 1 。
故可以为 与 有回归关系。
(4 ) t
r = t b ,因为自由度相同,故回归系数能否为 0 的假定查验与有关系数能否为
0 的假
设查验是等价的。
有关系数的假定查验更简单。
53. 应变量总变异的分解
2
?
(Y Y)=
(Y Y)
2
?
2
+
Y Y
SS 总
= SS 回
+ SS
剩
总
=
回
+
剩
;
总
=n-1 ;
回
=1 ;
剩
=n-2
54. 回归方程的方差剖析 要会填表 P125
t r
= t b
=
F ,即在直线有关与回归剖析中,
有关系数的 t 查验、回归系数的 t 查验、回归方
程的方差剖析是等价的。
55. 直线回归与直线有关的差异及联系
(1)差异
医学统计学要点(精.选)
医学统计学
①对资料的要求:回归只需求应变量y 是随机变量且听从正态散布,变量x 有两种:精准丈量和严格控制的变量(Ⅰ型回归)、随机变量(Ⅱ型回归)。
有关:x、y均为随机变量且听从双变量正态散布
② 应用:回归反应两变量间的依存关系;有关反应两变量间的互相关系。
③计量单位: r 没有单位; b 的单位是: y 单位 /x 单位
(2)联系
①正负符号:在同一资料,r 与 b 的正负符号相同。
②假定查验:在同一资料,r 与 b 的假定查验等价。
③换算关系: P132
56.回归剖析应用条件:线性、独立、正态、等方差
57.研究设计的三因素:研究因素、受试对象、实验效应
58.研究可分为 2 种性质:前瞻性和回首性;又可分为两类:试验和检查。
所以,研究设计
的形式组合有 4 种。
59.试验研究与检查研究的差异:
(1)研究条件
(2)察看对象
(3)例数
60.研究设计的基来源则:比较、随机、重复。
最新文件仅供参照已改成word文本。
方便改正
word.
11 / 11。