统计学基础知识复习

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2015年11月11
第二节 常用相对数
一、概念、计算与意义
⒈率:说明某现象或某事物发生的频率或强度。
率=(实际发生数/可能发生总数)×比例基数
比例基数:100%、1000‰、10000/万、100000(1/10万)等
如:发病率、死亡率、发生率、阳性率、患病率等
⒉构成比:说明某一事物内部各组成部分所占的比重,也叫%。
甲的标准差S
X X
n 1
n
1260400 2500 2 / 5 =50.99 5 1
第四军医大学卫生统计学教研室
2015年11月11
三、正态分布
(一)概念
正态分布:也叫高斯分布,是最常见、 最重要的一种连续型分布。
f(X)
正态曲线

图形特点: ①钟型 ②中间高、两头低 、左右对称 ③最高处对应于X 轴的值就是均数 X ④曲线下面积为1 ⑤标准差决定曲线 的形状 2015年11月11
小概率思想: P<0.05(或P<0.01)是小概率事件。在 一次试验中基本上不会发生。 P≤α(0.05) 样本差 别有统计学意义;P >α(0.05) 样本差别无统计学意 义
第四军医大学卫生统计学教研室
2015年11月11
(一)假设检验的原因
由于个体差异的存在,即使从同一总体中严格的随 机抽样,X1、X2、X3、X4、、、,不同。 因此,X1、X2 不同有两种(而且只有两种)可能:
⒈不能以构成比代替率。 ⒉计算相对数的分母不宜过小,小则直接叙述。 ⒊进行率的对比分析时,应注意资料可比性。 两个率要在相同的条件下进行,研究方法
相同、研究对象同质、观察时间相等、地区、
民族、年龄、性别等。
⒋正确求平均率。 例: 若P1=x1/n1 P2=x2/n2 P3=x3/n3 P=(x1+ x2+ x3)/ n1+ n2+ n3) (正确) P=(P1+ P2+ P3)/3 (错误) 第四军医大学卫生统计学教研室 ⒌率的比较应做假设检验。 2015年11月11
第四军医大学卫生统计学教研室
(二)曲线下面积分布规律
68.27%
68.27%
95.00% 99.00%
-2.58 -1.96
95.00% 99.00% 1 1.96 2.58 μ-2.58σ
μ-1.96σ μ-σ
μ μ+σ μ+1.96σ μ+2.58σ
-1
0
标准正态分布 -1~1 -1.96~1.96 -2.58~2.58
正态分布 μ±σ μ±1.96σ μ±2.58σ
面积或概率 68.27% 95.00% 99.00%
第四军医大学卫生统计学教研室
2015年11月11
(三)医学正常值范围估计 1.正态分布法:
双侧95%正常值范围:X 1.96S
双侧99%正常值范围: X 2.58S
第四军医大学卫生统计学教研室
第三节 假设检验
一、基本概念 — ㈠抽样误差:由于抽样引起的样本统计量(X) 与总体参数(μ)之间的差异。 ㈡标准误(σX):样本均数的标准差,表示抽
样误差大小的指标。 ⒈计算:
⒉意义:反映抽样误差的大小,标准误越小,抽样误差越小,
用样本均数估计总体均数的可靠性越大。
2015年11月11
抽样误差 总体
样本方差S
2
(X X ) ∑ n 1
2
X X =
2
2
n
n 1
第四军医大学卫生统计学教研室
2015年11月11
样本方差为什么要除以(n-1)?
与自由度有关。 自由度是数学名词,在统计学中,n个数据如不受任何
条件的限制,则n个数据可取任意值,称为有n个自由度。 若受到k个条件的限制,就只有(n-k)个自由度了。计 算标准差时, n个变量值本身有n个自由度。但受到样本 均数的限制,任何一个“离均差”均可以用另外的(n-1 )个“离均差”表示,所以只有(n-1)个独立的“离均 差”。因此只有(n-1)个自由度。
2015年11月11
(二)假设检验的目的
判断是由于何种原因造成的不同,以做出决策。
(三)假设检验的原理/思想
反证法:当一件事情的发生只有两种可能A和B,为了
肯定其中的一种情况A,但又不能直接证实A,
这时否定另一种可能B,则间接的肯定了A。
概率论:事件的发生不是绝对的,只是可能性大小
而已。
(四)假设检验的一般步骤
总称为平均数(average):反映了资料的 集中趋势。 常用的平均数有: 1.算术均数:简称均数。 2.几何均数: 3.中位数:
第四军医大学卫生统计学教研室
2015年11月11
1.均数
X 1 X 2 X n X X n n
f1 X 1 fX 2 fX 3 f k X k fX i X f1 f 2 f 3 f k f i
①分别所代表的总体均数相同,由于抽样误差造成了样本均
数的差别,差别无显著性 。 ②分别所代表的总体均数不同,差别有显著性。 小概率思想: P<0.05(或P<0.01)是小概率事件。在 一次试验中基本上不会发生。 P≤α(0.05) 样本差别有统
计学意义;P >α(0.05) 样本差别无统计学意义。
第四军医大学卫生统计学教研室
2015年11月11
例:设甲、乙、丙三人,采每人的耳垂血,然后红细胞 计数,每人数5个计数盘,得结果如下(万/mm3) 盘编号 甲 乙 丙
580 560 540 520 500 480 460 440 420
1
2 3 4 5 合计
440 460 500 540 560
2500
480 490 500 510 520
2500
490 495 500 505 510
2500
均数
500
500
500



第四军医大学卫生统计学教研室
2015年11月11
1.极差(Range)
R X max X min
优点:简便 缺点:1.只利用了两个极端值 2.n大,R也会大 3.不稳定
第四军医大学卫生统计学教研室
1.6~
1.7~1.8 合计

8
3 160
1.65
1.75
13.20
5.25 182.30
第四军医大学卫生统计学教研室
2015年11月11
二、变异指标
反映数据的离散度。即个体观察值的变异程 度。常用的指标有: 1.极差(Range) (全距) 2.百分位数与四分位数间距 3.方差 4.标准差(Standard Deviation) 5.变异系数 (Coefficient of Variation)
发生的
频率或强度
各组成部分
所占的比重
强调点
资料获得 特点
随机发生事件
较难 不一定
各部分的构成
容易 合计为100%
2015年11月11
第四军医大学卫生统计学教研室
率与构成比的例子
年龄 组 ⑴ 40506070≥80 合计 受检 人数 ⑵ 560 441 296 149 22 1468 白内障 患者年龄 患病率 例数 构成比(%) (%) ⑶ ⑷ ⑸=(3)/(2) 68 129 135 97 19 448 15.18 28.79 30.13 21.65 4.24 100.00 12.14 29.25 45.61 65.10 86.36 30.52 2015年11月11
15.81
490 495 500 505 510 2500
7.91
2
193600 211600 250000 291600 313600 1260400
2
230400 240100 250000 260100 270400 1251000
240100 245025 250000 255025 260100 1250250
样本方差S
2
(X X ) ∑ n 1
2
X X =
2
2
n
n 1
第四军医大学卫生统计学教研室
2015年11月11
3.标准差
标准差 (standard deviation)即方差的正 平方根;其单位与原变量X的单位相同。
样本标准差S
X X (X X ) ∑ =
2 2
2
n
n 1
n 1
2
频数表样本标准差S
fX fX f f 1
2
第四军医大学卫生统计学教研室
2015年11月11
标准差的计算
盘编号 甲 乙 丙 甲2 乙2 丙2
1 2 3 4 5 合计 标准差
440 460 500 540 560 2500
50.99
480 490 500 510 520 2500
Σ为求和符号,读成sigma 适用条件:资料呈正态或近似正态 。 第四军医大学卫生统计学教研室
2015年11月11
组段 (1)
划记 (2) 正 正正 正正 正正正 正正正 正正正正
频数,f (Βιβλιοθήκη Baidu)
组中值,X (4)
fX (5)= (3)×(4)
0.5~
0.6~ 0.7~ 0.8~ 0.9~ 1.0~ 1.1~ 1.2~
回顾:统计描述与检验
Descriptive Statistics
00级七年制《医学统计学》Dr. 宇传华 制作
第一节 计量资料的统计描述
平均指标(算术均数、几何均数、
中位数、百分位数)
变异指标(极差、四分位间距、方差 标准差、变异系数)
第四军医大学卫生统计学教研室
2015年11月11
一、平均指标
参 数
如:总体均数 总体标准差 总体率 抽取部分观察单位 样本


统计推断
统计量
如:样本均数 X 样本标准差 S 样本率 P
(sampling error) :由于 个体差异导致 的样本统计量 与总体参数间 的差别。
第四军医大学卫生统计学教研室
2015年11月11
二、假设检验的基本思想和步骤
总体间差异: 1. 个体差异,抽样误差所致; 2. 总体间固有差异 判断差别属于哪一种情况的统计学检验, 就是假设检验(test of hypothesis)。 t检验是最常用的一种假设检验之一。
2015年11月11
2.方差
方差 (variance):也称均方差,样本观察值 的离均差平方和的均值。表示一组数据的平均离 散情况。
离均差和 ( X - ) 0 ∑ 离均差平方和(sum of square ) SS l xx ∑ ( X - )2
2 ( X ) 总体方差 2 ∑ N
第四军医大学卫生统计学教研室
某地某年四种常见心血管病死亡率
病名 高血压 冠心病 恼卒中 风心病 平均人口数 172665 172665 172665 172665 死亡人数 40 11 253 38 死 亡 率 (1/10万) 23.2 6.4 146.5 22.0
2015年11月11
二、应用注意事项
⒈建立假设与确定检验水准(α)
H0:μ1=μ2 无效假设——两个总体均数相等
H1:μ1≠μ2 备择假设——两个总体均数不相等
检验水准:α=0.05或0.01(双侧)
⒉选定方法和计算统计量
如两组小样本比较用t检验、大样本比较u检验、 方差齐性检验用F检验。 ⒊确定P值,作出判断 P≤0.05 P >0.05 样本差别有统计学意义 样本差别无统计学意义
3
9 12 13 17 18 20 18 17 13 9
0.55
0.65 0.75 0.85 0.95 1.05 1.15 1.25 1.35 1.45 1.55
1.65
5.85 9.00 11.05 16.15 18.90 23.00 22.50 22.95 18.85 13.95
正正正 均数= 1.3~ 正正正 182.3/160 = 1.4~ 正正 1.14 1.5~ 正
构成比=(某部分观察单位数/各组成部分观察单位总数)×100%
如:教研室16人中高级职称有4人,占20%。
⒊相对比:是A、B两个有关指标之比,说明A是B的若干倍或百分
之几,通常用倍数或分数表示。
第四军医大学卫生统计学教研室
如:男:女、医生:护士、教师:学生
2015年11月11
率与构成比
率 构成比
概念
第四军医大学卫生统计学教研室
2015年11月11
例1.在进行某遗传病的研究中,一研究人员发
现,在该病患者中,有90%是第一个孩子,由此可见 该病的遗传与出生顺序有关---更容易遗传给第一个孩 子。这个结论是否正确,为什么?
例2.该县为提高医疗卫生的服务水平,对卫生人
员进行培训,但是,经过1年培训,与培训前相比, 该县孕产妇的死亡率却升高,统计学检验差异有显著 性。如何解释? 培训前:2000孕产妇 100/10万 ( 死亡2人) 培训后:2010孕产妇 149/10万 (死亡3人)
相关文档
最新文档