第5-7章 计数资料的统计描述与统计推断

合集下载

统计描述与统计推断

统计描述与统计推断

统计描述与统计推断统计的主要工作就是对统计数据进行统计描述和统计推断。

统计描述是统计分析的最基本内容,是指应用统计指标、统计表、统计图等方法,对资料的数量特征及其分布规律进行测定和描述;而统计推断是指通过抽样等方式进行样本估计总体特征的过程,包括参数估计和假设检验两项内容。

(一)统计描述1.计量资料的统计描述计量资料的统计描述主要通过编制频数分布表、计算集中趋势指标和离散趁势指标以及统计图表来进行。

(1)集中趋势。

指频数表中频数分布表现为频数向某一位置集中的趋势。

集中趋势的描述指标:1)算术平均数。

直接法:x为观察值,n为个数加权法又称频数表法,适用于频数表资料,当观察例数较多时用。

f为各组段的频数。

2)几何平均数(geometric mean)。

几何平均数用符号G表示。

用于反映一组经对数转换后呈对称分布的变量值在数学上的平均水平。

直接法:加权法又称频数表法,当观察例数n较大时,可先编制频数分布表,用此法算几何平均数:3)百分位数(percentile )与中位数(median )。

百分位数是一种位置坐标,用符号x P 表示常用的百分位数有 2.5P 、5P 、50P 、75P 、95P 、97.5P 等,其中25P 、50P 、75P 又称为四分位数。

百分位数常用于描述一组观察值在某百分位置上的水平,多个百分位结合使用,可更全面地描述资料的分布特征。

中位数是一个特定的百分位数即50P ,用符号M 表示。

把一组观察值按从小到大(或从大到小)的次序排列,位置居于最中央的那个数据就是中位数。

中位数也是反映频数分布集中位置的统计指标,但它只由所处中间位置的部分变量值计算所得,不能反映所有数值的变化,故中位数缺乏敏感性。

中位数理论上可以用于任何分布类型的资料,但实践中常用于偏态分布资料和分布两端无确定值的资料。

其计算方法有直接法和频数表法两种。

直接法:当观察例数n 不大时,此法常用,先将观察值按大小次序排列,选用下列公式求M 。

第5-7章 计数资料的统计描述与统计推断(2004.10)

第5-7章 计数资料的统计描述与统计推断(2004.10)
第五章 计数资料的统计描述
温州医学院公共卫生学院
1
一. 相对数的概念及计算:
相对数是分类资料的主要统计描述指标, 便于比较。 例:
甲、乙两地发生麻疹流行,甲地患儿100人,乙地患 儿150人,何地较为严重? 若甲地易感儿童500人,而乙地易感儿童1000人。 甲地麻疹患病率为 100/500×100%=20% 乙地麻疹患病率为 150/1000×100%=15% 2
28
2)正态近似法: 若n 50 或 n p和n( 1-p) 5时,p~N(π,σP)
P u / 2 S P
例7.7 P.76 在某地随机抽取329人,作血清登革热血凝抑制抗 体反应检验,结果29人阳性,估计该地人群血清登革热血凝抑 制抗体阳性率。
29 p 0.0881 329
p(1 p) 0.081(1 0.081) SP 0.0156 n 329 0.0881 1.96 0.0156 0.0575 ~ 0.1187 5.75% ~ 11.87%
二. 应用条件:
Bernoulli试验: 在只有两种可能结果(成功与失败)的 随机试验,每次试验时出现成功的概率π 是恒定的,而且 各次试验相互独立。这种试验在统计学上称之为贝努里试 验( Bernoulli trial)。
19
在Bernoulli试验中,取得成功的次数X(X=0,1,2,……, n)的概率呈二项分布。其概率计算式:
故该地人群血清登革热血凝抑制抗体阳性率的95%可信区间为 5.75%~11.87%。 29
(2)样本率与总体率比较 1)直接计算概率法
例:据以往经验,新生儿染色体异常率一般为 1%,某医院观 察了当地 400 名新生儿,只有 1 例染色体异常,问该地新生儿 染色体异常率是否低于一般。 H0: 1 = 0 =0.01

医学统计学复习资料(完整版)

医学统计学复习资料(完整版)

第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。

1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。

2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。

分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。

反映总体特征的指标为参数,常用小写希腊字母表示。

3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。

(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。

4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。

抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。

其根源在于总体中的个体存在变异性。

只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。

统计分析主要是针对抽样误差而言。

5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。

各类资料间可相互转化。

①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。

6.误差:实测值与真实值之差。

可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。

①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。

医学统计学-实习二定量资料的统计推断

医学统计学-实习二定量资料的统计推断

a. Lilliefors Significance Correction
Sig. .466 .482
2.方差齐性检验、
两样本比较的t 检验:
结果输出:
Independent Samples Test
Levene's Test for
Equality of Variances
t-test for Equality of Means
95%置信区间
结果输出:
二、定量资料的 差异性检验
有关样本资料的差异性比较
数据类型
定量资料
设计类型
不满足t 检验/方 差分析条件的
定性资料
设计
类型
设计类型
单 样 本
配 对 设 计
两 独 立 样
多 独 立 样
本本
随析重 机因复 区设测 组计量 资资资 料料料
单 样 本
配 对 设 计
两 多 独 立 样 本
a. Not corrected for ties.
b. Grouping Variable: group
【例6.4】为研究某种抗癌新药对小白鼠移植性肉瘤S180 的抑瘤效果,将20只小白鼠按性别、体重、窝别配成对子。 每对中随机抽取一只服用抗癌新药,另一只作为阴性对照, 服用生理盐水,观察其对小白鼠移植性肉瘤S180的抑瘤效 果,经过一定时间,测得小白鼠瘤重如表4所示。问小白 鼠服用抗癌新药和生理盐水后平均瘤重有无不同?
Std. Error M ea n 184.699
140.079
Pair 1 甲 组 - 乙 组
Paired Samples Test
M ea n 795.000
Paired Differences

统计背诵版(三份整合)

统计背诵版(三份整合)

统计学资料背诵版一、单选题:第二章:计量资料的统计描述1、描述一组偏态分布资料的变异度,以四分位数间距指标较好。

2、用均数和标准差可以全面描述正态分布资料的特征。

3、各观察值均加(或减)同一数后标准差不变。

4、比较某地1~2岁和5~5.5岁儿童身高的变异程度,宜用变异系数。

5、偏态分布宜用中位数描述其分布的集中趋势。

6、各观察值同乘以一个不等于0的常数后,变异系数不变。

7、正态分布的资料,均数等于中位数。

8、对数正态分布是一种右偏态分布(说明:设X变量经Y=lgX变换后服从正态分布,问X变量属何种分布?)9、横轴上,标准正态曲线下从0到2.58的面积为49.5%10、当各观察值呈倍数变化(等比关系)时,平均数宜用几何均数。

第三章:总体均数的估计与假设检验1、均数的标准误反映了样本均数与总体均数的差异。

2、两样本均数比较的t检验,差别有统计学意义时,P越小,说明越有理由认为两总体均数不同。

3、甲乙两人分别从同一随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得X1和S 12、X2和S22,则理论上由甲、乙两样本均数之差求出的总体均数95%可信区间,很可能包括04、在参数未知的正态总体中随机抽样,丨X-μ丨≥t0.05/2,vS X的概率为5%5、某地1992年随机抽取100名健康女性,算得其血清总蛋白含量的均数为74g/L,标准差为4g/L,则其95%的参考值范围为74±1.96×46、关于以0为中心的t分布,叙述错误的是相同时,丨t丨越大,P越大。

7、在两样本均数比较的t检验中,无效假设为两总体均数相等。

8、两样本均数比较作t检验时,分别取以下检验水准,犯第二类错误概率最小的是α=0.309、正态性检验,按α=0.10水准,认为总体服从正态分布,此时若推断有错,其错误的概率等于β,而β未知。

10、关于假设检验,说法正确的是采用配对t检验还是两样本t检验是由试验设计方案所决定的。

计数资料的统计推断

计数资料的统计推断
x2 =? (|A-T|-0.5)2/T 或
x2 =(|ad-bc|-n/2)2 xN? (a+b)(c+d)(a+c)(b+d) 见62页。
例题
? 上例:问此药是否有效。 ? 第一步:建立假设 H0 : ? 1=? 2 =20%
H1 : ?1 ? ?2 ? 第二步:确定显著性水平 ? =0.05 ? 第三步:计算统计量: n =200>40,每格的T值大于5,
差的存在,造成的不同,这种差别在统计上叫 差别无统计学意义。
?2. P1 , P2所代表的总体率不同,即两个样本 来不同的总体,其差别有统计学意义。
?现在就是要用统计学的方法进行判断到底 属于那种情况。
1. 总体率(或构成比)的u检验
?目的: ?公式:
其中符号的含义
?适用条件: 已知π0 nP>5, n(1-P)>5 例题P58
1.率(或构成比)的 ? 检验 2. x2检验?
四、假设检验的注意事项 五、非参数检验
1.参数统计和非参数统计优缺点
2数检验的方法很多,秩和检验是较常用的,
检验效率较高的一种。其基本原理是 编秩求和 。
23
成组资料比较的秩和检验
?秩和检验的方法很多。 以此例说明秩和检验的基本原理。82页。
研究不同饲料与雌鼠体重增加的关系,问 高低蛋白饲料与体重增加有无关系?
24
不同饲料的两组雌鼠在 8 周内所增体重( g)
专用公式: x2 =( b-c)2/ b+c b+c? 40时,校正公式: x2 =? (|A-T|-0.5)2/T
x2 =( lb-cl-1)2/ b+c
自由度:?=(2-1) x (2-1)=1

医学统计学重点概要

医学统计学重点概要

第一章 绪论总体:根据研究目的确定的同质的所有观察单位某种变量值的集合。

总体包括有限总体和无限总体。

样本:从总体中随机抽取的部分观察单位,其实测值的集合。

获取样本仅仅是手段,通过样本信息来推断总体特性才是研究的目的。

资料的类型计量资料、计数资料和等级资料。

误差包括随机误差、系统误差和非系统误差。

抽样误差:由抽样造成的样本统计量和总体参数之间的差异或者是各个样本统计量之间的差异称为抽样误差。

概率:是描述随机事件发生可能性大小的一个度量。

取值范围0≤P ≤1。

小概率事件:表示在一次实验或观察中该事件发生的可能性很小,可以认为很可能不发生。

P ≤0.05或P ≤0.01。

医学统计学的步骤:设计、收集资料、整理资料和分析资料。

统计分析包括:统计描述和统计推断。

统计推断包括:参数估计和假设检验。

第二章计量资料的统计描述频数表和频数分布图的用途:(1)描述频数分布的类型,以便选择相应的统计指标和分析方法。

对称分布:集中位置在中间,左右两侧頻数基本对称。

偏态分布:正、负偏态分布正偏态集中位置偏向值小一侧,负偏态反之。

(2)描述頻数分布的特征;(3)便于发现资料中的可疑值;(4)便于进一步计算统计指标和进行统计分析。

计量资料集中趋势包括算术均数、几何均数和中位数。

算术均数:直接法(样本小):n x x ∑=;頻数表法(样本大)x =nfx ∑ 几何均数:直接法:)lg (lg 1n x G ∑-=;頻数表法)lg (lg )lg (lg 11n x f fx f G ∑∑∑--==(常用于等比资料或对数正态分布资料)中位数:直接法:n 为奇数2/)1(+=n x M ,n 为偶数2/)(12/2/++=n n x x M ;頻数表法:∑-⨯+=)%50(L M M f n f iL M 。

中位数的应用注意事项:可用于各种分布资料,不受极端值的影响,主要用于(1)偏态分布资料(2)端点无确切值的资料(3)分布不明确的资料。

计数资料的统计描述和推断PPT课件

计数资料的统计描述和推断PPT课件
通过实例演示计数资料假设检验的步骤和方法,包括提出假 设、选择检验方法、确定样本量、收集数据、计算检验统计 量等。
详细描述
介绍假设检验的基本原理和方法,通过具体实例演示如何进 行计数资料的假设检验,包括提出假设、选择检验方法、确 定样本量、收集数据、计算检验统计量等步骤,说明假设检 验在数据分析中的意义和作用。
偏态”。
相对频数
各组的频数与数据总数 的比值,反映各组频数 在数据分布中的相对地
位。
描述性统计指标
01
02
03
04
计数
数据点的数量,即数据的规模 。
百分比
某一数据值占总数据值的比例 ,用于描述数据的相对大小。
比率
两个数据值的相对大小,用于 描述数据的相对位置。
中位数
将数据从小到大排列后,位于 中间位置的数据值,用于描述
报告结果
清晰地报告假设检验的结果,包括使用的统计量、显著 性水平、p值以及结论。
04 方差分析
方差分析的基本思想
方差分析是通过比较不同组别数据的 离散程度和平均水平,来检验各组之 间的差异是否显著的一种统计方法。
方差分析的基本思想是将总变异分解 为组间变异和组内变异,并比较两者 的大小,以判断各组之间是否存在显 著差异。
多元线性回归分析
多元线性回归分析涉及多个自变量和 一个因变量,并假定因变量和自变量 之间存在线性关系。
多元线性回归分析的步骤与一元线性 回归分析类似,但需要更多的计算和 统计方法来处理多个自变量之间的关 系和交互作用。
多元线性回归分析的目的是通过多个 自变量来预测因变量的值,并给出预 测值的范围和精度。
案例二:参数估计实例分析
总结词
通过实例演示如何利用参数估计方法对总体率或总体均数进行估计,比较不同估 计方法的优缺点。

医学统计学第5-7章 计数资料的统计描述与统计推断课件

医学统计学第5-7章 计数资料的统计描述与统计推断课件

39
(二)多个构成比的比较
地区
三个不同地区血型构成比比较
A
B
AB
O 合计
亚洲 321 369 95 295 1080
欧洲 258 43
22 194 517
北美洲 408 106 37 444 995
合计 987 518 154 933 2592
χ2=297.59 ν=(3-1)(4-1)=6 P<0.005
0.0881 1.960.0156 0.0575 ~ 0.1187 5.75% ~ 11.87%
故该地人群血清登革热血凝抑制抗体阳性率的95%可 信区间为5.75%~11.87%。
18
四、率的u检验
应用条件??? (一)样本率与总体率的比较
u P (1 ) n
(二)两个样本率的比较
u
(三)四格表χ2检验的专用公式
2
(ad bc)2 n
(a b)(c d )(a c)(b d )
两组人群尿棕色素阳性率比较
组别
阳性数
阴性数
合计
铅中毒病人 对照组
29(a) 9(c)
7(b) 28(d)
36(a+b) 37(c+d)
合计
38(a+c)
35(b+d)
73(n)
阳性率(%) 80.56 24.32 52.05
P u / 2 SP
P 1.96SP P 2.58SP
17
例 在某地随机抽取329人,作血清登革热血凝抑制 抗体反应检验,结果29人阳性,估计该地人群血清登 革热血凝抑制抗体阳性率。
p 29 0.0881 329
SP
p(1 p) n
0.081(1 0.081) 0.0156 329

统计推断的基本解法

统计推断的基本解法

统计推断的基本解法统计推断是统计学的重要分支,用于从样本中推断总体特征。

在统计分析中,我们通常使用一些基础的解法来进行统计推断。

本文将介绍一些常用的基本解法。

点估计点估计是一种基本的统计推断方法,用于估计总体参数的值。

在点估计中,我们通过样本数据得到一个点估计量,作为总体参数的估计值。

例如,常见的点估计方法包括样本均值、样本方差和样本比例等。

区间估计区间估计是一种更精确的统计推断方法,用于估计总体参数的范围。

在区间估计中,我们通过样本数据得到一个区间估计量,包含了总体参数真值的可能范围。

例如,常见的区间估计方法包括置信区间和可信区间等。

假设检验假设检验是一种常用的统计推断方法,用于验证关于总体参数的假设。

在假设检验中,我们首先提出一个原假设和一个备择假设,然后使用样本数据来判断哪个假设更为合理。

例如,常见的假设检验方法包括单样本检验、双样本检验和方差分析等。

相关分析相关分析是一种用于研究变量之间关系的统计推断方法。

在相关分析中,我们通过计算相关系数来衡量变量之间的相关程度。

例如,常见的相关分析方法包括皮尔逊相关系数和斯皮尔曼相关系数等。

回归分析回归分析是一种用于预测和探索变量之间关系的统计推断方法。

在回归分析中,我们使用回归方程来建立变量之间的函数关系,并通过回归系数来解释这种关系。

例如,常见的回归分析方法包括线性回归和逻辑回归等。

综上所述,统计推断的基本解法包括点估计、区间估计、假设检验、相关分析和回归分析等。

这些方法在统计学领域中被广泛应用,帮助我们从样本中推断总体的特征和关系。

计数资料的统计描述

计数资料的统计描述

率同某期时可期能内发发生生某某现现象象的的观观察察单单位位总数数比例基数
式中比例基数,可以取100%、1000‰、 10万/10万…等。
常用的率有发病率、患病率、死亡率、 病死率、治愈率等。
例10-1 某医院1998年在某城区随机调查了 8589例60岁及以上老人,体检发现高血 压患者为2823例。
高血压患病率为: 2823 / 8589 100% = 32.87% 。
二、构成比(结构相对数)
构成比:表示事物内部某一部分的个体数 与该事物各部分个体数的总和之比,用 来说明各构成部分在总体中所占的比重 或位次。
通常以100%为比例基数。其计算公式为:
构成比
某一组成部分的观察单位数 同一事物各组成部分的观察单位总数
例10-2 某医院1990年和1998年住院病人死于五 种疾病的人数见表10-1。
表 10-1 某医院 1990 年和 1998 年住院病人五种疾病死亡人数和构成比
疾病构成
1990 年
1998 年
死亡人数 构成比(%)
死亡人数 构成比(%)
恶性肿瘤
58
30.53
40
26.85
循环系统疾病
44
23.16
﹡2、不能以构成比代替率
构成比是用以说明事物内部某种构成所 占比重或分布,并不说明某现象发生的 频率或强度。
统计描述是指选用适当的特征性统计指标
(即统计量)、合适的统计表、统计图正确地描
述资料的分布规律和数量特征。
计数资料的统计描述
常用相对数 应用相对数的注意事项 率的标准化法
一:常用相对数
计数资料常见的数据形式是绝对数,如某病的 出院人数、治愈人数、死亡人数等。
但绝对数通常不具有可比性:

第七章 计数资料的描述

第七章 计数资料的描述
平均发展速度是各环比发展速度的几何平均数,说 明某事物在一个较长时期中逐期(如逐年)平均发展 的程度。
平均增长速度是各环比增长速度的平均数,说明某事 物在一个较长时期中逐期平均增长的程度。
二、构成比(proportion)
概念:又称百分比(percentage),是指一事物内部某 一组成部分的观察单位数与该事物各组成部分的观察单 位总数之比,用以说明某一事物内部各组成部分所占的 比重或分布。
计算公式:
比 某一 组成部分的观察单位数 各 组组成 部分的观察单位总数
100 %
患病率=发病率 病程
发病率 病程 诊断水平 治疗水平 病死率 健康者、 病人流动
发病率

患病率

↙治愈率
病死率↘
患病率与发病率及病程的关系
影响患病率升高、降低的因素
患病率升高
新病例增加 未治愈者的寿命延长 病程延长 病例迁入 健康者迁出 易感者迁入 诊断水平提高 报告率提高
患病率降低
新病例减少 病死率增高 病程缩短 病例迁出 健康者迁入 治愈率提高
罹患率= 观察期间的新病例 K 同期暴露人口数
3.患病率(prevalence rate)
患病率:是指某特定时间内总人口中某病新旧病例所占的比例。
患病率= 某时间内某病病例数 K 该人群同期平均人口数
时点患病率和期间患病率 影响患病率升高和降低的因素 患病率与发病率、病程的关系
3.环比发展速度:以前一个时间的指标作基数,相邻的后一个指标 与之相比。
动态数列的两个要素: 时点或时期: t0 , t1 , t2 , , ti , tn 统计指标: a0 , a1, a2 ,, ai ,an
【例7-5】某医院2003年~2010年日门诊量的统计数据见

04计数资料的统计描述和统计推断64页PPT

04计数资料的统计描述和统计推断64页PPT
(5)对相对数进行统计推断
例2 1979年昌都5县14个农牧区40岁以上的1468人进行了 老年性白内障抽样调查,各年龄组的构成比和患病率见表。
表1 老年人白内障的年龄分布及患病率
年龄组 (1) 40~ 50~ 60~ 70~ ≥80 合计
受检人数 (2) 560 441 296 149 22 1468
呼吸系统疾病
37
19.47 29
19.46
消化系统疾病
19
10.00 18
12.08
传染病 合计
32
16.84 18
12.08
190
100.00 149 100.00
(三)相对比(relative ratio)
是两个相关联的指标之比。
相对 甲 乙 比指 指 (标 标 或 10% 0 )
说明: (1)式中甲乙两指标可以是绝对数、平均数或相对数; (2)式中甲乙两指标的性质可以相同,也可以是性质不同 。
常以100%为比例基数。
构成比 同一某事组物分各的组观 单 分察 位 的单 总 观 位 1数 0察 % 0数
例1 本班有学生40名,其中男生15名,女生25名。
性别构成比: 男生性别构成比:15/40×100%=37.5%; 女生性别构成比:25/40×100%=62.5%
例2 1979年昌都5县14个农牧区40岁以上的1468人进行了 老年性白内障抽样调查,各年龄组的构成比和患病率见表。
率可 实能 际发 发生 生该 某现 现 单 象 单 象 位 的 位 的 总 观 数 观 比 数 察 察 例基数
比例基数的选用一般依据习惯,使计算出来的率的结果 保留1-2位整数。
例1 某医院2019年在某城区随机调查了8589例60岁 及以上老人,体检发现高血压患者为2823例,求高血 压的患病率。

《医学统计学》习题解答(最佳选择题和简答题)

《医学统计学》习题解答(最佳选择题和简答题)

《医学统计学》习题解答(最佳选择题和简答题)孙振球主编.医学统计学习题解答. 第2版. 北京:人民卫生出版社2005目录第二章计量资料的统计描述 (2)第三章总体均数的估计与假设检验 (3)第四章多个样本均数比较的方差分析 (6)第五章计数资料的统计描述 (7)第六章二项分布与Poisson分布 (9)第七章χ2检验 (11)第八章秩和检验 (13)第九章回归与相关 (14)第十章统计表与统计图 (17)第十一章多因素试验资料的方差分析 (19)第十二章重复测量设计资料的方差分析 (19)第十五章多元线性回归分析 (20)第十六章logistic回归分析 (22)第十七章生存分析 (23)第二十五章医学科学研究设计概述 (26)第二十六章观察性研究设计 (26)第二十七章实验研究设计 (28)第二十七章临床试验研究设计 (29)第二章 计量资料的统计描述(注:题号上有“方框” 的简答题为基本概念,下同)第三章总体均数的估计与假设检验简答题:第四章多个样本均数比较的方差分析简答题:第五章计数资料的统计描述简答题:第六章二项分布与Poisson分布简答题:第七章χ2检验简答题:1. 说明χ2检验的用途2. 两个样本率比较的u检验与χ2检验有何异同?3. 对于四格表资料,如何正确选用检验方法?4. 说明行×列表资料χ2检验应注意的事项?5. 说明R×C表的分类及其检验方法的选择。

第八章秩和检验简答题:5. 两独立样本比较的Wilcoxon秩和检验,当n1>10或n2-n1>10时用u检验,这时检验是属于参数检验还是非参数检验,为什么?6. 随机区组设计多个样本比较的Friedman M 检验,备择假设H1如何写?为什么?第九章回归与相关简答题:第十章统计表与统计图简答题:5. 统计表与统计图有何联系和区别?6. 茎叶图与频数分布图相比有何区别,有何优点?第十一章多因素试验资料的方差分析一、简答题1. 简述析因试验与正交试验的联系与区别。

2012级临床专升本 统计学复习题

2012级临床专升本  统计学复习题

专升本统计复习题汇总目录:第一部分:统计绪论习题一、名解1、总体2、样本3、变量4、同质5、参数6、统计量7、误差8、小概率事件二、选择题1、若要通过样本作统计推断,样本应是A.总体中典型的一部分 B. 总体中任一部分C. 总体中随机抽取的一部分D. 总体中选取的有意义的一部分E. 总体中信息明确的一部分2、统计量A. 是统计总体数据得到的量B. 反映总体统计特征的量C. 是根据总体中的全部数据计算出的统计指标D. 是用参数估计出来的E. 是由样本数据计算出的统计量3、抽样误差是指A.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别C.由于抽样产生观察值之间的差别D.样本中每个个体之间的差别E.随机测量误差和过失误差的总称4、教材中提及美国人1954年实施了旨在评价索尔克(Salk)疫苗预防小儿麻痹或死于脊髓灰质炎效果的临床试验。

有180万儿童参与,约有1/4参与者得到了随机化。

这180万儿童是。

A.目标总体B.研究总体C.1份样本D. 1份随机样本E. 180万份样本上述试验最终肯定了索尔克疫苗的效果。

请问系结论是针对(E)而言。

A.180万儿童B.每个儿童C.所有使用索尔克疫苗的儿童D.所有儿童E.180万儿童中随机化的1/45、概率是描述某随机事件发生的可能性大小的数值,以下对概率的描述哪项是正确的A.其值的大小在0和1之间B.当样本含量n充分大时,我们有理由将频率近似为概率C.随机事件发生的概率小于0.05或0.01时,可认为在一次抽样中它不可能发生D.必然事件发生的概率为1E.其值必须由某一统计量对应的概率分布表中得到6、统计学中所说的总体是指A.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据时间划分的研究对象的全体D.根据人群划分的研究对象的全体E.根据地区划分的研究对象的全体三、是非题1、定量变量、分类变量和有序变量可以相互转换。

2、同质的个体间不存在变异。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

( 29 28 7 9) 2 73 2 23.12 36 37 38 35
32
(四) χ 2值的校正、四格表χ 2检验的条件
1. χ 2值的校正: 进行校正: 当1 T 5,而且N 40时,须对χ 2值
T 若未校正,X2=4.47,P <0.05 n 2 ( ad bc ) n 2 =3.03 查表得:P >0.05 2 (a b )(c d )(a c )(b d )
单侧 = 0.05
u
0.316 0.20 0.2 (1 0.2) 304
5.06
例2:为研究某地男女学生的肺吸虫感染率是否存在差别,某 研究者随机抽取该地80名男生和85名女生,查得感染人数男生 23人,女生13人。请作统计分析。 H0: 1 = 2 H1: 1≠ 2
P1 23 / 80 0.2875 u P2 13 / 85 0.1529 2.09 PC ( 23 13) /(80 85) 0.2182 0.2875 0.1529 0.2182 1 0.2182)(1 80 1 85) (
ቤተ መጻሕፍቲ ባይዱ10
第六章 二项分布(简介)
率的抽样分布
率的抽样误差与标准误 总体率的估计 两个率比较的u检验
14
一、率的抽样分布
从一个阳性率为π的总体中,随机抽取含量为
n的样本,则样本中阳性数X或阳性率p服从二项分
布( binomial distribution )。
n! X n X P( X ) (1 ) X !(n X )! X 0, 1, 2,, n
表 3.7 两种药物治疗脑动脉硬化的疗效
处理 胞磷胆碱组 脑益嗪组 合计 愈合 41(38.18) 18(20.82) 59 未愈合 3(5.82) 6(3.18) 9 合计 44 24 68 有效率(%) 93.18 75.00 86.76
2
( A T 0.5) 2
33
2.四格表χ 2检验的条件: (1)T 5,而且N 40 (2)1 T 5,而且N 40 (3)T 1 或N 40, 直接用2检验。 校正2检验。 不能用2检验。
X~B ( n、π)
15
16
二项分布的特点 (1)离散型
(2)当=1-=0.5时,两边对称;当≠0.5时,呈 偏态分布。 (3)当n增大,二项分布逐渐逼近正态分布
n和n(1-) 5,并且和(1-)均不接近于0时, 可近似看作正态分布。 未知时,np和n(1-p) 5,并且p和(1-p)均不 接近于0时,可近似看作正态分布。
第五章 计数资料的统计描述
温州医学院环境与公共卫生学院 叶晓蕾
1
一. 相对数的概念及计算:
相对数是分类资料的主要统计描述指标,便于比较。
例:
甲、乙两地发生麻疹流行,甲地患儿100人,乙地 患儿150人,何地较为严重? 若甲地易感儿童500人,而乙地易感儿童1000人。
甲地麻疹患病率为 100/500×100%=20%
男女各年龄组高血压病例分布 男 年龄组 20~ 30~ 40~ 50~ 60~ 合计 受检人数 病例数 发病率(%) 333 301 517 576 12 1739 5 4 64 93 12 178 1.5 1.3 12.4 16.2 100.0 10.2 1100 49 4.5 受检人数 712 142 185 61 女 病例数 发病率(%) 4 9 27 9 0.6 6.3 14.6 14.3
(二)例: 某研究室用甲、乙两种血清学方法检查410例确诊 的鼻咽癌患者,得结果如下,问两法检出率有无差别?
两种血清学检验结果 乙 甲法 + - 合计 + 261 8 269 法 - 110 31 141 合计 371 39 410
36
H0: 两法检出率相等 ,B = C H1: 两法检出率不等, B≠C = 0.05
χ2值大小除与 |A-T| 有关外,还取决于自由度ν。 ν=(R-1)(C-1) 不同自由度有不同的X2分布曲线 (3)确定P,作出统计推断结论:根据自由度ν查χ 2界值表, 确定P。本例ν=1,查表得P<0.005。按α =0.05 水准拒绝 H0,接受H1,可认为两总体阳性率不等,铅中毒病人有尿棕 色素增高现象。 29
阴性数 7 28 35
合计 36 37 73
阳性率 (%) 80.56 24.32 52.05
对照组 合计
27
(二) χ 2检验的基本思想及基本步骤
(1)H0: π 1= π 2 ,即两总体阳性率相等; H1: π 1≠π 2 ,即两总体阳性率不等; α =0.05 (2)求χ 2值: ( A T )2 2 Pe arson 2 值 T A 实 际 频 数 即 表 中 的4个 基 本 数 据 T - 理论频数 36 38 n R nC T11 18.74 TRC 73 n
乙地麻疹患病率为 150/1000×100%=15%
2
(一)率(rate)
说明某种现象发生的频率或强度。
A 某现象实际发生数 率 比例基数 K 可能发生该现象的总数 A A
K为比例基数,其确定原则为:
(1)习惯用法;
(2)保留1~2位整数。
3
(二)构成比(proportion) 说明某一事物内部各组成部分所占的比重或分布。
= 0.05
22
第七章 chi square test
2检验 χ
23
一、用途:
1.率或构成比的假设检验 2.两分类变量间的相关分析
3.其它
24
两个率比较
1、成组设计——四格表χ2检验或四格表确切概率法 2、配对设计——配对四格表χ2检验
多个率比较
两个或多个构成比比较 R×C表χ2检验
8
(二)疾病统计指标
该 期 间 新 发 生 的 某 病例 数 病 某病发病率 K 一 定 时 期 内 可 能 发 生病 的 平 均 人 口 数 某 某时点某病现患病例数 某病患病率 K 该时点受检人口数 因某病死亡人数 某病病死率 100% 同期某病病人数 治愈病人数 治 愈 率 100% 受治病人数
b c 40
b c 2 110 82 2
bc 110 8
88.17
ν =1,查表得P<0.005,按 = 0.05 水准,拒绝H0, 接受H1。可认为两法检出率不等,甲法检出率高于乙法。
37
四.行×列表资料的χ2检验
——多个样本率或构成比的比较
R×C表专用公式
A2 n n n 1 R C (一) 多个样本率的比较:
2
表 3.8 三种药物治疗高血压的疗效
处理 有效 无效 5 10 25 40 合计 40 30 32 102 有效率% 87.50 66.67 21.88 60.78 复方哌唑嗪 35 复方降压片 20 安慰剂 合计 7 62
本例
29 - 18.742 7 - 17.262 9 - 19.262 28 - 17.742 2
18.74 17.26 19.26 17.74
23.12
28
两组人群尿棕色素阳性率比较
组别 铅中毒病人 对照组 合计 阳性数 29(18.74) 9(19.26) 38 阴性数 7(17.26) 28(17.74) 35 合计 36 37 73 阳性率(%) 80.56 24.32 52.05
• 注意:上述条件是以理论数为依据,而非实际数。
34
三.配对资料2检验
(一)应用条件与计算公式
b c 40 b c 40
甲种属性 + - 合计
b c 2 2

2
b c 1
bc
- b d b+d
bc
2
乙种属性 + a c a+c
合计 a+b c+d n 35
9
抽样调查某企业2839名职工高血压病,结果如下表。据此,
某医生认为(1)该企业单位高血压发病率为8%,并随年龄递增, 其中40岁以上患者占全部病例的90.3%,60岁以上者发病率为 100%。(2)高血压发病与性别有关,男性为10.2%,女性为4.5%, 男性明显高于女性(P<0.01)。以上分析是否妥当,试加评述。
0.0881 1.96 0.0156 0.0575 ~ 0.1187 5.75% ~ 11.87%
故该地人群血清登革热血凝抑制抗体阳性率的95%可 信区间为5.75%~11.87%。
20
四、率的u检验
应用条件??? (一)样本率与总体率的比较
u
P
(1 ) n
X1 X 2 pc n1 n2
说明A是B的若干倍或百分之几。
A指 标 相 对 比 B指 标
常用的指标有三种:
对比指标:两个同类事物某种指标(绝对数,率或 其它指标)的比。如男女性比。
关系指标:两个有关的、但非同类事物的数量之比。 如医护人员与病床数之比。 计划完成指标:实际数与计划数之比。
5

6
二. 应用相对数时应注意的问题
(一)死亡统计指标
某年死亡总数 死 亡 率 10000 00 同年年平均人口数
某年某年龄组死亡人数 年龄别死亡率 10000 00 同 年 同 年 龄 年 平 均 人数 口 某年某病死亡人数 某病死亡专率 10000010万 同年年平均人口数 某年某类死因死亡人数 某类死因构成比 100% 同年死亡总人数
两个分类变量的关联性分析
25
二、四格表资料的χ 2检验
——两个样本率比较
(一)什么是四格表资料?
例:为了解铅中毒病人是否有尿棕色素增加现象, 分别对病人组和对照组的尿液作尿棕色素定性 检查,如表,问铅中毒病人与对照人群的尿棕 色素阳性率有无差别?
相关文档
最新文档