卫生统计学第八版李晓松数据的产生
卫生统计学第八版李晓松第十六章-卫生统计常用指标
(1)人口自然增长率 (2)总再生育率 (3)净再生育率
第一节 人口特征统计指标
第一节 人口特征统计指标
第二节 疾病统计指标
第二节 疾病统计指标
(一)疾病与死因分类
1. 国际疾病分类(International Classification of Diseases, ICD)
Npiii N
pi
第六节 率的标准化
(二)标准化率的计算
城市和农村居民年龄、性别标准化高血压患病率(%)
性别
(1) 男性
标准人口数 标准性
城市
(Ni) (2)
别构成 年龄标化患 预期患病率
(Ni / N) 病率(Pi) (Pi Ni / N)
(3)
(4)
(5)= (3) (4)
农村
年龄标化患 预期患病率
第五节 动态数列及其指标
动态数列是按时间将一组或几组统计指标排列起来,观察其随时间的变 化趋势。动态数列可计算其相应的指标: (1)绝对增长量
表示指标在一定时期增长的绝对值,可分为累计增长量和逐年增长量。累计增 长量是某年指标与基线指标之差。逐年增长量是某年指标与前一年指标之差。
(2)定基发展速度与增长速度
第二节 疾病统计指标
(二)疾病常用统计指标
第二节 疾病统计指标
(二)疾病常用统计指标
例5 2014年在某省对常住成年人群进行慢性病抽样调查:A市调查检查了11 092人, 其中高血压患者人数为2548人;B市调查检查了15 680人,有高血压患者7810人。两 个城市的高血压患病率为多少?
A市高血压患病率 =2548/11092×100% =22.97% B市高血压患病率 =4810/15680×100% =30.68%
卫生统计学第八版重点
卫生统计学第八版重点1、统计工作的基本步骤:统计工作全过程可分为:统计设计、搜集资料、整理资料和分析资料四个步骤。
2、卫生统计资料一般分为计量资料与计数资料两大类,介于其中的还有等级资料,不同类型的资料应采用不同的分析方法。
因此,搞清楚下面的定义对以后学习具体的统计方法很重要。
①计量资料:对每个观察单位的各样项指标用定量的方法,通过测量得到的数值,我们把这样的资料称为计量资料,一般有度量衡等单位。
如调查某地10岁女童的身体发育状况,以人为观察单位,每个人的身高(cm)、体重(kg)和血压(mmHg)等;又如以每个采样点为观察单位,测得不同采样点的二氧化碳浓度(mg/L)。
②计数资料:先将观察单位按某种属性或类别分组,然后清点所得各组的观察单位数,称为计数资料。
例如对某小学全体学生进行蛔虫卵粪检,每个学生是一个观察单位,将每个学生按粪检结果阳性与阴性分组,得每组人数;又如调查某人群的血型分布,按A、B、AB、O四型分组,得各血型组的人数。
③等级资料:将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。
例如用某药治疗若干痢疾病人,其中治愈、显效、有效、无效人数。
这类资料与计数资料不同的是:属性的分组有程度的差别,各组按大小顺序排列;与计量资料不同的是:每个观察单位未确切定量,因而称为半计量资料。
对分辨计量资料和计数资料,原则上并不困难。
通常凡是用仪器测得的数据都是计量资料,如身高、体重、肺活量、红细胞数、白细胞数、等属计量资料。
通常按性质、类别分组后清点得到的数目,如男性人数、女性人数,阳性人数,阴性人数,对动物实验的各种结果的例数等都是计数资料。
按等级分组资料不难确认,凡是按程度不同分多个组后清点数目,一般都属等级资料了。
3、卫生统计学:是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学。
4、抽样误差:有个体变异产生的,抽样造成的样本统计量与总体参数之间的差异,称之。
卫生统计学 第八版(李晓松)习题解答03
阳性率的比较: 2 5.10 。请讨论:该医生的统计处理是否正确?若否,请分析
原因并加以修正。
答:不正确,在对 P53 阳性率差异性就行检验的时候,表格理论频数出现 1<T<5 的情况,故应该采用连续用校正公式计算卡方值( 2=0.012,p>0.05)。
7. 什么是非参数检验?与参数检验相比,非参数检验有哪些优点? 答:不依赖于总体分布类型,也不对参数进行推断,而是对总体分布进行分析 的假设检验方法。与参数检验相比,非参数检验对资料要求低,适用范围广,计算 过程相对简单。
18. 生存数据分析的基本内容是什么?分析方法有哪些? 答:基本内容: (1)描述生存时间的分布特点。通过生存时间和生存结局的数据估计平均存 活时间及生存率,绘制生存曲线,根据生存曲线分析其生存特点等。例如上例中肾 上腺皮质癌研究所绘制的生存率曲线可提供预期治疗价值评估信息。 (2)比较生存曲线。通过相应的假设检验方法对不同样本的生存曲线进行比 较,以推断各总体的生存状况是否存在差别,比较不同治疗方法预后效果的差异。 例如本研究比较手术治疗和药物治疗肾上腺皮质癌患者的生存曲线,以推断两种疗 法的效果优劣。 (3)分析影响生存状况的因素。通过生存分析模型来探讨影响生存状况的因 素,通常以生存时间和结局作为因变量,而将可能的影响因素作为自变量,比如年 龄、性别、病理分型、临床分期、治疗方式等。通过拟合生存分析模型,筛选具有 统计学意义的生存状况的影响因素。 分析方法: (1)生存曲线的估计常用的方法有 Kaplan-Meier 法和寿命表法。 (2)生存曲线的比较常用的方法有 log-rank 检验。 (3)分析影响生存状况的因素的方法有 Cox 回归模型。
5. 某职业病防治院希望了解矽肺不同分期患者的胸部平片密度是否存在差异,
卫生统计学第八版李晓松第三章数据的产生
第二节 随机对照试验
(一)设计原则
3. 重复(repeat)
(1)每组只有一个试验对象,那么试验结果可能只依赖于具有这类潜在 特质的人被分到了哪个组,但是,如果试验对象足够多,这类人的效应就 能够被平均化,两组的区别就会减少。 (2)重复思想:运用足够多的样本来降低试验的随机误差。
第二节 随机对照试验
第五节 伦理问题
(一)知情同意与个人隐私
1. 知情同意 受试者在参与试验前需充分了解研究的性质和任何潜在风险。 2. 国际医学委员会建议使用下面的方法
(1)对在社区水平上进行的研究,需征得对此试验负责的卫生行政部门的知情同意。 (2)以医院为研究单位时,应当获得当地伦理审查委员会的同意。 (3)当研究单位是学校、工作场所或社区时,应征得有关负责人的同意;同时,尽 可能告知社区民众该试验的研究目的、预期收益和可能的不方便或危险,并告知不同 意的人如何免受干预措施的影响。
第四节 样本的可靠性与代表性
(一)抽样分布
1. 变量的总体分布 总体中所有个体观测值的分布。 2. 统计量抽样分布 统计量的分布规律,描述了从同一总体重复抽样时,统计 量会有些什么样的值,以及每个值出现的可能性大小。
例3 某环境监测点2015年1月1日至2月28日对每小时PM10浓度值进行监测。 图 (A)采用某环 图 (B) 从这个总体中随机抽样(每次样本量为50),共抽取100次得到的100个样本均 数的分布。
卫生统计学
第三章 数据的产生
夏结来
第四军医大学
目录
01 02
03 04 05
第一节:数据的来源 第二节:随机对照试验 第三节:简单随机抽样 第四节:抽样的可靠性与代表性 第五节:伦理问题
重点难点
卫生统计学第八版李晓松第一章 数据分布的描述
组段 (1) 10~ 20~ 30~ 40~ 50~ 60~ 70~ 80~ 90~100 合计
频数 (2) 2 4 11 25 29 25 14 6 2 118
频率(%) (3) 1.69 3.39 9.33 21.19 24.58 21.19 11.86 5.08 1.69 100.00
累计频数 (4) 2 6 17 42 71 96 110 116 118 —
第一节 数据分布表与直方图
(三)数据分布特征
分布形态图示:
成都市238名正常居民发汞值分布直方图
第一节 数据分布表与直方图
(三)数据分布特征
分布形态图示:
冠心病患者的年龄分布直方图
第一节 数据分布表与直方图
(三)数据分布特征
2. 集中趋势和离散趋势的描述
(1)集中趋势(central tendency):指一组数据向某一中心值靠拢的趋势,反映 了一组数据中心点的位置,是频数分布表和直方图中高峰所在位置,即频数最 大的组段。 (2)离散趋势(dispersion tendency):部分数据偏离中心位置的变异特征。
集中位置 几何均数
中位数 极差 变异程度 四分位间距 方差/标准差 变异系数
第四节 箱式图
第四节 箱式图
(一)箱式图
1. 表示中位数的横线在箱体中间位置 则表明数据呈对称分布。 2. 中间横线靠下端则提示右偏态分布。 3. 中间横线靠上端则提示左偏态分布。
15例大骨节病患者白细胞数箱式图
第四节 箱式图
1
抗体滴度倒数的对数和 (5)=(2)×(4) 424.86 284.48 242.34 135.66 328.90 1416.24
fi ln xMi 1 1416.24 G ln = ln =223 n 262
卫生统计学第八版李晓松第十七章 寿命表
第四节 健康期望寿命表
第四节 健康期望寿命表
同时考虑年龄组死亡率与年龄组患病率,良好健康状况下的期望寿命即为健康期望寿命 (healthy life expectancy,HALE) 。
1964年Sanders首次提出健康期望寿命的概念,1971年Sullivan提出编制健康期望寿命表的 方法,称为Sullivan方法。
第一节 寿命表的概念与计算方法
期望寿命既可综合反映各年龄组的死亡水平,又能以期望寿命的长短 表明人群的健康水平,它是社会、经济、文化和卫生发展水平的综合体现。 通过期望寿命的比较,可以衡量不同地区或国家人群的健康水平,这是不 同国家、不同时期健康水平进行比较的最常用指标。
据2015年《中国卫生和计划生育统计年鉴》报告,我国1990年、2000 年、2005年和2010年的期望寿命分别为68.6岁、71.4岁、73.0岁和74.8岁, 反映了我国卫生事业和社会经济发展迅速。
出 生 期 望 寿 命 life e0 即“0~岁”组的期望寿命。一定死亡率下同时出生的一代人
expectancy at birth
的未来平均存活年数
第一节 寿命表的概念与计算方法
编制原理 期望寿命本质上就是令假想的人口数根据当地各年龄组的
实际死亡率来死亡时,同年龄人的平均余寿。因此,现时寿命 表相当于进行标准化,有关的计算与标准化法类似。只要知道 各年龄组的平均人口数和死亡数即可编制寿命表。
第五节 寿命表相关指标的分析与应用
第五节 寿命表相关指标的分析与应用
表 17-7 中国和全球不同 SDI 国家的出生期望寿命与出生健康期望寿命(岁)
2005 年
地区
女
男
2015 年
女
男
(整理)《卫生统计学》第一次作业及答案
(整理)《卫生统计学》第一次作业及答案【补充选择题】A型题1.统计资料的类型可以分为A 定量资料和等级资料B 分类资料和等级资料C 正态分布资料和离散分布的资料D 定量资料和分类资料E 二项分布资料和有序分类资料2.下列符号中表示参数的为A SB uCD tE X3.统计学上所说的随机事件发生的概率P,其取值范围为A P≤1B P≥1C P≥0D1≥P≥0E1>P>04.小概率事件在统计学上的含义是A 指的是发生概率P≤0.5的随机事件B 指一次实验或者观察中绝对不发生的事件C 在一次实验或者观察中发生的可能性很小的事件,一般指P≤0.05D 以上说法均不正确E A和C正确5.描述定量资料集中趋势的指标有A 均数、几何均数、变异系数B 均数、几何均数、四分位数间距C 均数、变异系数、几何均数D 均数、四分位数间距、变异系数E 均数、几何均数、中位数6.关于频数表的说法正确的是A 都分为10个组段B 每一个组段必须组距相等C 从频数表中可以初步看出资料的频数分布类型D 不是连续型的资料没有办法编制频数表E 频数表中的每一个组段不一定是半开半闭的区间,可以任意指定7. 关于偏态分布资料说法不正确的是A正偏态资料的频数分布集中位置偏向数值大的一侧B负偏态资料的频数分布集中位置偏向数值大的一侧C 偏态分布资料频数分布左右不对称D 不宜用均数描述其集中趋势E 不宜用变异系数来描述其离散程度8. 对于一个两端都没有确切值的资料,宜用下列哪个指标来描述其集中趋势A 几何均数B 均数C 方差D 中位数E 四分位数间距9.下列关于标准差的说法中哪种是错误的A 对于同一个资料,其标准差一定小于均数B 标准差一定大于0C 同一个资料的标准差可能大于均数,也可能小于均数D 标准差可以用来描述正态分布资料的离散程度E 如果资料中观察值是有单位的,那么标准差一定有相同单位10. 下列关于标准差S和样本含量n的说法,正确的是A 同一个资料,其他条件固定不变,随着n增大,S一定减小B 同一个资料,即使其他条件固定不变,随着n增大,也不能确定S一定减小C 同一个资料,其他条件固定不变,随着n增大,S一定增大D 以上说法均正确E 以上说法均错误11. 用下列哪两个指标可以较全面地描述正态分布特征A 均数和中位数B 中位数和方差C 均数和四分位数间距D 均数和标准差E 几何均数和标准差12. 下列哪个资料适宜用几何均数来描述其集中趋势A 偏态分布的资料B 对称分布的资料C 等比级数资料D 一端不确定的资料E 正态分布资料13. 下列关于变异系数的说法,错误的是A 与标准差一样都是用来描述资料变异程度的指标,都有单位B 可以比较计量单位不同的几组资料的离散程度C 可以比较均数相差悬殊的几组资料的离散程度D 变异系数的实质是同一个资料的标准差与均数的比值E 变异系数可以用来描述正态分布资料的变异程度14. 假设将一个正态分布的资料所有的原始数据都加上一个正数,下列说法正确的是A 均数将增大,标准差不改变B 均数和标准差均增大C 均数不变,标准差增大E 均数和标准差均没有变化15. 假设将一个正态分布的资料所有的原始数据都乘以一个大于1的常数,下列说法正确的是A 均数不发生改变B 标准差将不发生改变C 均数是否变化不一定D 变异系数不发生改变E 中位数不发生改变16. 下列关于正态分布曲线的两个参数μ和σ说法正确的是A μ和σ越接近于0时,曲线越扁平B 曲线形状只与μ有关,μ值越大,曲线越扁平C 曲线形状只与σ有关,σ值越大,曲线越扁平D 曲线形状与两者均无关,绘图者可以随意画E 以上说法均不正确17. 对于正态分布曲线的描述正确的是A 当σ不变时,随着μ增大,曲线向右移B 当σ不变时,随着μ增大,曲线向左移C 当μ不变时,随着σ增大,曲线向右移D 当μ不变时,随着σ增大,曲线将没有变化E 以上说法均不正确18. 在正态曲线下,下列关于μ-1.645σ说法正确的是A μ-1.645σ到曲线对称轴的面积为90%B μ-1.645σ到曲线对称轴的面积为10%C μ-1.645σ到曲线对称轴的面积为5%D μ-1.645σ到曲线对称轴的面积为45%E μ-1.645σ到曲线对称轴的面积为47.5%19. 在正态曲线下,小于μ-2.58σ包含的面积为A 1%B 99%D 0.05%E 99.5%20. 在正态曲线下,大于μ-2.58σ包含的面积为A 1%B 99%C 0.5%D 0.05%E 99.5%21. 下列关于标准正态分布的说法中错误的是A 标准正态分布曲线下总面积为1B 标准正态分布是μ=0并且σ=1的正态分布C 任何一种资料只要通过σμ-=X u 变换均能变成标准正态分布D 标准正态分布的曲线是唯一的E 因为标准正态分布是对称分布,所以u ≥-1.96与u ≤1.96所对应的曲线下面积相等22. 某年某中学体检,测得100名高一女生的平均身高X =154cm, S =6.6cm ,该校高一女生中身高在143~170cm 者所占比重为(0.00780.04752.42, 1.67u u =-=-)A 90%B 95%C 97.5%D 94.5%E 99%23. 下列关于确定正常人肺活量参考值范围说法正确的是A 只能为单侧,并且只有上限B 只能为单侧,并且只有下限C 只能为双侧,这样才能反映全面D 单双侧都可以E 以上说法均不确切24. 下列关于医学参考值范围的说法中正确的是A 医学参考值范围是根据大部分“健康人”的某项指标制定的B 医学参考值范围的制定方法不受分布资料类型的限制C 在制定医学参考值范围时,最好用95%范围,因为这个范围最能说明医学问题D 在制定医学参考值范围时,最好用95%范围,因为这样比较好计算E 以上说法均不正确25. 为了制定尿铅的正常值范围,测定了一批正常人的尿铅含量,下列哪种说法正确A 无法制定,要制定正常值范围必须测定健康人的尿铅含量B 可以制定,应为单侧上限C 可以制定,应为单侧下限D 可以制定,但是无法确定是上侧范围还是下侧范围E 可以制定双侧95%的参考值范围B型题26~30题A 中位数B 四分位数间距C 均数D 几何均数E 对数标准差的反对数26. 对于只有上限不知道下限的资料,欲描述其集中趋势宜用(A)27. 某学校测定了大学一年级新生乙肝疫苗的抗体滴度,欲描述其集中位置,宜用(D)28. 描述偏态资料的离散程度,可用(B)29. 描述近似正态分布的资料的集中趋势,最适宜用(C)30. 偏态分布的资料,如果经对数变换后服从正态分布,那么欲描述其离散程度,应选用(E)【补充选择题】A 型题1. X S 表示A 样本中实测值与总体均数之差B 样本均数与总体均数之差C 样本的抽样误差D 样本中各实测值分布的离散情况E 以上都不是2. 标准误越小,说明此次抽样所得样本均数A 离散程度越小B 可比性越好C 可靠程度越小D 系统误差越小E 抽样误差越小3. 对样本均数X 作t 变换的是A X X S μ-B XX μσ- C X μσ- D X μσ- E X X X S - 4. t 分布与正态分布的关系是A 均以0为中心,左右对称B 总体均数增大时,分布曲线的中心位置均向右移动C 曲线下两端5%面积对应的分位点均是±1.96D 随样本含量的增大,t 分布逼近标准正态分布E 样本含量无限增大时,二者分布完全一致5. 标准差与标准误的关系中,正确的是A 二者均反映抽样误差的大小B 总体标准差不变时,增大样本例数可以减小标准误C 总体标准差增大时,总体的标准误也增大D 样本例数增大时,样本的标准差和标准误都会减小E 标准差用于计算可信区间,标准误用于计算参考值范围6. 下列哪个说法是统计推断的内容A 区间估计和点估计B 参数估计与假设检验C 统计预测和统计控制D 统计描述和统计图表E 参数估计和统计预测7. 可信区间估计时可信度是指A αB βC 1α-D 1β-E 以上均不是8. σ未知且n 很小时,总体均数的95%可信区间估计的通式为A 1.96X S ±B 1.96X X S ±C 1.96X X σ±D 0.05/2,X X t S ν±E 0.05/2,X t S ν±9. 关于假设检验,下列说法正确的是A 备择假设用H 0表示B 检验水准的符号为βC P 可以事先确定D 一定要计算检验统计量E 假设检验是针对总体的特征进行10. 两样本均数比较的t 检验,差别有统计学意义时,P 越小A 说明两总体均数差别越大B 说明两样本均数差别越大C 越有理由认为两总体均数不同D 越有理由认为两样本均数不同E 犯I 型错误的可能性越大11. 方差齐性检验时,检验水准取下列哪个时,II 型错误最小B 0.10α=C 0.05α=D 0.02α=E 0.01α=12. 假设检验的一般步骤中不包括哪项A 建立检验假设,确定检验水准B 对总体参数的可信区间作出估计C 选定检验方法,计算检验统计量D 确定P 值,作出统计推断结论E 直接计算P 值13. 假设检验时,应该使用单侧检验却误用了双侧检验,可导致A 增大了I 型错误B 增大了II 型错误C 减小了可信度D 增大了把握度E 统计结论更准确14. 假设检验中,P 与α的关系是A P 越大,α越大B P 越小,α越大C 二者均可事先确定D 二者均需通过计算确定E P 值的大小与α的大小无关15. 假设检验在设计时应确定的是A 总体参数B 检验统计量C 检验水准D P 值E 以上均不是16. 计量资料配对t 检验的无效假设(双侧检验)可写为B 0d μ≠C 12μμ=D 12μμ≠E 0μμ=17. II 型错误是指A 拒绝了实际上成立的H 0B 不拒绝实际上成立的H 0C 拒绝实际上不成立的H 0D 不拒绝实际上不成立的H 0E 拒绝H 0时所犯的错误18. 下列关于I 型错误和II 型错误说法不正确的是A I 型错误的概率用α表示B II 型错误的概率用β表示C 样本量固定时,I 型错误的概率越大,II 型错误的概率也越大D 样本量固定时,I 型错误的概率越大,II 型错误的概率越小E 要同时减小I 型错误和II 型错误的概率,需增大样本量19. 不适用于正态分布计量资料的假设检验的统计量是A tB uC FD 'tE T20. 完全随机设计的方差分析中,成立的是A SS 组内 < SS 组间B MS 组内 < MS 组间C MS 组间 >1D SS 总=SS 组间+SS 组内E MS总=MS组间+MS组内21. 随机区组设计方差分析中,成立的是A SS总=SS组间+SS组内B SS总=SS组间+SS区组C SS总=SS组间+SS区组+SS误差D SS总=SS组间-SS组内E SS总=SS区组+SS误差22. 成组设计方差分析,若处理因素无作用,则理论上有A F=1B F<1C F>1D F=0E F<1.9623. 方差分析中,组间变异主要反映A 随机误差B 抽样误差C 测量误差D 个体差异E 处理因素的作用24. 完全随机设计的方差分析中,组内变异反映的是A 随机误差B 抽样误差C 测量误差D 个体差异E 系统误差25. 多组均数的两两比较中,若用t检验不用q检验,则A 会将有差别的总体判断为无差别的概率增大B 会将无差别的总体判断为有差别的概率增大C 结果更加合理D 结果会一致E 以上都不对26. 随机区组方差分析中,总例数为N,处理组数为k,配伍组数b,则处理组组间变异的自由度为A N-kB b-1C (b-1)(k-1)D k-1E N-127. 关于检验效能,下列说法错误的是A 两总体均数确有差别时,按α水准发现这种差别的能力B 两总体均数确有差别时,按1β-水准发现这种差别的能力C 与α有关D 与样本例数有关E 与两总体均数间的位置有关28. 为研究新旧两种仪器测量血生化指标的差异,分别用这两台仪器测量同一批样品,则统计检验方法应用A 成组设计t 检验B 成组设计u 检验C 配对设计t 检验D 配对设计u 检验E 配对设计2χ检验29. 两样本均数比较的t 检验,t =1.20,0.05α=时统计推断结论为A 两样本均数的差别有统计学意义B 两样本均数的差别无统计学意义C 两总体均数的差别有统计学意义D 两总体均数的差别无统计学意义E 未给出自由度,无法进行统计推断30. 两大样本均数比较,推断12μμ=是否成立,可用A t 检验B u 检验C 方差分析D 以上三种均可以E 2χ检验31~35题某药物研究中心为研究减肥药的效果,将40只体重接近的雄性大白鼠随机分为4组,分别给予高剂量、中剂量、低剂量减肥药和空白对照4种处理方式,两个月后对这些大白鼠的体重进行了测定31. 上述资料所用的设计方法为A 完全随机设计B 随机区组设计C 交叉设计D 析因设计E 序贯试验32. 比较四组大白鼠的体重有无差别,宜用A 两两比较的 t 检验B 两两比较的u 检验C 方差分析D 2χ检验E 直线回归33. 比较四组大白鼠的体重有无差别,无效假设为A 12μμ=B 1234μμμμ===C 0μμ=D 12ππ=E 0d μ=34. 若规定0.05α=,方差分析得P <0.01,则A 各总体均数不同或不全相同B 各样本均数不同或不全相同C 各总体均数均不相同D 各样本均数均不相同E 四组总体均数的差别很大35. 为比较各剂量组与空白对照组间的差别,宜用A LSD 法B SNK 法C 新复极差法D 两两t 检验E 两两u 检验B 型题36~40题A μB σC X σD νE 以上均不是36. 决定t分布位置的是(E)37. 决定t分布形态的是(D)38. 决定正态分布位置的是(A)39. 决定正态分布形状的是(B)40. 反映抽样误差大小的是(C)41~45题A 样本均数与总体均数的t检验B 配对t检验C 成组t检验D 成组u检验E 以上都不是41. A地150名7岁女童与B地150名7岁女童的体重均数差别的检验,为简便计算,可选用(D)42. A地20名7岁女童与B地20名7岁女童的体重均数差别的检验用(C)43. A地15名7岁女童服用某保健品前后体重的变化的检验用(B)44. 检验B地70名7岁女童的体重是否服从正态分布用(E)45. B地20名女童的体重均数与同年人口普查得到的全国7岁女童的体重均数比较用(A)46~50题A SS总=SS组间+SS组内B SS总=SS处理+SS区组+SS误差C SS总=SS A+SS B+SS AB+SS误差D SS总=SS阶段+SS处理+SS个体+SS误差E 以上均不是46. 析因设计方差分析总变异的分解为(C)47. 完全随机设计方差分析总变异的分解为(A)48. 交叉设计方差分析总变异的分解为(D)49. 随机区组设计方差分析总变异的分解为(B)50. 重复测量方差分析总变异的分解为(E)。
2022年江南大学公共卫生与预防医学专业考研备考成功经验必看分享
2022年江南大学公共卫生与预防医学专业考研备考成功经验必看分享一、择校对于想考名校的同学而言,我觉得选择与规划可能会比努力更重要,大家都知道上名校如北大、清华等985名校热门专业不努力是不行的,但是往往只有努力也是远远不够的。
个人觉得在复习上我在自我规划和信息战上还是有些心得的,下面是自己的经验,主要是初试的备考经验及技巧,希望能对大家有所帮助。
考研首先最主要的是择校,如果你的本科学校已经足够优秀到令你满意,那么考本校毫无疑问是最稳妥的一种选择。
关于历年录取分数线及报录比等信息在院校的招生信息网都是可查的,考研用教材甚至历年真题也能在信息网上查到,查不到的可以去“考研文库”搜。
考研文库是新祥旭考研辅导机构旗下的一个针对考研考博人的平台,真题资料、报录比、经验贴等等这个信息比较齐全。
二、专业信息所属院校:江南大学招生类别:全日制研究生所属学院:无锡医学院所属门类代码、名称:[10]医学所属一级学科代码、名称:[04]公共卫生与预防医学招生人数:16初试科目:①101思想政治理论②201英语一③353 卫生综合复试科目:公共卫生综合同等学力加试科目:1.病理生理学 2.医学信息学三、初试备考经验英语一复习过程:A、大学六级过后我就没怎么碰过英语,这次捡起来。
就先从最基础的开始复习吧,《高中英语基础知识手册》很不错,看完之后唤起了我对英语语法的记忆。
这个能为阅读理解打好基础,帮助分析长句难句;B、我的整个英语复习都是围绕真题来进行的,我从95年做到了11年,重点在近5年的,前几年的当练习。
我把近几年的完形填空、阅读理解做完之后都一句一句地分析,并且翻译过来,这个过程对提高阅读能力、翻译能力真的很有帮助。
另外我很讨厌一个一个单词枯燥的背诵,从来没有背过词典,因为记不住啊,我喜欢通过文章来提升词汇量。
这里隆重推荐郭崇兴老师的《考研英语历年真题阅读理解精读笔记》,这本书最突出的就是每篇阅读理解后都有生词表,最重要的是词汇量非常丰富,节省不少查单词的时间。
卫生统计学第八版李晓松第十五章 实验研究设计
病因之一的假说。
第一节 实验设计的基本内容与原则
(一)研究目的
2. 确定研究目的 科学研究就是提出假说和验证假说的过程,实验研究设计的实质是说明如何 验证假说。将研究假说具体化即为研究目的。 确定研究目的要明确研究主要目的和次要目的及其实际价值。 主要目的就是研究的主要问题,次要目的是需要进一步补充和完善研究的结 果。注意研究目的需具体明确。
第一节 实验设计的基本内容与原则
(三)处理因素
(2)根据处理因素与水平的不同,可将实验研究分为两类: ① 单因素多水平 :实验只有 1 个处理因素,处理因素的水平数大于 1 。如比较不同 DON注射剂量组新西兰家兔膝关节软骨和滑膜的形态学改变的研究中,设1个DON剂量 组和1个生理盐水对照组,这属于单因素两水平。如设2个DON剂量组和1个生理盐水对 照组,则属于单因素三水平。 ②多因素多水平:实验同时有多个处理因素,每个处理因素均有多于1个水平。如在 比较不同DON剂量组新西兰家兔膝关节软骨和滑膜的形态学改变的研究中,有2个处理 因素即DON注射和染毒方式,DON剂量为0.05μg/g、0.10μg/g 2个水平,染毒方式有注射 和灌胃2个水平。
联系这一假说。 (2)研究假说二:吸烟和工业污染是公认的肺癌病因,中国西部农业小镇宣威的肺癌发
病率在全世界位居第一,但已有研究表明这两种因素对宣威地区肺癌发生影响不大。宣威
地区烟煤量丰富,当地农村居民长年习惯在室内烧烟煤取暖做饭,但烧煤的火塘没有进风 口和烟囱,从而造成室内严重空气污染,由此提出烧烟煤引起的室内空气严重污染是肺癌
第一节 实验设计的基本内容与原则
(二)实验对象
1. 基本概念
实验对象(experiment subject)是接受处理因素作用的基本单位,亦称研究对象。
卫生统计学第八版李晓松第十章基于秩的非参数检验
第一节 配对样本的比较
(一)单样本数据的符号秩和检验
基本思想 1.假设样本所对应的总体中位数与给定的总体中位数相同,H0:M1 = M0。 2.计算样本中所有数值与给定中位数的差值,根据所有差值绝对值进行编 秩,得到正差值的秩和R+和负差值的秩和R-。
n(n +1) 3.若H0成立,理论上,R+与R-的总体均数应相等,等于: R ,总体 4 n(n 1)(2n 1) 标准差也应相等,等于: R 。 24 4.若R+与R-相差悬殊,均远离M0,则有理由拒绝H0 。具体通过R+ 或R- 的
第二节 两组独立样本的比较
(一)两组定量数据的比较
12岁男童与女童发样中Ca含量(μg/g)的比较 男童 Ca含量(1) 秩(2) 1843 18 383 4 406 5 334 1 443 6 676 11 771 13 358 3 607 9 484 7 n1=10 R1=77 女童 Ca含量(3) 秩(4) 842 14 336 2 742 12 1367 15 1623 16 597 8 1976 19 1818 17 643 10 4534 20 n2=10 R2=133
第一节 配对样本的比较
(二)配对样本数据的符号秩和检验
检验步骤
(1) 建立检验假设,确定检验水准 H0:差值的总体中位数等于0, Md = 0 H1:差值的总体中位数不等于0, Md ≠ 0
=0.05
(2) 求差值、编秩、求秩和
首先计算每对数据的差值,并对差值进行编秩。分别计算正、负差
值的秩和,得出 R+与R- ,如表所示。
第二节 两组独立样本的比较
(一)两组定量数据的比较
基本思想
卫生统计学第八版李晓松第十四章 调查研究设计
55%。现在估计分层随机抽样所需样本量。
第二节 基本的概率抽样方法及其样本量估计
(四)分层随机抽样
(1)按总体均数估计:
若仍以 ε =0.02,置信水平为 1-α,则样本量为: 按比例分到2个地区: 可见,欲调查平均血清硒含量,两个地区分别至少需要调查103和89名居民。
第二节 基本的概率抽样方法及其样本量估计
第一节 调查设计的基本内容
(六)数据整理分析计划
1. 问卷核查
(1)完整性核查 (2)逻辑检查
2. 数据编码
(1)包括事前编码和事后编码 (2)需要按照统一规则进行编码 (3)将编码信息制定成编码手册
第一节 调查设计的基本内容
(六)数据整理分析计划
3. 数据录入
(1)使用FoxPro、Excel、Epidata 等建立数据库结构 (2)对数据录入员提供统一录入说明,双录入 (3)数据录入完毕后,应作抽查或全面核查
(四)分层随机抽样
(2)按总体率估计,首先粗略估计总的频率: 若仍以 ε =0.02,置信水平为 ,则样本量为:
按比例分配,则两个地区需抽取的居民人数分别为:
可见,欲调查患大骨节病居民所占百分比,两个地区分别至少需要调查286和
246名居民。
例3拟通过同一项调查达到两个目的,两个地区该调查的最小样本量应取 (103,286)和(89,246)的最大值,即分别最少需调查286和246名居民。
第一节 调查设计的基本内容
(三)调查方法与调查项目
1. 调查方法和调查项目
(1)根据调查目的、调查对象和具备的调查条件确定调查方法
(2)根据调查指标确定调查项目
2. 调查方式
(1)观察法
(2)问卷法
(3)访谈法
卫生统计学第八版李晓松第八章 多个均数比较的方差分析
第八章
多个均数比较的方差分析
尹 平 华中科技大学
曹明芹
新疆医科大学
目录
01 02
第一节:完全随机设计的方差分析
第二节:随机区组设计的方差分析 第三节:多个样本均数间的多重比较
03
05
重点难点
※ 方差分析的基本思想 ※ 完全随机设计方差分析总变异的分解方法 ※ 方差分析的应用条件 ※ 随机区组设计方差总变异的分解方法
第三节 多个样本均数间的多重比较
(三) Bonferroni法
x A xB t s x A xB
x A xB
MS (
误差
1 n
A
1 n
B
误差
)
小结
1. 方差分析常用于多个均数的比较,它与研究目的和设计类型联系在一起, 衍生为单因素和多因素方差分析,应用十分广泛。
2. 方差分析的基本思想: 根据研究目的和设计类型,将全部数据的总变异进行
DON 在 大 骨 节 病 发 病 中 的 作 用 机 制 , 将 24 只 20 日 龄 、 初 始 体 重 为 (90.3±7.8)g 的 健 康 Wistar 幼鼠完全随机地分配至对照(零剂量)组、 DON 低剂量组和高剂量组,每组 8 只, 每两天灌胃染毒 1 次。高、低剂量组分别给予 0.25μg/g 、 0.06 μg/g 的 DON ,对照组给予相 同容量生理盐水灌胃,连续 80 天后,采用免疫组化法检测小鼠软骨内 Ⅱ 型胶原含量。以 IOD(integrated optical density) 值表示 Ⅱ 型胶原的相对含量( Ⅱ 型胶原含量反映软骨细胞 和成骨细胞成熟状况,含量降低提示关节软骨损伤)。实验结果数据见表 8-1 ,试分析 DON对关节软骨代谢是否存在影响。
卫生统计学第八版李晓松第十三章 多重回归分析简介
i 1
n
yi i
(1 i )
1 yi
对似然函数取对数后,用Newton-Raphson迭代方法获得参数的估计值及其标准误。
第二节 logistic回归
2. OR 值的置信区间
i 的抽样分布近似服从正态分布,优势比ORi 的 当样本含量较大时,
100( 1 )%置信区间为:
第一节 多重线性回归
SS回 决定系数为回归平方和在总平方和中所占百分比: r SS总
2
例1的决定系数为:
决定系数为0.7251,说明体重、胸围和肩宽三个解释变量的作用可以解释一年 级女大学生肺活量变异的72.51%。
第一节 多重线性回归
(三)解释变量的筛选
1. “最优回归方程”
(1)对反应变量有统计学意义的解释变量,全部入选回归方程。
第二节 logistic回归
两周患病居民就诊影响因素分析的部分原始数据
患者 编号
1 2 3 4 5 … 1489 1490 1491 1492 1493
性别 x1 1 1 1 2 1 … 2 2 2 2 1
年龄 x2 2 4 4 4 4 … 4 3 4 3 1
文化程度 x3 2 4 1 2 1 … 2 1 2 1 1
(1) y 表示模型中解释变量取值固定时反应变量 (2) p 为解释变量个数。
y 的总体均数。
(3) 0 为常数项, j 为解释变量 x j 的偏回归系数。
第一节 多重线性回归
2.方程
ˆ b0 b1 x1 b2 x2 ... bp x p y
(1) y ˆ 为反应变量 y 总体均数的估计值。 (2) b0 , b 1 , b2 , ..., bp 分别为 0 , 1 , 2 , ..., p 的估计值。
卫生统计学第八版李晓松第七章基本情形的参数推断新选
3.48 7.41 7.48 9.42 8.25 3.35 6.95 7.41 6.35 7.41 8.58
76.09
12.11 54.91 55.95 88.74 68.06 11.22 48.30 54.91 40.32 54.91 73.62
(X1 X2)(1 2)
SX1X2
第五节 两个总体率
(二)两总体率之差的置信区间估计
第二节 两个总体均数
(三)两总体均数比较的假设检验
第三节 两个总体方差
第三节 两个总体方差
(一)两样本方差之比的抽样分布原理及其 F 分布
第三节 两个总体方差
(一)两样本方差之比的抽样分布原理及其 F 分布
FS12 S2
2
2
12,v1n11,v2n21
2
第三节 两个总体方差
(二)两总体方差的齐性检验
第四节 单个总体率
(一)总体率的置信区间估计
例1测中,从某 村人群中随机抽取的42名成人中,Ⅰ度以上检出者有9名,现估计该地区 成人大骨节病Ⅰ度以上检出率的95%置信区间。
第四节 单个总体率
(一)总体率的置信区间估计
例12 2011年9月在西藏昌都地区随机抽取500名成年人进行调查,确诊为肱骨短小 症16例,采集血液样本检测提示其中9例有血缘关系,现求该地区患肱骨短小症人 群中有血缘关系所占全部患病人数比例的95%置信区间。
卫生统计学
第七章 基本情形的参数推断
薛付忠 马骏
山东大学 天津医科大学
目录
01 02
03 04 05
第一节:单个总体均数 第二节:两个总体均数 第三节:两个总体方差 第四节:单个总体率 第五节:两个总体率
卫生统计学第八版李晓松第七章基本情形参数推断
第四节 单个总体率
(一)总体率的置信区间估计
p p
Z
pz2p(1p)n,pz2p(1p)n
p2 (1) n
k
Pr(X k) Pr(x) 0
第四节 单个总体率
(一)总体率的置信区间估计
例13 随机抽样研究中从另一村人群中随机抽取的166名成人中,Ⅰ度以上检 出者有41名,现据此估计该地区成人大骨节病Ⅰ度以上检出率的95%的置信区 间。
Sp1p2p1(1p1)n1p2(1p2)n2
第四节 单个总体率
(二)总体率的假设检验
Zpp pp 1 2 1 2 p c ( X 1 X 2 )( n 1 n 2 ) Sp1p2 pc(1pc)(1n11n2)
第四节 单个总体率
(二)总体率的假设检验
No No Image
Image
第四节 单个总体率
第四节 单个总体率
(二)总体率的假设检验
No Image
第五节 两个总体率
第五节 两个总体率
(一)两样本率之差的抽样分布及其正态近似
No No Image
ImN ao ge Image
第五节 两个总体率
(一)两样本率之差的抽样分布及其正态近似
No Image
第五节 两个总体率
(二)两总体率之差的置信区间估计
第四节 单个总体率
(一)总体率的置信区间估计
Pr(X16)500Pr(x)115Pr(x)115 500!0.0043x0.9957500x1.1110-9
x16 x0 x0x!(500x)!
第四节 单个总体率
(二)总体率的假设检验
p0 p0 p1p2~N12,
2 p1p2
Z z(p 1 p 2 ) (1 2 )S p 1 p 2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1)应答偏倚:被访者被问及关于卖淫或嫖娼等敏感话题时,于法律、 道德问题而撒谎。 (2)回忆偏倚:让被访者回忆过去,可能由于记忆不准确产生偏倚。 (3)问题措辞:模糊或者带有引导性的问题常常产生较大的偏倚。
第四节 样本的可靠性与代表性
第四节 样本的可靠性与代表性
1. 参数(parameter)
3. 统计推断(statistical inference) 从样本数据推理而得到关于总体的结论。
第四节 样本的可靠性与代表性
第四节 样本的可靠性与代表性
第四节 样本的可靠性与代表性
当用统计量来估计总体参数时,统计量会随着抽样结果的不同而不同, 该现象可能影响我们采用统计量来估计总体参数的质量。 由抽样引起的统计量与统计量之间或者统计量与总体参数之间的变异不 是无规律的,而是具有某种潜在的模式。
(1)用于刻画总体的数值特征,如总体均数、总体中位数、总体标准差、总体率等。 (2)参数被看成总体某种特征的固定数值,通常参数的确切值未知。
2. 统计量(statistic)
(1)用于描述样本的数值特征,如样本均数、样本中位数、样本标准差,样本率等。 (2)当获得一个样本后就可以得到统计量的值,可用于估计未知参数的值。 (3)统计量的值随样本改变而改变。
第二节 随机对照试验
(一)设计原则
2. 随机化(randomization)
(1)决定如何将试验对象分配到各处理组中,只有当所有处理组中试验对象的基本 情况相当时,各处理组间的效应比较才是有效的。 (2)匹配定义:找到性别、年龄等变量情况相似的两组对象分别给予不同的处理。 (3)匹配存在的问题:不一定能完全避免偏倚,因为有太多潜在的变量可能影响试 验的结果,很难把所有的因素都进行匹配。 (4)随机化思想:使用随机的方式使每个实验对象有同等的机会被分配到各处理组。 (5)随机化方法:抽签。 (6)随机化意义:保证了各对比组间的均衡可比性。
第一节 数据的来源
第一节 数据的来源
1. 轶闻数据
(一)轶闻数据与可得数据
(1)由杂志、报纸、电视、互联网或其它媒体报道的一些个案数据,由于:缺乏代表性,常诱导人们进行简单的推论,得到一些具有倾向性的结论。
(3)如:电视广告中商家提供的数据。
2. 可得数据
(1)为了某些特定目的已收集或积累的数据。 (2)特点:可免费或以低廉价格获取,但通常难以完全满足某些特定的研究目的。 (3)如:各类监测数据、医院临床病案数据和各类统计年鉴等。
第一节 数据的来源
(二)抽样调查数据与实验数据
1. 观察性研究(observational study)与实验性研究(experimental study)
3. 实验数据
(1)通过实验性研究所得到的数据。 (2)特点:研究对象所处的状态是由研究者决定的。研究者决定研究对象状态 的过程称为给予人为的干预措施。 (3)实验性研究的可比性更好,因果关系的推断更具说服力。
第一节 数据的来源
(二)抽样调查数据与实验数据
由于测量本身的问题导致原始数据的准确性或可靠性存在问题,基于这样 的数据所做的任何统计分析都可能具有误导性。 本章的核心问题是如何科学地产生或收集高质量的原始数据,从而在源头 上保障统计结论的准确性和可靠性。 下面两节我们将以简单随机抽样和随机对照试验为例分别进行介绍,以阐 释数据收集或产生过程的核心思想。
第二节 随机对照试验
(一)设计原则
3. 重复(repeat)
(1)每组只有一个试验对象,那么试验结果可能只依赖于具有这类潜在 特质的人被分到了哪个组,但是,如果试验对象足够多,这类人的效应就 能够被平均化,两组的区别就会减少。 (2)重复思想:运用足够多的样本来降低试验的随机误差。
第二节 随机对照试验
卫生统计学
第三章 数据的产生
夏结来
第四军医大学
目录
01 02
03 04 05
第一节:数据的来源 第二节:随机对照试验 第三节:简单随机抽样 第四节:抽样的可靠性与代表性 第五节:伦理问题
重点难点
※ 轶闻数据与可得数据 ※ 实验性研究与观察性研究 ※ 实验设计的基本原则 ※ 总体与样本、参数与统计量 ※ 简单随机抽样 ※ 偏倚
第二节 随机对照试验
第二节 随机对照试验
(一)设计原则
1. 对照(control)
(1)案例:“胃冷冻法”治疗胃溃疡是否有效。 (2)安慰剂效应:由于心理效应所产生的虚假现象。 (3)对照思想:设置对照组以减少非处理因素对处理因素效应的影响。 (4)标准的对照试验:将试验对象随机分配到试验组和对照组,除了对试验 组给予处理措施外,两组患者在其他方面都要被同等对待。 (5)意义:鉴别处理因素与非处理因素之间的差异,是进行比较的必要基础; 消除和减少试验误差。
(二)潜在的问题
试验对象可能具有安慰剂效应; 试验研究者的主观看法造成试验结论的偏倚; 盲法(blind):试验对象甚至试验人员均不知道试验对象接受哪一种处理; 双盲意义:双盲则避免了由试验人员和试验对象的主观意识造成的偏倚。
第三节 简单随机抽样
第三节 简单随机抽样
(一)简单随机抽样
1. 总体(population) 根据研究目的确定的同质研究个体的全体。 2. 样本(sample) 是为了解总体而观测的总体的一部分。 3. 简单随机抽样(simple random sample, SRS)
(1)随机抽样:总体中每个个体有相同的机会被选中作为样本参与调查,降低样本 的选择偏倚。 (2)简单随机抽样:从总体中以相同机会抽取的n个个体称为一个简单随机样本,n 为样本量。
第三节 简单随机抽样
(二)潜在的问题
1. 抽样涵盖不全
(1)志愿者应答样本:总体中的更有意愿完成调查的部分对象组成的样 本,不是总体的一个具有代表性的样本。
(1)观察性研究中,研究者观察并测量研究对象的一个或多个变量,但不施 加任何干预措施。 (2)实验性研究中,研究者对研究对象施加处理因素即干预措施,并测量一 个或多个变量。
第一节 数据的来源
(二)抽样调查数据与实验数据
2. 抽样调查数据
(1)抽样调查的基本思想就是对总体中的一部分,即样本进行了解进而得到总 体的信息。 (2)特点:观察者对被观察事物或现象在不进行任何干预的情况下所作的观察。