卫生统计学重点笔记之令狐文艳创作

合集下载

卫生统计学知识点整理

卫生统计学知识点整理

卫生统计学知识点整理1.数据类型:卫生统计学包括两种主要类型的数据,即定量数据和定性数据。

定量数据是数值型数据,如身高、体重等,可以使用各种统计方法进行分析。

定性数据是非数值型数据,如性别、职业等,可以使用描述性统计方法进行分析。

2.数据收集方法:卫生统计学使用多种方法收集数据,其中包括调查、观察、实验和文献研究等。

调查是最常用的数据收集方法,通过设计问卷或面对面访谈等手段收集信息。

观察是观察和记录事件或行为,以获取相关数据。

实验是通过对照组和干预组进行比较来确定原因和效果的方法。

文献研究是通过分析已有的文献、报告和统计数据来获取相关信息。

3.数据描述和总结:在数据收集完成后,卫生统计学需要对数据进行描述和总结。

这包括计算各种统计指标,如平均数、中位数、众数和标准差等,以了解数据的分布和变异程度。

4.假设检验:卫生统计学中常用的方法之一是假设检验,用于判断一些变量是否与其他变量有显著关联或差异。

假设检验基于统计学原理,通过计算样本数据与预期数据之间的差异,评估是否拒绝或接受一些假设。

5.相关分析:相关分析是研究两个或多个变量之间关系的统计方法。

它可以确定变量之间的相关性大小和方向,并计算相关系数来度量相关性的强弱。

6.回归分析:回归分析是用来预测和解释一个或多个因变量与一个或多个自变量之间关系的方法。

它可以估计自变量对因变量的影响程度,并评估其统计显著性。

7.生存分析:生存分析是研究个体在一定时间内生存或发生一些事件的概率的统计方法。

它通常用于研究疾病的生存率和治疗效果。

8.抽样方法:抽样方法是在卫生调查中常用的一种方法,它可以通过选择一部分样本来代表整体群体。

常见的抽样方法包括随机抽样、系统抽样、分层抽样和整群抽样等。

9.统计软件:卫生统计学使用各种统计软件来进行数据分析和统计计算。

常用的统计软件包括SPSS、SAS、R和STATA等,它们提供了丰富的统计功能和图形展示方式。

10.数据伦理:卫生统计学中数据伦理是一个重要的问题,主要涉及数据的保密性、隐私保护和知情同意等方面。

卫生统计学知识点(笔记)

卫生统计学知识点(笔记)

第一章绪论1.统计学(statistics)是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。

2.▲总体(population)用来表示大同小异的对象全体,例如一个国家的所有成年人;某地的所有小学生。

可分为目标总体和研究总体。

若试图对某个总体下结论,这个总体便称为目标总体(target population);资料常来源于目标总体中的一个部分,它称为研究总体(study population)。

需要谨慎的是,就研究总体所下的结论未必适用于目标总体。

3.▲样本(sample)是指从研究总体中抽取的一部分有代表性的个体。

获取样本的过程称为抽样(sampling)。

抽样研究的目的是用样本数据推断总体的特征。

需要注意的是,统计学的结论从来就不是完全肯定或完全否定的,能不能成功地达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术。

4.▲同质(homogeneity)是指同一总体中个体的主要性质相同。

5.▲变异(variation)是指同质的个体之间存在的差异。

6.▲变量的类型二分类变量分类变量或名义变量定性变量多分类变量变量有序变量或等级变量定量变量离散型变量连续型变量变量的转化:只能由“高级”向“低级”转化,即由信息量多的向信息量少的类型转化,如:定量有序分类二值7.▲参数(parameter)是反映总体特征的指标,参数的大小是客观存在的,是一个常数,不会发生变化,然而往往是未知的,需要通过样本资料来估计,如总体均数μ,总体标准差σ。

8.▲统计量(statistic)又称样本统计量,是反映样本特征的指标,是由观察资料计算出来的,如样本均数 X,样本标准差S。

统计学的任务就是依据样本统计量来推断总体参数。

9.▲概率与频率的区别:概率是参数,频率是统计量;频率总是围绕概率上下波动。

当某事件发生的概率≤0.05时,即P≤0.05,统计学习惯上称该事件为小概率事件。

复旦大学社会医学与卫生事业管理考研复习-医学统计学重点

复旦大学社会医学与卫生事业管理考研复习-医学统计学重点

医学统计学重点说明:本重点仅供参考:不能包括所有选择题考题,名词和简答可信度高,计算题熟练运算过程;同时自己要清楚各种检验方法的基本思想,重点程度与星号数量相关)一、名词解释1、★★★医学统计学:用概率论和数理统计方法研究医学事件的群体特征的一门方法。

2、★总体:根据研究目的确定的同质的研究对象的全体(集合)。

3、样本:从总体中随机抽取的部分研究对象4、随机:总体中每个个体有同等的机会进入样本。

5、系统误差:指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差6、随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的7、★★抽样误差:由于抽样原因造成的样本指标与总体指标之间的差,或者是样本指标与样本指标之间的差。

8、准确度(accuracy)或真实性(validity):观察值与真值的接近程度,受系统误差的影响(9、可靠度(reliabiliy)——也称精密度(precision)或重复性(repeatability):重复观察时观察值与其均值的接近程度,受随机误差的影响10、★★★小概率事件:一般常将p ≤0.05或p ≤0.01称为小概率事件,表示某事件发生的可能性很小。

通俗讲一次抽样是不可能发生的事件11、★★正态分布定:又称高斯分布,是一条中间高,两头低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。

12、★★医学参考值范围:指绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。

最常用的是95%参考值范围。

13、★★标准误:用于反映均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度。

14、★95%的可信区间:如果从同一总体中重复抽取100个独立样本,将可能有95个可信区间包括总体均数,有5个可信区间未包括总体均数。

二、填空题1、★医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料2、★统计分析包括:统计描述、统计推断3、频数分布的两个重要特征:集中趋势和离散趋势4、正态分布的两个参数:均数;标准差。

常用中药配伍之令狐文艳创作

常用中药配伍之令狐文艳创作

一、栀子+茵陈:湿热黄疸二、令狐文艳三、知母+黄柏:阴虚火旺四、青蒿+鳖甲:阴虚发热.五、白薇+玉竹:阴虚外感六、肉桂+附子:肾阳虚衰七、附子+干姜:亡阳证及中焦寒证八、黄柏+苍术:下焦湿热证九、麻黄+石膏:肺热咳喘效佳十、地骨皮+桑白皮:肺热咳嗽十一、桂枝+白芍:风寒表虚有汗十二、麻黄+杏仁:风寒束肺者尤宜十三、麻黄+桂枝:风寒表实无汗症,十四、柴胡+黄芩:少阳寒热往来十五、大黄+巴豆+干姜:寒积便秘十六、滑石+生甘草:暑湿身热烦渴.十七、甘草+白芍:脘腹四肢挛急疼痛十八、橘皮+半夏:凡痰湿滞中停肺十九、茯苓+猪苓:水湿内盛或兼脾虚者二十、川楝子+延胡索:血瘀气滞痛二十一、桑寄生+独活:风湿痹痛,腰膝酸软二十二、菊花+枸杞子:肝肾亏虚之视物不明二十三、生葛根+黄芩+黄连:湿热泻痢初起二十四、蝉蜕+胖大海:风热、肺热咽痛喑哑二十五、知母+川贝母:阴虚劳咳,肺燥咳嗽二十六、黄连+木香:湿热泻痢腹痛,里急后重二十七、薤白+瓜蒌:痰浊闭阻胸阳不振之胸痹二十八、乌药+益智仁、山药:治肾虚遗尿尿频二十九、石膏+知母:气分高热证,肺胃火热伤津证三十、黄连+半夏+瓜蒌:痰火互结之结胸证佳三十一、苍术+厚朴+陈皮:寒湿中阻脾胃气滞者尤三十二、细辛+干姜、五味子:寒饮咳喘日久者效佳三十三、栀子+淡豆豉:温病初起胸中烦闷及虚烦不眠三十四、大黄+芒硝:实热积滞,大便干燥坚硬难下者佳三十五、羌活+独活:风寒湿邪,风湿痹痛无论上下均可三十六、莃蔹草+臭梧桐:风湿痹痛肢体麻木兼高血压者三十七、藿香+佩兰:凡湿浊中阻无论寒热表证均可用。

三十八、黄连+吴茱萸:肝火犯胃,湿热中阻之呕吐泛酸三十九、砂仁+木香:凡湿滞,食积或夹寒所致脘腹胀痛四十、白及+乌贼骨:治胃,十二指肠溃疡之呕吐便血四十一、附子+细辛,麻黄:补阳发表散寒,治阳虚外感风寒四十二、桑叶+菊花:风热感冒,温病初起,风热或肝热肝肾亏虚四十三、香附+高良姜:治寒凝气滞、肝气犯胃之胃脘胀痛。

卫生统计学知识点总结

卫生统计学知识点总结

卫生统计学统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。

★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。

a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。

b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。

变量资料可分为定性变量、定量变量。

不同类型的变量可以进行转化,通常是由高级向低级转化。

资料按性质可分为计量资料、计数资料和等级资料。

定量资料的统计描述1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。

离散型定量变量的频率分布图可用直条图表达。

2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。

★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。

(1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。

算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。

(2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。

四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。

方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。

《卫生统计学》考试重点复习资料

《卫生统计学》考试重点复习资料

②权衡两类错误的危害以确定α的大小。 ③正确理解 P 值的意义,如果 P<α,宜说差异“有统计学意义”。
第八章 方差分析
名词解释
总变异:样本中全部实验单位差异称为总变异。其大小可以用全部观察值的均方(方差)表 示。 组间变异:各处理组样本均数之间的差异,受处理因素的影响,这种变异称为组间变异,其 大小可用组间均方表示。 组内变异: 各处理组内部观察值大小不等,这种变异称为组内变异,可用组内均方表示。 随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象 的特征相同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对 象随机地分配到各处理组,这种设计叫做随机区组设计。
构成比
某一组成部分的观察单 位数 同一事物各组成部分的 观察单位总数
100 %
③比又称相对比,是 A、B 两个有关指标之比,说明两者的对比水平,常以倍数或百分数表
示,其公式为:相对比=甲指标 / 乙指标(或 100%)
甲乙两个指标可以是绝对数、相对数或平均数等。
应用相对数时应注意哪些问题?
答:应用相对数时应注意的问题有:
相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、
构成比、比等。
标准化法:是常用于内部构成不同的两个或多个率比较的一种方法。标准化法的基本思想就
是指定一个统一“标准”(标准人口构成比或标准人口数),按指定“标准”计算调整率,使
之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。
料间的相对水平。 3) 报告比较结果时必须说明所选用的“标准”和理由。 4) 两样本标准化率是样本值,存在抽样误差。当样本含量较小时,还应作假设检验。

(完整word版)卫生统计学重点整理-预防医学

(完整word版)卫生统计学重点整理-预防医学

1.卫生统计学:是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学。

2.同质(homogeneity):在统计学中,若某些观察对象具有相同的特征或属性称为同质的。

否则称为异质(heterogeneity)的或者间杂的。

3.变异(variation):同质事物之间的差别称为变异。

[没有个体变异,就没有统计学!]4.总体(population):根据研究目的所确定的同质观察单位的全体。

5.样本(sample):是从总体中随机抽取的具有代表性的部分观察单位的集合。

6.样本含量(sample size):样本中包含的观察单位个数。

7.参数(parameter):反映总体特征的指标。

特点:未知、唯一,希腊字母表示,如总体均数、总体率等。

8.统计量(statistic):根据样本观察值计算出来的指标。

特点:已知、不唯一,拉丁字母表示,如样本均数、样本率等。

9.变量(variable):研究者需要对每个观察单位的某项特征或属性进行观察或测量,这种特征或属性称为变量。

10.变量值(value of variable):变量的观察值或测量值称为变量值或观察值(observed value).11.资料(data):变量值的集合称之为资料.12.定量资料(quantitative data):变量值是定量的,表现为数值大小。

特点:一般有度、量、衡单位,一般属连续性资料。

13.定性资料(qualitative data):观察值是定性的,表现为互不相容的类别或属性。

特点:一般无度、量、衡单位,一般属于离散型资料。

可进一步分为计数资料和等级资料。

14.计数资料(count data):将观察单位按某种类别或属性进行分组,清点各组观察单位数所得的资料。

可进一步分为二项分类资料和无序多项分类资料.15.等级资料(ordinal data):将观察单位按照某种特质或属性的程度或等级顺序分组,清点各组观察单位所得的资料。

卫生统计学重点笔记

卫生统计学重点笔记

医师资历测验蓝宝书-预防医学医学统计学办法第一节根本概念和根本步调(异常重要)一.统计工作的根本步调设计(最症结.决议成败).汇集材料.整顿材料.剖析材料.总体:依据研讨目标决议的同质研讨对象的全部,确实地说,是性质雷同的所有不雅察单位某一变量值的聚集.总体的指标为参数.现实工作中,经常是从总体中随机抽取必定命量的个别,作为样本,用样本信息来揣摸总体特点.样本的指标为统计量.因为总体中消失个别变异,抽样研讨中所抽取的样本,只包含总体中一部分个别,这种由抽样引起的差别称为抽样误差.抽样误差愈小,用样本揣摸总体的精确度愈高;反之,其精确度愈低.小概率事宜.二.变量的分类变量:不雅察单位的特点,分数值变量和分类变量.第二节数值变量数据的统计描写(重要考点)一.描写计量材料的分散趋向的指标有1.均数均数是算术均数的简称,实用于正态或近似正态散布.2.几何均数实用于等比材料,尤其是对数正态散布的计量材料.对数正态散布即原始数据呈偏态散布,经对数变换后(用原始数据的对数值lgX代替X)屈服正态散布,不雅察值不克不及为0,同时有正和负.3.中位数一组按大小次序分列的不雅察值中位次居中的数值.可用于描写任何散布,特殊是偏态散布材料的分散地位,以及散布不明或散布末尾无肯定命据材料的中间地位.不克不及求均数和几何均数,但可求中位数.百分位数是个界值,将全部不雅察值分为两部分,有X%比小,剩下的比大,可用于盘算正常值规模.二.描写计量材料的离散趋向的指标1.全距和四分位数间距.2.方差和尺度差最为经常运用,适于正态散布,既斟酌了离均差(不雅察值和总体均数之差),又斟酌了不雅察值个数,方差使本来的单位变成了平方,所以开方为尺度差.均为数值越小,不雅察值的变异度越小.3.变异系数多组间单位不合或均数相差较大的情形.变异系数盘算公式为:CV=s/X×100%,公式中s为样本尺度差,X为样本均数.三.尺度差的运用暗示不雅察值的变异程度(或离散程度).在两组(或几组)材料均数邻近.器量单位雷同的前提下,尺度差大,暗示不雅察值的变异度大,即各不雅察值离均数较远,均数的代表性较差;反之,暗示各不雅察值多分散在均数四周,均数的代表性较好.(常考!)四.医学参考值的盘算办法,单双侧问题,医学为95%医学参考值是斧正常人体或动物体的各类心理常数,因为消失变异,各类数据不但因人而异,并且统一小我还会随机体表里情形的转变而转变,因而须要肯定其摇动的规模,即正常值规模.医学参考值的盘算公式:①正态散布材料95%医学参考值:X±1.96s(双侧);X X-1.645s(单侧),s为尺度差.②百分位数法P和P(双侧);P5或P95(单侧).第三节数值变量数据的统计揣摸(重要考点)一.尺度误,尺度误与尺度差和样本含量的关系尺度差和尺度误的差别.样本尺度误等于样本尺度差除以根号下样本含量.尺度误与尺度差成正比;与样本含量的平方根成反比.是以.为削减抽样误差,应尽可能包管足够大的样本含量.样本尺度差与样本尺度误是既有接洽又有区此外两个统计量,二者的接洽是公式:二者的差别在于:样本尺度差是反应样本中各不雅测值X1,X2,……,X n变异程度大小的一个指标,它的大小说清楚明了对该样本代表性的强弱.样本尺度误是样本平均数1,2,……的尺度差,它是抽样误差的估量值,其大小说清楚明了样本间变异程度的大小及精确性的高下.(控制!)二.t散布和尺度正态u散布关系均以0为中间阁下两侧完整对称的散布,只是t散布曲线顶端较u散布低,两头翘.(v逐渐增大,t散布逐渐逼近u散布).正态散布的特色:①以均数为中间阁下两侧完整对称散布;②两个参数,均数u(地位参数)和s(变异参数);③对称均数的两正面积相等.三.总体均数的估量样本统计量推算总体均数有两个重要方面:区间估量和假设磨练.样本均数估量总体均数称点估量.总体均数区间估量(可托区间)的概念:按必定的可托度估量未知总体均数地点规模.其统计上习习用95%(或99%)可托区间暗示总体均数μ有95%(或99%)的可能在某一规模.可托区间的两个要素,一为精确度,反应在可托度1-α的大小,即区间包含总体均数的概率大小,当然愈接近1愈好;二是精度,反应在区间的长度,当然长度愈小愈好.在样本例数肯定的情形下,二者是抵触的,须要统筹.总体均数可托区间的盘算办法:1.当n小按t散布的道理用式盘算可托区间为:X±tαv S X/2,2.当n足够大因n足够大时,t散布逼近μ散布,按正态散布道理.用式估量可托区间为:X±μα/2SX可托区间与医学参考值规模的差别:二者的意义和算法不合.四.假设磨练的步调1.树立假设:H0(无效,两样本代表的总体均数雷同),H1(备择,两样本来自不合总体),当谢绝H0就接收H1,不谢绝就不接收H1.2.肯定明显性程度:区分精确率和小概率事宜的尺度,平日取α=0.05.3.盘算统计量:依据材料类型和剖析目标选择恰当的公式盘算.4.肯定概率P值:将盘算得到的t值或u值查界值表得到P 值和α值比较.5.做出揣摸结论.|t|值.P值与统计结论五.两均数的假设磨练(常考!)1.样本均数与总体均数比较 u磨练和t磨练用于样本均数与总体均数的比较.理论上请求样本来自正态散布总体现实中,只要样本例数n较大,或n小但总体尺度差σ已知,就选用u磨练.n 较小且σ未知时,用于t磨练.两样本均数比较时还请求两总体方差等.以算得的统计量t,按表所示关系作断定.2.配对材料的比较在医学研讨中,经常运用配对设计.配对设计重要有四种情形:①统一受试对象处理前后的数据;②统一受试对象两个部位的数据;③统一样品用两种办法(仪器等)磨练的成果;④配对的两个受试对象分离接收两种处理后的数据.情形①的目标是揣摸其处理有无感化;情形②.③.④的目标是揣摸两种处理(办法等)的成果有无不同.v=对子数-1;如处理前后或两法无不同,则其差数d的总体均数应为0,可看作样本均数d和总体均数0的比较.d为差数的均数;d S 为差数均数的尺度误,S d 为差数的尺度差;n 为对子数.因盘算的统计量是t,按表所示关系作断定.3.完整随机设计的两样本均数的比较 亦称成组比较.目标是揣摸两样本各自代表的总体均数μ1与μ2是否相等.依据样本含量n 的大小,分u 磨练与t 磨练.t 磨练用于两样本含量n 1.n 2较小时,且请求两总体方差相等,即方差齐.若被磨练的两样本方差相差明显则需用t ′磨练.u 磨练:两样本量足够大,n>50.21X X S -=)(21212C n n n n S + v =(n 1-1)+(n 2-1)=n 1+n 2-2 式中21X X S -,为两样本均数之差的尺度误,Sc 2为归并估量方差(combined estimate variance ).算得的统计量为t,按表所示关系做出断定.4.Ⅰ型错误和Ⅱ型错误 弃真,谢绝精确的H 0为Ⅰ型错误α暗示,若明显性程度α定为0.05,则犯Ⅰ型错误的概率0.05;接收错误的H 0为Ⅱ型错误,概率用β暗示,β值的大小很难确实估量.当样本含量一准时,两者反比,增大n,当α一准时,可削减β.1-β称为磨练效能或掌控度,其统计意义是若两总体确有不同,按α水准能检出其差此外才能.客不雅现实谢绝H 0 不谢绝H 0H 0成立 Ⅰ型错误(α) 揣摸精确1-αH 0不成立揣摸精确(1-β) Ⅱ型错误(β)5.假设磨练留意事项 包管组间可比性;依据研讨目标.材料类型和设计类型选用恰当的磨练办法,熟习各类磨练办法的运用前提;“明显与否”是统计学术语,为“有无统计学意义”,不克不及懂得为“不同是不是大”;结论不克不及绝对化.第四节 分类变量材料的统计描写(一般考点)相对数是两个有接洽关系事物数据之比.经常运用的相对数指标有构成比.率.相比较等.一.构成比暗示事物内部各个构成部分所占的比重,平日以100为例基数,故又称为百分比.其公式如下: 构成比=个体数总和事物内部各构成部分的的个体数事物内部某一构成部分×100% 该式可用符号表达如下: 构成比=⋯⋯+++C B A A ×100% 构成比有两个特色:(1)各构成部分的相对数之和为100%.(2)某一部分所占比重增大,其他部分会响应地削减.二.率用以解释某种现象产生的频率或强度,故又称频率指标,以100,1000,10000或100000为比例基数(K )均可,原则上以成果至少保存一位整数为宜,其盘算公式为:率和构成比不合之处:率的大小仅取决于某种现象的产生数和可能产生该现象的总数,不受其他指标的影响,并且各率之和一般不为1. 率=可能发生某现象的总数某现象实际发生例数×K 该式亦可用符号表达如下 阳性率=)()()(-+++A A A ×K (若算阴性率则分子为A (-))式中A (+)为阳性人数,A (-)为阴性人数.三.相比较暗示有关事物指标之比较,常以百分数和倍数暗示,其公式为:相比较:甲指标/乙指标(或×100%)或用符号暗示为:A/B ×K四.留意事项①构成比和率的不合,不克不及以比代率;②盘算相对数时,不雅察例数不宜过小;③率的比较留意可比性,特殊是混淆身分的问题,有的话,可用尺度化法和分层剖析清除;④不雅察单位不合的几个率的平均率不等于几个率的算术均数;⑤样本率或构成比的比较应做假设磨练.第五节 分类变量材料的统计揣摸(异常重要)一.率的抽样误差用抽样办法进行研讨时,必定消失抽样误差.率的抽样误差大小可用率的尺度误来暗示,盘算公式如下:σp=n π)π(1+式中:σp为率的尺度误,π为总体阳性率,n为样本含量.因为现实工作中很难知道总体阳性率π,故一般采取样本率P来代替,而上式就变成S p=n P)P(1-二.总体率的可托区间因为样本率与总体率之间消失着抽样误差,所以也需依据样本率来推算总体率地点的规模,依据样本含量n和样本率P的大小不合,分离采取下列两种办法:(一)正态近似法(常考!)当样本含量n足够大,且样本率P和(1-P)均不太小,如nP 或n(1-P)均≥5时,样本率的散布近似正态散布.则总体率的可托区间可由下列公式估量:总体率(π)的95%可托区间:p±p总体率(π)的99%可托区间:p±p(二)查表法当样本含量n较小,如n≤50,特殊是P接近0或1时,则按二项散布道理肯定总体率的可托区间,其盘算较繁,读者可依据样本含量n和阳性数x参照专用统计学介绍的二项散布中95%可托限表.三.u磨练(异常重要!)当样本含量n 足够大,且样本率P 和(1-P )均不太小,如nP 或n (1-P )均≥5时,样本率的散布近似正态散布.样本率和总体率之间.两个样本率之间差别的断定可用u 磨练.1.样本率和总体率的比较公式 u=|P-π|/σP =|P-π|/n π)/π(1-;2.两样本率比较公式 u=|P 1-P 2|/Sp 1-P 2=|P 1-P 2|/)1/)(1/(121n n p p c c +-也可用χ2磨练,两者相等.四.χ2磨练(异常重要!)可用于两个及两个以上率或构成比的比较;两分类变量相干关系剖析.其数据构成,必定是互相对峙的两组数据,四格表材料自由度v 永久=1.四格表χ2磨练各类公式实用前提,n>40且每个格子T>5,可用根本公式或专用公式,不必校订.根本公式:χ2=∑(A-T )2/T专用公式:χ2=∑(ad-bc )2n/(a+b )(c+d )(a+c )(b+d )只要有一个格子T 在1~5之间,需校订.校订公式:根本公式:χ2=∑(|A-T |-0.5)2/T专用公式:χ2=∑(|ad-bc |-n/2)2n/(a+b )(c+d )(a+c )(b+d )n<40或T<1,用确实概率法.五.行×列表χ2磨练当行数或列数超出2时,称为行×列表.行×列表χ2磨练是对多个样本率(或构成比)的磨练.实用前提:一般以为行×列表中不宜有1/5以上格子的理论数小于5,或有小于1的理论数.1.当理论数太小可采纳下列办法处理①增长样本含量以增大理论数;②删去上述理论数太小的行和列;③将太小理论数地点组与性质邻近的组归并,使从新盘算的理论数增大.因为后两法可能会损掉信息,伤害样本的随机性,不合的归并方法有可能影响揣摸结论,故不宜作通例办法.别的,不克不及把不合性质的现实数归并,如研讨血型时,不克不及把不合的血型材料归并.2.如磨练成果谢绝磨练假设,只能以为各总体率或总体构成比之间总的来说有不同,但不克不及解释它们彼此之间都有不同,或某两者间有不同.3.关于单向有序行列表的统计处理在比较遍地理组的效应有无不同时,宜用秩和磨练法,如作χ2磨练只解释遍地理组的效应在构成比上有无差别.六.配对计数材料的χ2磨练统一样品用两种办法处理,不雅察阳性和阴性个数.断定两种处理办法是否雷同.当b+c>40时,χ2=(b-c)2/b+c;b+c<40时,校订公式:χ2=(|b-c|-1)2/b+c第六节直线相干和回归(一般考点)一.直线相干剖析的用处.相干系数及其意义相干剖析是研讨事物或现象之间有无关系.关系的偏向和亲密程度.相干系数:是定量暗示两个变量(X,Y)之间线性关系的偏向和亲密程度的指标,用r暗示,r=lxy/lxxlxy,其值在-1至+1间,r 没有单位.r呈正值,两变量间呈正相干,即两者的变更趋向是同向的,r=1时为完整正相干;如r呈负值,两变量呈负相干,即两者的变更趋向是反向的,r=-1时为完整负相干.r的绝对值越接近1,两变量间线性相干越亲密;越接近于0,相干越不亲密.当r=0时,解释X和Y两个变量之间无直线关系.二.直线回归剖析的感化.回归系数及其意义直线回归剖析的义务在于找出两个变量有依存关系的直线方程,以肯定一条最接近于各实测点的直线,使各实测点与该线的纵向距离的平方和为最小.这个方程称为直线回归方程,据此方程描写的直线就是回归直线.直线同归方程式的一般表达式Y=a+bX式中a为回归直线在Y轴上的截距,即a>0暗示直线与Y轴的交点在原点上方,<0在原点下方,a=0过原点.b为样本回归系数,即回归直线的斜率,暗示当X变动一个单位时,Y平均变动b个单位.b>0:暗示Y随X增大而增大b<0:暗示Y随X增大而削减b=0:暗示Y不随X变更而变更第七节统计表和统计图(重要考点)一.统计表原则:构造简略.层次分明.内容安插合理.重点凸起.数据精确.1.标题简洁表达表的中间内容,地位在表的上方.2.标目有横标和纵标目,横标目平日位于表内左侧;纵标目列在表内上方,其表达成果与主辞呼应.3.线条力图简洁,一般为三线表.4.用阿拉伯数暗示,如很多据或暂缺材料,也可用“-”或“…”来暗示.5.备注一般不列入表内,解释在表下.内容分列:一般按事物产生频率大小次序来分列,比较光鲜,重点凸起.二.统计图1.线图(line diagram)(常考!)材料性质:实用于持续变量材料.剖析目标:用线段的起落表达某事物的动态(差值)变更.2.半对数线图(semilogarithmic line graph)材料性质:实用于持续变量材料.剖析目标:用线段的起落表达事物的成长速度变更趋向.3.直方图(histogram)材料性质:实用于数值变量,持续性材料的频数表材料.剖析目标:直方图是以直方面积表达各组段的频数或频率.4.直条图(bar chart)材料性质:实用于彼此自力的材料.剖析目标:直条图是用等宽直条的和长短来暗示各统计量的大小,进行比较.5.百分条图(percentchart)材料性质:构成比.剖析目标:用长条各段的长度(面积)表达内部构成比.6.圆形图(circulargraph)(常考!)材料性质:构成比.剖析目标:用圆的扇形面积表达内部构成比.7.散点图(scatterdiagram)材料性质:双变量材料.剖析目标:用点的密集度和趋向表达两变量间的相干关系.8.统计地图(statistical map)材料性质:地区性材料.剖析目标:用不合纹线或色彩代表指标高下,解释地域散布.。

医学统计学-总结-重点-笔记-复习资料

医学统计学-总结-重点-笔记-复习资料

第一章2选1总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。

可分为有限总体和无限总体。

总体中的所有单位都能够标识者为有限总体,反之为无限总体。

总体population根据研究目的而确定的同质观察单位的全体。

样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。

样本应具有代表性。

所谓有代表性的样本,是指用随机抽样方法获得的样本。

样本sample从总体中随机抽得的部分观察单位,其实测值的集合。

3选1小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件。

P值:P 值即概率,反映某一事件发生的可能性大小。

统计学根据显著性检验方法所得到的P 值反应结果真实程度,一般以P ≤ 0.05 认为有统计学意义, P ≤0.01 认为有高度统计学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 或0.01。

P值是:1) 一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。

2) 拒绝原假设的最小显著性水平。

3) 观察到的(实例的) 显著性水平。

4) 表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。

小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实际实验中是不会发生的,数学上称之小概率原理,也称为小概率的实际不可能性原理。

统计学中,一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型(3选1)(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。

计量资料亦称定量资料、测量资料。

.其变量值是定量的,表现为数值大小,一般有度量衡单位。

如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。

计量资料measurement data定量资料quantitative data数值变量资料numerical variable为观测每个观察单位某项指标的大小,而获得的资料。

十八反十九畏歌之令狐文艳创作

十八反十九畏歌之令狐文艳创作

十八反歌十九畏歌十八反:令狐文艳1:甘草反甘遂、京大戟、海藻、芫花。

乌头(川乌、附子、草乌)反半夏、瓜蒌(全瓜蒌、瓜蒌皮、瓜蒌仁、天花粉)、贝母(川贝、浙贝)、白蔹、白芨。

藜芦反人参、南沙参、丹参、玄参、苦参、细辛、芍药(赤芍、白芍)。

十九畏硫黄原是火中精,朴硝一见便相争。

水银莫与砒霜见,狼毒最怕密陀僧。

巴豆性烈最为上,偏与牵牛不顺情。

丁香莫与郁金见,牙硝难合京三棱。

川乌草乌不顺犀,人参最怕五灵脂。

官桂善能调冷气,若逢石脂便相欺。

大凡修合看顺逆,炮槛炙焯莫相依。

注:硫黄畏朴硝,水银畏砒霜,狼毒畏密陀僧,巴豆畏牵牛,丁香畏郁金,川乌、草乌畏犀角,牙硝畏三棱,官桂畏石脂,人参畏五灵脂。

四气歌五味歌四气寒热与温凉,寒凉属阴温热阳,五味辛甘苦咸酸,治疗作用不同焉,温热补火助阳气,温里散寒功效彰,辛行气血主发散,甘和补中急能缓,寒凉清热并泻火,解毒助阴又抑阳,苦燥降泄能坚阴,咸能润下且软坚,寒者热之热者寒,治疗大法此为纲。

酸能固涩又收敛,淡渗利水要记全。

中药七情歌妊娠服药禁忌歌相使一药助一药,相须互用功效添,斑蝥水蛭及虻虫,乌头附子配天雄,相杀能制它药毒,相畏毒性被制限,野葛水银并巴豆,牛膝薏苡与蜈蚣相反增毒要记牢,相恶配伍功效减,三棱芫花代赭麝,大戟蝉蜕黄雌雄,单行无须它药配,七情配伍奥妙显。

半夏南星及通草,瞿麦干姜桃仁通,牙硝芒硝牡丹桂,槐花牵牛皂角同,硇砂干漆蟹爪甲,地胆茅根都失中。

解表药解表辛散肌表邪,性温散寒凉散热。

发散风寒桂麻黄,香薷白芷苏荆防,苍耳辛荑藁本羌,细辛胡荽柽葱姜。

发散风热蝉薄荷,牛蒡桑菊蔓荆葛,柴胡升麻淡豆豉,浮萍木贼风热瘥。

麻黄发汗治伤寒,风水痹痛与咳喘。

桂枝温卫善解肌,温经通脉化水气。

紫苏散寒兼理气,风寒气滞两相宜。

荆芥辛散肌表邪,感冒痒疹及出血。

防风辛散表里风,胜湿疗痹止风痉。

羌活祛风寒湿奇,外感头疼上肢痹。

白芷通窍止额痛,燥湿止带消痈脓。

细辛散寒通鼻窍,诸般寒痛肺饮消。

薄荷清利头目咽,散热透疹又疏肝。

凝血与抗凝血题题之令狐文艳创作

凝血与抗凝血题题之令狐文艳创作

第十二章凝血与抗凝血平衡紊乱令狐文艳一、单择题1.在启动凝血过程中起主要作用的是 ( )A.血小板B.FⅦC.FⅫD.FⅢE.凝血酶2.正常时表达TF的细胞是 ( )A.血管外层的平滑肌细胞B.血管内皮细胞C.血液单核细胞D.嗜中性粒细胞E.巨噬细胞3.局部组织损伤后TF启动的凝血过程不能扩大的原因是由于血液中存在 ( )A.PCB.AT-ⅢC.肝素 D.TFPI E.PS4.TF-Ⅶa促进凝血酶原激活物的形成是因为激活了 ( )A.FⅧB.FⅨC.FⅩD.FⅪE.FⅫ5.血小板的激活剂不包括 ( )A.ADPB.凝血酶 C.TXA2 D.PGI2 E.肾上腺素6.血小板释放反应中,致密颗粒可释放 ( )A.5-HTB.纤维蛋白原C.TXA2D.纤维连结蛋白E.凝血酶敏感蛋白7.在抗凝系统中不属于丝氨酸蛋白酶抑制物的是 ( )A.AT-ⅢB.α2-APC.PCD.C1抑制物 E.HCⅡ8.使AT-Ⅲ灭活凝血酶作用明显增强并在血管内皮细胞表达的是 ( )A.PGI2B.NOC.ADP酶 D.APC E.HS9.肝素刺激血管内皮细胞释放的抗凝物质是 ( )A.TXA2B.NOC.TMD.TFPIE.P C10.激活的蛋白C(APC)可水解 ( )A.FⅡB.FⅢC.FⅤD.FⅦE.F Ⅹ11. APC阻碍凝血酶原激活物的形成是由于其灭活了 ( )A.FⅡaB.FⅤaC.FⅦaD.FⅨaE.FⅪa12.APC的作用不包括 ( )A.水解FⅤaB.水解FⅧa C.水解FⅡaD.限制FⅩa与血小板的结合 E.灭活PAI-113.可使PK分解为激肽释放酶的是 ( )A.FⅧaB.FⅨaC.FⅩaD. FⅪaE.FⅫa14.可通过外源性激活途径使纤溶酶原转变为纤溶酶的是 ( )A.激肽释放酶B.FⅪaC.uPAD.凝血酶E.FⅫa15.激活TAFI所必需的高浓度凝血酶的产生主要依赖于 ( )A.FⅪaB.FⅩaC.FⅨaD.FⅧaE.FⅦa16.不受Vi t K缺乏影响的凝血因子是 ( )A.FⅡB.FⅩC.FⅦ D .FⅨ E.FⅢ17.由于基因变异而产生APC抵抗的凝血因子是 ( )A.FⅡB.FⅢC.FⅣ D .FⅤ E.FⅦ18.全身性shwartzman反应促进DIC发生的原因是 ( )A.抗凝物质合成障碍B.血液高凝状态C.单核-吞噬细胞系统功能受损D.微循环障碍E.纤溶系统受抑制19.使AT-Ⅲ消耗增多的情况是 ( )A.肝功能严重障碍B.口服避孕药C.DICD.肾病综合征E. AT-Ⅲ缺乏、异常症20.DIC患者最初常表现为 ( )A.少尿B.出血C.呼吸困难D.贫血E.嗜睡21. 导致DIC发生的关键环节是 ( )A.FⅫ的激活B.FⅢ的大量入血C.凝血酶大量生成D.纤溶酶原激活物的生成 E.FⅤ的激活22.急性DIC过程中,各种凝血因子均可减少,其中减少量最为突出的是: ( )A.纤维蛋白原B.凝血酶原 C.Ca2+ D.FⅩ E.FⅫ23.DIC引起的贫血属于 ( )A.再生障碍性贫血B.失血性贫血 C.中毒性贫血D.溶血性贫血E.缺铁性贫血24.DIC最主要的病理生理学特征是 ( )A.大量微血栓形成B.凝血功能失常 C.纤溶过程亢进D.凝血物质大量被消耗E.溶血性贫血25.引起微血管病性溶血性贫血发生的主要因素是 ( )A.微血管内皮细胞大量受损B.纤维蛋白丝在微血管内形成细网C.小血管内血流淤滞D.微血管内大量微血栓形成E.小血管强烈收缩26.关于D-二聚体的表述,哪一项是错误的 ( )A.在继发性纤溶亢进时,血中D-二聚体增高B.在原发性纤溶亢进时,血中FDP增高,D-二聚体并不增高C.D-二聚体是纤溶酶分解纤维蛋白的产物D.D-二聚体是纤溶酶分解纤维蛋白原的产物E.D-二聚体是DIC诊断的重要指标27.DIC时,血液凝固性表现为 ( )A.凝固性增高B.凝固性降低C.凝固性先增高后降低D.凝固性先降低后增高E.凝固性无明显变化28.大量使用肾上腺皮质激素容易诱发DIC是因为 ( )A.组织凝血活酶大量入血 B血管内皮细胞广泛受损C.增加溶酶体膜稳定性D.单核-吞噬细胞系统功能抑制E.肝素的抗凝活性减弱29. TF-Ⅶa复合物经传统通路可激活 ( )A.FⅤB.FⅩC.FⅢD.FⅪE.FⅨ30. F-Ⅶa复合物经选择通路可激活:A.FⅤB.FⅩC.FⅢD.FⅪE.FⅨ二、问答题1.简述各种原因使血管内皮细胞损伤引起DIC的机制。

卫生统计学第1-5次实验内容

卫生统计学第1-5次实验内容

卫生统计学第1-5次实验内容实验一统计表与统计图(一)实验目的1、掌握统计表的基本概念和列表原则;2、掌握统计图的基本概念和常用统计图的绘制方法。

(二)实验内容1、统计表常见错误的纠正。

2、常用统计图的绘制。

(三)实验资料的分析过程1.某地调查脾肿大和疟疾临床分型的关系、程度与血片查疟原虫结果列表2.试根据下表资料绘制适当统计图形。

3. 根据下表分别绘制普通线图和半对数线图,并说明两种统计图型的意义。

某地某年食管癌年龄别发病率(1/10万)年龄(岁)男女40~ 4.4 2.145~7.2 3.350~7.3 4.555~ 6.9 5.560~19.3 6.765~50.2 16.470~68.5 12.575~86.2 19.980~97.0 15.2实验二计量资料的统计描述(一)实验目的1、掌握各种平均数指标的计算及其适用条件;2、掌握离散趋势指标标准差的计算及其适用条件;3、熟悉频数表和直方图的绘制方法。

(二)实验内容1、编制大样本定量资料的频数分布表,了解资料的分布规律;2、算术均数、几何均数、中位数、极差、标准差的计算,医学参考值范围的制订。

(三)实验资料的分析过程1、某地100例30-40岁健康男子血清总胆固醇值(mg/dl )测定结果如下: 202 165 199 234 200 213 155 168 189 170 188 168 184 147 219 174 130 183 178 174 228 156 171 199 185 195 230 232 191 210 195 165 178 172 124 150 211 177 184 149 159 149 160 142 210 142 185 146 223 176 241 164 197 174 172 189 174 173 205 224 221 184 177 161 192 181 175 178 172 136 222 113 161 131 170 138 248 153 165 182 234 161 169 221 147 209 207 164 147 210 182 183 206 209 201 149 174 253 252 156(1)编制频数分布表并画出直方图;(2)根据频数表计算均值和中位数,并说明用哪一个指标比较合适; (3)计算百分位数5P 、25P 、75P 和95P 。

卫生统计学重点笔记

卫生统计学重点笔记

医师资格考试蓝宝书预防医学之答禄夫天创作医学统计学方法第一节基本概念和基本步伐(非常重要)一、统计工作的基本步伐设计(最关键、决定成败)、搜集资料、整理资料、分析资料.总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单元某一变量值的集合.总体的指标为参数.实际工作中,经常是从总体中随机抽取一定命量的个体,作为样本,用样本信息来推断总体特征.样本的指标为统计量.由于总体中存在个体变异,抽样研究中所抽取的样本,只包括总体中一部份个体,这种由抽样引起的不同称为抽样误差.抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低.某事件发生的可能性年夜小称为概率,用P暗示,在0~1之间,0和1为肯定不发生和肯定发生,介于之间为偶然事件,<0.05或0.01为小概率事件.二、变量的分类变量:观察单元的特征,分数值变量和分类变量.第二节数值变量数据的统计描述(重要考点)一、描述计量资料的集中趋势的指标有1.均数均数是算术均数的简称,适用于正态或近似正态分布.2.几何均数适用于等比资料,尤其是对数正态分布的计量资料.对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值lgX取代X)服从正态分布,观察值不能为0,同时有正和负.3.中位数一组按年夜小顺序排列的观察值中位次居中的数值.可用于描述任何分布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定命据资料的中心位置.不能求均数和几何均数,但可求中位数.百分位数是个界值,将全部观察值分为两部份,有X%比小,剩下的比年夜,可用于计算正常值范围.二、描述计量资料的离散趋势的指标1.全距和四分位数间距.2.方差和标准差最为经常使用,适于正态分布,既考虑了离均差(观察值和总体均数之差),又考虑了观察值个数,方差使原来的单元酿成了平方,所以开方为标准差.均为数值越小,观察值的变异度越小.3.变异系数多组间单元分歧或均数相差较年夜的情况.变异系数计算公式为:CV=s/×100%,公式中s为样本标准差,为样本均数.三、标准差的应用暗示观察值的变异水平(或离散水平).在两组(或几组)资料均数相近、怀抱单元相同的条件下,标准差年夜,暗示观察值的变异度年夜,即各观察值离均数较远,均数的代表性较差;反之,暗示各观察值多集中在均数周围,均数的代表性较好.(常考!)四、医学参考值的计算方法,单双侧问题,医学为95%医学参考值是指正凡人体或植物体的各种生理常数,由于存在变异,各种数据不单因人而异,而且同一个人还会随机体内外环境的改变而改变,因而需要确定其摆荡的范围,即正常值范围.医学参考值的计算公式:①正态分布资料95%医学参考值:±1.96s(双侧);+1.645s或 1.645s(单侧),s为标准差.②百分位数法P2.5和P97.5(双侧);P5或P95(单侧).第三节数值变量数据的统计推断(重要考点)一、标准误,标准误与标准差和样本含量的关系标准差和标准误的区别.样本标准误即是样本标准差除以根号下样本含量.标准误与标准差成正比;与样本含量的平方根成反比.因此.为减少抽样误差,应尽可能保证足够年夜的样本含量.样本标准差与样本标准误是既有联系又有区另外两个统计量,二者的联系是公式:二者的区别在于:样本标准差是反映样本中各观测值X1,X2,……,Xn变异水平年夜小的一个指标,它的年夜小说明了对该样本代表性的强弱.样本标准误是样本平均数1,2,……的标准差,它是抽样误差的估计值,其年夜小说明了样本间变异水平的年夜小及精确性的高低.(掌握!)二、t分布和标准正态u分布关系均以0为中心左右两侧完全对称的分布,只是t分布曲线顶端较u分布低,两端翘.(v逐渐增年夜,t分布逐渐迫近u分布).正态分布的特点:①以均数为中心左右两侧完全对称分布;②两个参数,均数u(位置参数)和s(变异参数);③对称均数的两正面积相等.三、总体均数的估计样本统计量推算总体均数有两个重要方面:区间估计和假设检验.样本均数估计总体均数称点估计.总体均数区间估计(可信区间)的概念:按一定的可信度估计未知总体均数所在范围.其统计上习惯用95%(或99%)可信区间暗示总体均数μ有95%(或99%)的可能在某一范围.可信区间的两个要素,一为准确度,反映在可信度1α的年夜小,即区间包括总体均数的概率年夜小,固然愈接近1愈好;二是精度,反映在区间的长度,固然长度愈小愈好.在样本例数确定的情况下,二者是矛盾的,需要兼顾.总体均数可信区间的计算方法:1.当n小按t分布的原理用式计算可信区间为:±tα/2,vS2.当n足够年夜因n足够年夜时,t分布迫近μ分布,按正态分布原理.用式估计可信区间为:±μα/2S可信区间与医学参考值范围的区别:二者的意义和算法分歧.四、假设检验的步伐1.建立假设:H0(无效,两样本代表的总体均数相同),H1(备择,两样原本自分歧总体),当拒绝H0就接受H1,不拒绝就不接受H1.2.确定显著性水平:区分年夜概率和小概率事件的标准,通常取α=0.05.3.计算统计量:根据资料类型和分析目的选择适当的公式计算.4.确定概率P值:将计算获得的t值或u值查界值表获得P 值和α值比力.5.做出推断结论.|t|值、P值与统计结论五、两均数的假设检验(常考!)1.样本均数与总体均数比力 u检验和t检验用于样本均数与总体均数的比力.理论上要求样原本自正态分布总体实际中,只要样本例数n较年夜,或n小但总体标准差σ已知,就选用u检验.n较小且σ未知时,用于t检验.两样本均数比力时还要求两总体方差等.以算得的统计量t,按表所示关系作判断.2.配对资料的比力在医学研究中,经常使用配对设计.配对设计主要有四种情况:①同一受试对象处置前后的数据;②同一受试对象两个部位的数据;③同一样品用两种方法(仪器等)检验的结果;④配对的两个受试对象分别接受两种处置后的数据.情况①的目的是推断其处置有无作用;情况②、③、④的目的是推断两种处置(方法等)的结果有无分歧.v=对子数1;如处置前后或两法无分歧,则其差数d的总体均数应为0,可看作样本均数和总体均数0的比力.为差数的均数;为差数均数的标准误,Sd为差数的标准差;n为对子数.因计算的统计量是t,按表所示关系作判断.3.完全随机设计的两样本均数的比力亦称成组比力.目的是推断两样本各自代表的总体均数μ1与μ2是否相等.根据样本含量n的年夜小,分u检验与t检验.t检验用于两样本含量n1、n2较小时,且要求两总体方差相等,即方差齐.若被检验的两样本方差相差显著则需用t′检验.u检验:两样本量足够年夜,n>50.=v=(n11)+(n21)=n1+n22式中,为两样本均数之差的标准误,Sc2为合并估计方差(combined estimate variance).算得的统计量为t,按表所示关系做出判断.4.Ⅰ型毛病和Ⅱ型毛病弃真,拒绝正确的H0为Ⅰ型毛病α暗示,若显著性水平α定为0.05,则犯Ⅰ型毛病的概率0.05;接受毛病的H0为Ⅱ型毛病,概率用β暗示,β值的年夜小很难确切估计.当样本含量一按时,两者反比,增年夜n,当α一按时,可减少β.1β称为检验效能或掌控度,其统计意义是若两总体确有分歧,按α水准能检出其差另外能力.客观实际拒绝H0 不拒绝H0H0成立Ⅰ型毛病(α)推断正确1αH0不成立推断正确(1β)Ⅱ型毛病(β)5.假设检验注意事项保证组间可比性;根据研究目的、资料类型和设计类型选用适当的检验方法,熟悉各种检验方法的应用条件;“显著与否”是统计学术语,为“有无统计学意义”,不能理解为“分歧是不是年夜”;结论不能绝对化.第四节分类变量资料的统计描述(一般考点)相对数是两个有关联事物数据之比.经常使用的相对数指标有构成比、率、相比较等.一、构成比暗示事物内部各个组成部份所占的比重,通常以100为例基数,故又称为百分比.其公式如下:构成比=×100%该式可用符号表达如下:构成比=×100%构成比有两个特点:(1)各构成部份的相对数之和为100%.(2)某一部份所占比重增年夜,其他部份会相应地减少.二、率用以说明某种现象发生的频率或强度,故又称频率指标,以100,1000,10000或100000为比例基数(K)均可,原则上以结果至少保管一位整数为宜,其计算公式为:率和构成比分歧之处:率的年夜小仅取决于某种现象的发生数和可能发生该现象的总数,不受其他指标的影响,而且各率之和一般不为1.率=×K该式亦可用符号表达如下阳性率=×K(若算阴性率则分子为A())式中A(+)为阳性人数,A()为阴性人数.三、相比较暗示有关事物指标之比较,常以百分数和倍数暗示,其公式为:相比较:甲指标/乙指标(或×100%)或用符号暗示为:A/B×K四、注意事项①构成比和率的分歧,不能以比代率;②计算相对数时,观察例数不宜过小;③率的比力注意可比性,特别是混杂因素的问题,有的话,可用标准化法和分层分析消除;④观察单元分歧的几个率的平均率不即是几个率的算术均数;⑤样本率或构成比的比力应做假设检验.第五节分类变量资料的统计推断(非常重要)一、率的抽样误差用抽样方法进行研究时,肯定存在抽样误差.率的抽样误差年夜小可用率的标准误来暗示,计算公式如下:σp=式中:σp为率的标准误,π为总体阳性率,n为样本含量.因为实际工作中很难知道总体阳性率π,故一般采纳样本率P来取代,而上式就酿成Sp=二、总体率的可信区间由于样本率与总体率之间存在着抽样误差,所以也需根据样本率来推算总体率所在的范围,根据样本含量n和样本率P的年夜小分歧,分别采纳下列两种方法:(一)正态近似法(常考!)当样本含量n足够年夜,且样本率P和(1P)均不太小,如nP 或n(1P)均≥5时,样本率的分布近似正态分布.则总体率的可信区间可由下列公式估计:总体率(π)的95%可信区间:p±1.96sp总体率(π)的99%可信区间:p±2.58sp(二)查表法当样本含量n较小,如n≤50,特别是P接近0或1时,则按二项分布原理确定总体率的可信区间,其计算较繁,读者可根据样本含量n和阳性数x参照专用统计学介绍的二项分布中95%可信限表.三、u检验(非常重要!)当样本含量n足够年夜,且样本率P和(1P)均不太小,如nP 或n(1P)均≥5时,样本率的分布近似正态分布.样本率和总体率之间、两个样本率之间差另外判断可用u检验.1.样本率和总体率的比力公式 u=|Pπ|/σP=|Pπ|/;2.两样本率比力公式u=|P1P2|/Sp1P2=|P1P2|/也可用χ2检验,两者相等.四、χ2检验(非常重要!)可用于两个及两个以上率或构成比的比力;两分类变量相关关系分析.其数据构成,一定是相互对峙的两组数据,四格表资料自由度v永远=1.四格表χ2检验各种公式适用条件,n>40且每个格子T>5,可用基本公式或专用公式,不用校正.基本公式:χ2=∑(AT)2/T专用公式:χ2=∑(adbc)2n/(a+b)(c+d)(a+c)(b+d)只要有一个格子T在1~5之间,需校正.校正公式:基本公式:χ2=∑(|AT|0.5)2/T专用公式:χ2=∑(|adbc|n/2)2n/(a+b)(c+d)(a+c)(b+d)n<40或T<1,用确切概率法.五、行×列表χ2检验当行数或列数超越2时,称为行×列表.行×列表χ2检验是对多个样本率(或构成比)的检验.适用条件:一般认为行×列表中不宜有1/5以上格子的理论数小于5,或有小于1的理论数.1.当理论数太小可采用下列方法处置①增加样本含量以增年夜理论数;②删去上述理论数太小的行和列;③将太小理论数所在组与性质相近的组合并,使重新计算的理论数增年夜.由于后两法可能会损失信息,损害样本的随机性,分歧的合并方式有可能影响推断结论,故不宜作惯例方法.另外,不能把分歧性质的实际数合并,如研究血型时,不能把分歧的血型资料合并.2.如检验结果拒绝检验假设,只能认为各总体率或总体构成比之间总的来说有分歧,但不能说明它们彼此之间都有分歧,或某两者间有分歧.3.关于单向有序行列表的统计处置在比力各处置组的效应有无分歧时,宜用秩和检验法,如作χ2检验只说明各处置组的效应在构成比上有无不同.六、配对计数资料的χ2检验同一样品用两种方法处置,观察阳性和阴性个数.判断两种处置方法是否相同.当b+c>40时,χ2=(bc)2/b+c;b+c<40时,校正公式:χ2=(|bc|1)2/b+c第六节直线相关和回归(一般考点)一、直线相关分析的用途、相关系数及其意义相关分析是研究事物或现象之间有无关系、关系的方向和密切水平.相关系数:是定量暗示两个变量(X,Y)之间线性关系的方向和密切水平的指标,用r暗示,r=lxy/,其值在1至+1间,r 没有单元.r呈正值,两变量间呈正相关,即两者的变动趋势是同向的,r=1时为完全正相关;如r呈负值,两变量呈负相关,即两者的变动趋势是反向的,r=1时为完全负相关.r的绝对值越接近1,两变量间线性相关越密切;越接近于0,相关越不密切.当r=0时,说明X和Y两个变量之间无直线关系.二、直线回归分析的作用、回归系数及其意义直线回归分析的任务在于找出两个变量有依存关系的直线方程,以确定一条最接近于各实测点的直线,使各实测点与该线的纵向距离的平方和为最小.这个方程称为直线回归方程,据此方程描绘的直线就是回归直线.直线同归方程式的一般表达式Y=a+bX式中a为回归直线在Y轴上的截距,即a>0暗示直线与Y轴的交点在原点上方,<0在原点下方,a=0过原点.b为样本回归系数,即回归直线的斜率,暗示当X变动一个单元时,Y平均变动b个单元.b>0:暗示Y随X增年夜而增年夜b<0:暗示Y随X增年夜而减少b=0:暗示Y不随X变动而变动第七节统计表和统计图(重要考点)一、统计表原则:结构简单、条理分明、内容安插合理、重点突出、数据准确.1.题目简练表达表的中心内容,位置在表的上方.2.标目有横标和纵标目,横标目通常位于表内左侧;纵标目列在表内上方,其表达结果与主辞呼应.3.线条力求简洁,一般为三线表.4.用阿拉伯数暗示,如无数据或暂缺资料,也可用“”或“…”来暗示.5.备注一般不列入表内,解释在表下.内容排列:一般按事物发生频率年夜小顺序来排列,比较鲜明,重点突出.二、统计图1.线图(line diagram)(常考!)资料性质:适用于连续变量资料.分析目的:用线段的升降表达某事物的静态(差值)变动.2.半对数线图(semilogarithmic line graph)资料性质:适用于连续变量资料.分析目的:用线段的升降表达事物的发展速度变动趋势.3.直方图(histogram)资料性质:适用于数值变量,连续性资料的频数表资料.分析目的:直方图是以直方面积表达各组段的频数或频率.4.直条图(bar chart)资料性质:适用于彼此自力的资料.分析目的:直条图是用等宽直条的和长短来暗示各统计量的年夜小,进行比力.5.百分条图(percentchart)资料性质:构成比.分析目的:用长条各段的长度(面积)表达内部构成比.6.圆形图(circulargraph)(常考!)资料性质:构成比.分析目的:用圆的扇形面积表达内部构成比.7.散点图(scatterdiagram)资料性质:双变量资料.分析目的:用点的密集度和趋势表达两变量间的相关关系.8.统计舆图(statistical map)资料性质:地区性资料.分析目的:用分歧纹线或颜色代表指标高低,说明地区分布.。

《实用卫生统计学》期末复习题及参考答案

《实用卫生统计学》期末复习题及参考答案

《实用卫生统计学》期末复习题及参考答案《实用卫生统计学》期末复习题一一、名词解释1、卫生统计学:2、随机抽样:3、构成比:4、频率:5、非参数检验:6、概率7、变异系数名词解释答案1. 卫生统计学:是运用数理统计的基本原理和方法,通过数据的收集,整理和分析,研究预防医学和卫生事业管理中随机现象规律性的一门应用科学。

2. 随机抽样:就是按照随机的原则获得样本,保证总体中每个个体都有同等机会被抽取,使样本对总体有较好的代表性。

3. 构成比:又称构成指标,它表示事物内部各组成部分所占比重或分布。

常用百分数表示。

4. 频率:若随机事件在n次重复中出现m次,则n/m比值成为随机事件出现的频率。

5.非参数检验:是一种不依赖总体分布类型,也不对总体参数(如总体均数)进行统计推断的假设检验。

6.概率是描述随机事件发生的可能性的大小的数值,常用P表示。

7.变异系数常记为CV,它被定义为标准差与算术均数之比。

《实用卫生统计学》期末复习题二单选题1.对某样品进行测量时,由于测量仪器事先未校正,造成测量结果普遍偏高,这种错误属于()。

A. 系统误差B. 随机测量误差C. 抽样误差D. 随机误差2.医学人口统计应属于卫生统计学中的哪部分内容( )。

A. 卫生统计学基本原理B. 卫生统计学基本方法C. 健康统计D.卫生服务统计3. 原始数据分布不明时,表示其集中趋势易采用( ) 。

A. 算数均数B. 几何均数C. 中位数D. 标准差4.描述一组偏态分布资料的变异度时,最适宜选择的指标是( ) 。

A.极差B.标准差C.四分位数间距D.变异系数5.下面哪一种图要求纵轴必需从0开始,中间不可以有折断( )。

A. 百分条图B. 直条图C.直方图D. 线图6.统计表中资料暂缺或未记录时,其空缺处通常用()表示。

A、—B、…C、0D、什么也不写7.表示均数抽样误差大小的统计指标是( )。

A 标准差B 均数标准误C 方差D 变异系数8.下面哪一个不是问卷的顺序()。

(完整word版)医学统计学考试重点(人卫第七版)

(完整word版)医学统计学考试重点(人卫第七版)

1、同质:是指观察单位或观察指标受共同因素制约的部分2、观察单位:亦称个体,是统计研究中最基本的单位3、变异:在同质的基础上个体间的差距4、总体:根据研究目的所确定的同质观察单位的全体,既是同质的所有观察单位某项观察值的集合5、有限总体:总体若受一定的时间和空间控制,其观察单位数是有限的,称为有限总体无限总体:理论上其观察单位数是无法穷尽的6、样本:是指从总体中随机抽取部分观察单位其某项指标实测值的集合7、抽样:从总体中抽取部分个体的过程称为抽样8、抽样必须遵循随机化原则,即总体中每一个体都有同等的机会被抽取到9、抽样研究的方法,利用样本的信息推论总体的特征来达到研究目的10、参数:描述总体特征的量11、统计量:根据样本个体值计算得到的描述样本特征的量12、总体参数是常数,而样本统计量可随样本不同而不同13、随机误差:指一类不恒定、随机变化的误差,有多种尚无法控制的因素所引起14、抽样误差:指抽样引起的样本统计量与总体参数之间的差异15、系统误差:在实际观测过程中,由于仪器未校正、观测者感官的某种倾向、研究者掌握的标准偏高或偏低等原因,使观察值不是随机分散在真值两侧,而是具有方向性、系统性或周期性的偏离真值,这类误差称为系统误差16、过失误差:指各种失误所导致的误差17、随机事件:在一定条件下某一现象可能发生也可能不发生的事件18、概率:反映某一随机事件发生可能性大小的量,用符号P表示19、小概率事件:统计学上一般把P≤0。

05的事件称为小概率事件,表示某事件发生的可能性很小20、变量:观察单位的某个特征21、变量值:变量的观察结果或测定值22、按变量值是定性的还是定量的,可将变量分为数值变量和分类变量23、数值变量又称定量变量,其变量值是用定量方法测得的,所的资料是计量资料24、分类变量又称定性变量,其变量值是用定性方法测得的25、分类变量根据类别是否有程度上的差别,可分为无序分类变量(构成的资料为计数资料)和有序分类变量(所得资料为等级资料)25、医学统计工作的基本步骤:一、设计;二、收集资料;三、整理资料;四、分析资料26、统计表和统计图是描述统计资料的重要工具27、统计表的结构:①标题位于统计表的上中方②标目用来说明表内各纵横数字的含义,注意标明指标的单位。

灌肠的注意事项之令狐文艳创作

灌肠的注意事项之令狐文艳创作

灌肠的注意事项
令狐文艳
(1)正确评估病人,了解灌肠的目的和病变部位,以便掌握灌肠的卧位和插入导管的深度。

大量不保留灌肠是7-10 cm。

保留灌肠是10-15 cm。

(2)灌肠前,应嘱病人排便,肛管要细,插管要深,液量要小,压力要低,使灌入药液能保留较长时间,利于肠粘膜充分吸收。

(3)肛门、直肠、结肠等手术后的病人,排便失禁的病人均不宜作保留灌肠。

(4)严密观察病人的反应和倾听病人的主诉,灌肠途中如液体流入受阻,可稍转动肛管或挤捏肛管使堵塞管孔的粪块脱落;如病人感觉腹胀或有便意,可降低灌肠筒高度以减慢灌速或暂停片刻,并嘱病人张口呼吸以放松腹肌,减轻腹压;如病人出现面色苍白,出冷汗,剧烈腹痛,心慌气急,应立即停止灌肠,并与医生联系给予处理。

(5)维护病人的自尊,尽量少暴露病人肢体,保护病人自尊心,并防止着凉。

(6)根据医嘱准备溶液的温度、浓度、压力和量。

如降温灌肠,应嘱病人保留30分钟后排出,排便后30分钟测量体温并记录;如肝昏迷病人,禁用肥皂水灌肠,以减少氨的产生和吸收;如伤寒病人,溶液不得超过500ml,压力要
低(即液面不得高于肛门30cm);如充血性心力衰竭或钠水潴留病人禁用生理盐水灌肠。

禁用清水灌肠,因大量水分由肠道吸收,可引起水中毒。

(7)禁忌证:急腹症、消化道出血、妊娠、严重心血管疾病等禁忌灌肠。

卫生统计学第八版李晓松第七章基本情形参数推断

卫生统计学第八版李晓松第七章基本情形参数推断

第四节 单个总体率
(一)总体率的置信区间估计
p p
Z
pz2p(1p)n,pz2p(1p)n
p2 (1) n
k
Pr(X k) Pr(x) 0
第四节 单个总体率
(一)总体率的置信区间估计
例13 随机抽样研究中从另一村人群中随机抽取的166名成人中,Ⅰ度以上检 出者有41名,现据此估计该地区成人大骨节病Ⅰ度以上检出率的95%的置信区 间。
Sp1p2p1(1p1)n1p2(1p2)n2
第四节 单个总体率
(二)总体率的假设检验
Zpp pp 1 2 1 2 p c ( X 1 X 2 )( n 1 n 2 ) Sp1p2 pc(1pc)(1n11n2)
第四节 单个总体率
(二)总体率的假设检验
No No Image
Image
第四节 单个总体率
第四节 单个总体率
(二)总体率的假设检验
No Image
第五节 两个总体率
第五节 两个总体率
(一)两样本率之差的抽样分布及其正态近似
No No Image
ImN ao ge Image
第五节 两个总体率
(一)两样本率之差的抽样分布及其正态近似
No Image
第五节 两个总体率
(二)两总体率之差的置信区间估计
第四节 单个总体率
(一)总体率的置信区间估计
Pr(X16)500Pr(x)115Pr(x)115 500!0.0043x0.9957500x1.1110-9
x16 x0 x0x!(500x)!
第四节 单个总体率
(二)总体率的假设检验
p0 p0 p1p2~N12,
2 p1p2
Z z(p 1 p 2 ) (1 2 )S p 1 p 2

卫生统计学第八版李晓松第三章数据的产生

卫生统计学第八版李晓松第三章数据的产生

第二节 随机对照试验
(一)设计原则
3. 重复(repeat)
(1)每组只有一个试验对象,那么试验结果可能只依赖于具有这类潜在 特质的人被分到了哪个组,但是,如果试验对象足够多,这类人的效应就 能够被平均化,两组的区别就会减少。 (2)重复思想:运用足够多的样本来降低试验的随机误差。
第二节 随机对照试验
第五节 伦理问题
(一)知情同意与个人隐私
1. 知情同意 受试者在参与试验前需充分了解研究的性质和任何潜在风险。 2. 国际医学委员会建议使用下面的方法
(1)对在社区水平上进行的研究,需征得对此试验负责的卫生行政部门的知情同意。 (2)以医院为研究单位时,应当获得当地伦理审查委员会的同意。 (3)当研究单位是学校、工作场所或社区时,应征得有关负责人的同意;同时,尽 可能告知社区民众该试验的研究目的、预期收益和可能的不方便或危险,并告知不同 意的人如何免受干预措施的影响。
第四节 样本的可靠性与代表性
(一)抽样分布
1. 变量的总体分布 总体中所有个体观测值的分布。 2. 统计量抽样分布 统计量的分布规律,描述了从同一总体重复抽样时,统计 量会有些什么样的值,以及每个值出现的可能性大小。
例3 某环境监测点2015年1月1日至2月28日对每小时PM10浓度值进行监测。 图 (A)采用某环 图 (B) 从这个总体中随机抽样(每次样本量为50),共抽取100次得到的100个样本均 数的分布。
卫生统计学
第三章 数据的产生
夏结来
第四军医大学
目录
01 02
03 04 05
第一节:数据的来源 第二节:随机对照试验 第三节:简单随机抽样 第四节:抽样的可靠性与代表性 第五节:伦理问题
重点难点

《医学统计学》检验

《医学统计学》检验

$number {01}《医学统计学》检验2023-12-02汇报人:目录•绪论•研究设计•数据收集与整理•定量数据的统计分析•定性数据的统计分析•临床医学应用•公共卫生应用•研究论文写作中的医学统计学01绪论123高级统计学包括多元统计分析、生存分析、随机森林等复杂统计模型,用于深入研究医学领域中的复杂现象。

描述统计学主要研究如何收集、整理、显示和概括数据,如统计图表和统计指标。

推断统计学主要研究如何根据样本数据推断总体特征,如假设检验和方差分析。

数据处理数据收集实验设计为确保医学研究的科学性和可靠性,需要采用合理的实验设计方法,如随机对照试验。

包括数据清洗、缺失值处理、异常值处理等。

通过问卷调查、临床记录、生物样本等方式收集数据。

医学统计学的应用临床研究在临床试验中运用统计学方法,为新药研发、治疗方案选择等提供依据。

公共卫生在流行病学调查、疾病监测、健康相关行为研究中运用统计学知识。

生物医学研究在遗传学、分子生物学、药理学等领域运用统计模型对生物数据进行分析。

02研究设计01将研究对象按照随机化原则分成实验组和对照组,保证各组间具有可比性。

随机化分组02采用双盲、单盲或开放式实验设计,减少主观因素对实验结果的影响。

盲法03设立对照是实验设计的核心,可以控制其他因素的干扰,评估处理因素的效果。

对照实验设计对目标人群进行全面调查,适用于了解总体情况。

普查从总体中抽取代表性样本,用样本信息推断总体特征。

抽样调查在某一时间点收集研究对象的相关信息,反映目前状况。

横断面调查调查设计根据研究对象的不同暴露状况,追踪观察其结局和时间顺序,确定暴露与结局的关系。

根据研究对象的不同暴露状况和结局,追溯其过去暴露情况,比较不同组别结局频率的差异。

队列研究设计回顾性队列研究前瞻性队列研究03数据收集与整理调查法实验法临床观察法通过问卷、访谈等方式收集数据,需确保调查对象代表性及调查内容准确性。

通过观察患者临床表现及疾病发展过程收集数据。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

医师资格考试蓝宝书-预防医学令狐文艳医学统计学方法第一节基本概念和基本步骤(非常重要)一、统计工作的基本步骤设计(最关键、决定成败)、搜集资料、整理资料、分析资料。

总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单位某一变量值的集合。

总体的指标为参数。

实际工作中,经常是从总体中随机抽取一定数量的个体,作为样本,用样本信息来推断总体特征。

样本的指标为统计量。

由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,这种由抽样引起的差异称为抽样误差。

抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。

某事件发生的可能性大小称为概率,用P表示,在0~1之间,0和1为肯定不发生和肯定发生,介于之间为偶然事件,<0.05或0.01为小概率事件。

二、变量的分类变量:观察单位的特征,分数值变量和分类变量。

第二节数值变量数据的统计描述(重要考点)一、描述计量资料的集中趋势的指标有1.均数均数是算术均数的简称,适用于正态或近似正态分布。

2.几何均数适用于等比资料,尤其是对数正态分布的计量资料。

对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值lgX代替X)服从正态分布,观察值不能为0,同时有正和负。

3.中位数一组按大小顺序排列的观察值中位次居中的数值。

可用于描述任何分布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定数据资料的中心位置。

不能求均数和几何均数,但可求中位数。

百分位数是个界值,将全部观察值分为两部分,有X%比小,剩下的比大,可用于计算正常值范围。

二、描述计量资料的离散趋势的指标1.全距和四分位数间距。

2.方差和标准差最为常用,适于正态分布,既考虑了离均差(观察值和总体均数之差),又考虑了观察值个数,方差使原来的单位变成了平方,所以开方为标准差。

均为数值越小,观察值的变异度越小。

3.变异系数多组间单位不同或均数相差较大的情况。

变异系数计算公式为:CV=s/X×100%,公式中s为样本标准差,X为样本均数。

三、标准差的应用表示观察值的变异程度(或离散程度)。

在两组(或几组)资料均数相近、度量单位相同的条件下,标准差大,表示观察值的变异度大,即各观察值离均数较远,均数的代表性较差;反之,表示各观察值多集中在均数周围,均数的代表性较好。

(常考!)四、医学参考值的计算方法,单双侧问题,医学为95%医学参考值是指正常人体或动物体的各种生理常数,由于存在变异,各种数据不仅因人而异,而且同一个人还会随机体内外环境的改变而改变,因而需要确定其波动的范围,即正常值范围。

医学参考值的计算公式:①正态分布资料95%医学参考值:X±1.96s(双侧);X+1.645s或X-1.645s(单侧),s 为标准差。

②百分位数法P2.5和P97.5(双侧);P5或P95(单侧)。

第三节数值变量数据的统计推断(重要考点)一、标准误,标准误与标准差和样本含量的关系标准差和标准误的区别。

样本标准误等于样本标准差除以根号下样本含量。

标准误与标准差成正比;与样本含量的平方根成反比。

因此。

为减少抽样误差,应尽可能保证足够大的样本含量。

样本标准差与样本标准误是既有联系又有区别的两个统计量,二者的联系是公式:二者的区别在于:样本标准差是反映样本中各观测值X1,X2,……,X n变异程度大小的一个指标,它的大小说明了对该样本代表性的强弱。

样本标准误是样本平均数1,2,……的标准差,它是抽样误差的估计值,其大小说明了样本间变异程度的大小及精确性的高低。

(掌握!)二、t分布和标准正态u分布关系均以0为中心左右两侧完全对称的分布,只是t分布曲线顶端较u分布低,两端翘。

(v逐渐增大,t分布逐渐逼近u 分布)。

正态分布的特点:①以均数为中心左右两侧完全对称分布;②两个参数,均数u(位置参数)和s(变异参数);③对称均数的两侧面积相等。

三、总体均数的估计样本统计量推算总体均数有两个重要方面:区间估计和假设检验。

样本均数估计总体均数称点估计。

总体均数区间估计(可信区间)的概念:按一定的可信度估计未知总体均数所在范围。

其统计上习惯用95%(或99%)可信区间表示总体均数μ有95%(或99%)的可能在某一范围。

可信区间的两个要素,一为准确度,反映在可信度1-α的大小,即区间包含总体均数的概率大小,当然愈接近1愈好;二是精度,反映在区间的长度,当然长度愈小愈好。

在样本例数确定的情况下,二者是矛盾的,需要兼顾。

总体均数可信区间的计算方法:1.当n小按t分布的原理用式计算可信区间为:X±tα/2,v S X2.当n足够大因n足够大时,t分布逼近μ分布,按正态分布原理。

用式估计可信区间为:X±μα/2SX可信区间与医学参考值范围的区别:二者的意义和算法不同。

四、假设检验的步骤1.建立假设:H0(无效,两样本代表的总体均数相同),H1(备择,两样本来自不同总体),当拒绝H0就接受H1,不拒绝就不接受H1。

2.确定显著性水平:区分大概率和小概率事件的标准,通常取α=0.05。

3.计算统计量:根据资料类型和分析目的选择适当的公式计算。

4.确定概率P值:将计算得到的t值或u值查界值表得到P值和α值比较。

5.做出推断结论。

|t|值、P值与统计结论五、两均数的假设检验(常考!)1.样本均数与总体均数比较 u检验和t检验用于样本均数与总体均数的比较。

理论上要求样本来自正态分布总体实际中,只要样本例数n较大,或n小但总体标准差σ已知,就选用u检验。

n较小且σ未知时,用于t检验。

两样本均数比较时还要求两总体方差等。

以算得的统计量t ,按表所示关系作判断。

2.配对资料的比较 在医学研究中,常用配对设计。

配对设计主要有四种情况:①同一受试对象处理前后的数据;②同一受试对象两个部位的数据;③同一样品用两种方法(仪器等)检验的结果;④配对的两个受试对象分别接受两种处理后的数据。

情况①的目的是推断其处理有无作用;情况②、③、④的目的是推断两种处理(方法等)的结果有无差别。

v =对子数-1;如处理前后或两法无差别,则其差数d 的总体均数应为0,可看作样本均数d 和总体均数0的比较。

d 为差数的均数;d S 为差数均数的标准误,S d 为差数的标准差;n 为对子数。

因计算的统计量是t ,按表所示关系作判断。

3.完全随机设计的两样本均数的比较 亦称成组比较。

目的是推断两样本各自代表的总体均数μ1与μ2是否相等。

根据样本含量n 的大小,分u 检验与t 检验。

t 检验用于两样本含量n 1、n 2较小时,且要求两总体方差相等,即方差齐。

若被检验的两样本方差相差显著则需用t ′检验。

u 检验:两样本量足够大,n>50。

21X X S -=)(21212C n n n n S + v =(n 1-1)+(n 2-1)=n 1+n 2-2 式中21X X S -,为两样本均数之差的标准误,Sc 2为合并估计方差(combined estimate variance)。

算得的统计量为t,按表所示关系做出判断。

4.Ⅰ型错误和Ⅱ型错误弃真,拒绝正确的H0为Ⅰ型错误α表示,若显著性水平α定为0.05,则犯Ⅰ型错误的概率0.05;接受错误的H0为Ⅱ型错误,概率用β表示,β值的大小很难确切估计。

当样本含量一定时,两者反比,增大n,当α一定时,可减少β。

1-β称为检验效能或把握度,其统计意义是若两总体确有差别,按α水准能检出其差别的能力。

客观实际拒绝H0不拒绝H0H0成立Ⅰ型错误(α)推断正确1-αH0不成立推断正确(1-β)Ⅱ型错误(β)5.假设检验注意事项保证组间可比性;根据研究目的、资料类型和设计类型选用适当的检验方法,熟悉各种检验方法的应用条件;“显著与否”是统计学术语,为“有无统计学意义”,不能理解为“差别是不是大”;结论不能绝对化。

第四节分类变量资料的统计描述(一般考点)相对数是两个有关联事物数据之比。

常用的相对数指标有构成比、率、相对比等。

一、构成比表示事物内部各个组成部分所占的比重,通常以100为例基数,故又称为百分比。

其公式如下: 构成比=个体数总和事物内部各构成部分的的个体数事物内部某一构成部分×100% 该式可用符号表达如下: 构成比=⋯⋯+++C B A A ×100% 构成比有两个特点:(1)各构成部分的相对数之和为100%.(2)某一部分所占比重增大,其他部分会相应地减少。

二、率用以说明某种现象发生的频率或强度,故又称频率指标,以100,1000,10000或100000为比例基数(K )均可,原则上以结果至少保留一位整数为宜,其计算公式为:率和构成比不同之处:率的大小仅取决于某种现象的发生数和可能发生该现象的总数,不受其他指标的影响,并且各率之和一般不为1。

率=可能发生某现象的总数某现象实际发生例数×K 该式亦可用符号表达如下 阳性率=)()()(-+++A A A ×K (若算阴性率则分子为A (-))式中A (+)为阳性人数,A (-)为阴性人数。

三、相对比表示有关事物指标之对比,常以百分数和倍数表示,其公式为:相对比:甲指标/乙指标(或×100%)或用符号表示为:A/B×K四、注意事项①构成比和率的不同,不能以比代率;②计算相对数时,观察例数不宜过小;③率的比较注意可比性,特别是混杂因素的问题,有的话,可用标准化法和分层分析消除;④观察单位不同的几个率的平均率不等于几个率的算术均数;⑤样本率或构成比的比较应做假设检验。

第五节分类变量资料的统计推断(非常重要)一、率的抽样误差用抽样方法进行研究时,必然存在抽样误差。

率的抽样误差大小可用率的标准误来表示,计算公式如下:σp=n π)π(1+式中:σp为率的标准误,π为总体阳性率,n为样本含量。

因为实际工作中很难知道总体阳性率π,故一般采用样本率P来代替,而上式就变为S p=n P)P(1-二、总体率的可信区间由于样本率与总体率之间存在着抽样误差,所以也需根据样本率来推算总体率所在的范围,根据样本含量n和样本率P 的大小不同,分别采用下列两种方法:(一)正态近似法(常考!)当样本含量n足够大,且样本率P和(1-P)均不太小,如nP 或n (1-P )均≥5时,样本率的分布近似正态分布。

则总体率的可信区间可由下列公式估计:总体率(π)的95%可信区间:p ±1.96s p总体率(π)的99%可信区间:p ±2.58s p(二)查表法 当样本含量n 较小,如n ≤50,特别是P 接近0或1时,则按二项分布原理确定总体率的可信区间,其计算较繁,读者可根据样本含量n 和阳性数x 参照专用统计学介绍的二项分布中95%可信限表。

相关文档
最新文档