医学统计学第三版复习总结
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章绪论
统计的三大特征:实用性、丰富性、公平性
总体(population):
●是根据研究目的确定的、同质的全部研究对象中所有观察单位某种变量值的集合。
●同质基础:时间、空间、条件等
●(1)有限总体(finite population):有限观察单位
●(2)无限总体(infinite population):很多为无限总体。
样本
●根据随机化原则从总体中抽取的一定数量(sample size)的个体,称为样本
(sample),用样本信息来推断总体特征。
●从总体中抽取部分个体的过程称为抽样(sampling)。
同质(homogeneity)
●是指影响被研究指标的非实验因素相同。
变异(variation, variablility )
●同质基础上的各观察单位(亦称为个体)之间的差异为变异。如同性别、同年龄、
同民族、同地区儿童的身高有高有低,称为身高的变异。
参数(parameter)和统计量(statistic)
●总体的统计指标称为参数。
如:总体均数(µ),总体发病率,总体死亡率,等,
●样本的统计指标称为统计量
如:样本均数(x),样本发病率,样本死亡率,等,
●统计学上用不同的符号表示。
误差(error)
观察值与实际值的差异,成为误差。
分为:过失误差;系统误差;随机测量误差;随机抽样误差;
(1)过失误差(mistaken error):过失所致的误差(不认真,错误判断,记录等原因);(2)系统误差(systematic error):仪器未校准所致的误差(统一偏高,或偏低);
这两类误差可以避免。
(3)随机测量误差(random measurement error):不同观察者或同一观察者多次观察值的不相同。
这种误差不可避免。
(4)抽样误差(sampling error):总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,因而样本均数(或率)往往不等于总体均数(或率),表现为多次抽样的样本均数或率不同。这种由抽样引起的差异称为抽样误差。
抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。
由于生物的个体变异是客观存在的,因而抽样误差是不可避免的,但抽样误差有一定的规律性。
小概率事件定理:
“小概率事件一次抽样不可能发生”
变量及变量值
●变量(variable):观察对象的特征或指标。对变量进行取值所采用的工具或标准成
为测量尺度(scale)。
●测量的结果称为变量值(value of variable) 或观察值(observed value,
measurements)。
随机化(randomization)
使总体中的每个个体有均等的机会成为样本观察单位的过程,称为随机化。
●随机抽样旨在避免人的主观性,让机遇起作用,以反映总体的客观情况。
常用:抽签法,随机数目表法,计算器随机数法;
单纯随机抽样(simple random sampling):总体全部观察单位编号,再用随机数字法或抽签法;
整群抽样cluster sampling:直接由若干个群组成的总体中随机抽取若干个群,再对被抽取的每个群的全部观察单位加以调查。
系统抽样systematic sampling:( 间隔抽样,机械抽样)
先将总体观察单位按某顺序号分成n个部分,再从第一部分抽第k号观察单位,依次用此相等间隔机械地从每一部分各抽一个观察单位组成样本。
分层抽样stratified sampling:先按某种特征将总体分为若干组别、类型、区域,再从每一层内随机抽样,组成样本。
●抽样误差:分层抽样<系统抽样<单纯随机抽样<整群抽样
第二章统计资料的收集和整理
一、资料的类型
根据是否定量划分:
(1)计量资料(measurement data)
用定量方法测量每个观察单位的某项指标,所得的数值资料为计量资料,亦称数值变量资料。一般有度量衡单位。
常用:平均数,标准差,t检验,方差分析,相关与回归等分析。
(2)计数资料(enumeration data)
将观察单位按某种属性或类别分组,然后清点各组的观察单位数,为计数资料(亦称分类变量资料,无序分类资料)。
常用:率、构成比、卡方检验等
(3)等级资料(ranked data)
将观察单位按某种属性的不同程度分组,所得各组的观察单位数为等级资料,亦称有序分类资料。
常用:率、构成比、秩和检验等。
三者联系:
等级资料与计数资料不同:属性的分组有程度差别,各组大小顺序排列;
等级资料与计量资料不同:每个观察单位未确切定量,称为半定量资料。
介于计量资料与计数资料之间。
计量资料→计数资料→等级资料
调查设计和实验设计
调查设计一般包括专业设计和统计设计。
实验设计(experiment design)
医学实验的基本要素包括处理因素、受试对象和实验效应三部分。
实验设计应遵循对照(空白对照,试验对照,安慰剂对照,配对对照,组间对照
)、随机、重复(即样本例数)的原则。
频数分布表(frequency distribution table)
●用途:
(1)揭示频数的分布特征:两个重要特征:
●集中趋势(central tendency):数值高低不等,但中等水平的人数最多。