计量资料的标准差和标准误有何区别与联系1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、计量资料的标准差和标准误有何区别与联系
标准差和标准误都是变异指标,但它们之间有区别,也有联系。
区别: ①概念不
同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽
样误差;②用途不同;标准差与均数结合估计参考值范围,计算变异系数,计算
标准误等。
标准误用于估计参数的可信区间,进行假设检验等。
③它们与样本含
量的关系不同: 当样本含量n 足够大时,标准差趋向稳定;而标准误随n的增大
而减小,甚至趋于0 。
联系: 标准差,标准误均为变异指标,当样本含量不变时,
标准误与标准差成正比。
2、二项分布、Poission分布的应用条件
二项分布的应用条件:医学领域有许多二分类记数资料都符合二项分布(传染病和遗传
病除外),但应用时仍应注意考察是否满足以下应用条件:(1) 每次实验只有两类对立
的结果;(2) n次事件相互独立;(3) 每次实验某类结果的发生的概率是一个常数。
Poisson分布的应用条件:医学领域中有很多稀有疾病(如肿瘤,交通事故等)资料都符合Poisson分布,但应用中仍应注意要满足以下条件:(1) 两类结果要相互对立;(2) n次试验相互独立;(3) n应很大, P应很小。
3、极差、四分位数间距、标准差、变异系数的适用范围有何异同?
答:这四个指标的相同点在于均用于描述计量资料的离散程度。
其不同点为:
极差可用于各种分布的资料,一般常用于描述单峰对称分布小样本资料的变异程度,或用于初步了解资料的变异程度。
若样本含量相差较大,不宜用极差来比较资料的离散程度。
四分位数间距适用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。
标准差常用于描述对称分布,特别是正态分布或近似正态分布资料的离散程度。
变异系数适用于比较计量单位不同或均数相差悬殊的几组资料的离散程度。
4.中位数、均数、几何均数的适用条件有何异同。
(1)均数适用于描述对称分布,特别是正态分布的数值变量资料的平均水平;(2)几何均数适用于描述原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的数值变量资料的平均水平;(3)中位数适用于描述呈明显偏态分布(正偏态或负偏态),或分布情况不明,或分布的末端有不确切数值的数值变量资料的平均水平。
5.第一类错误与第二类错误的区别与联系。
当假设检验拒绝了实际上成立的零假设时,所犯的错误称为第一类错误,其概率用α表示。
当假设检验接受实际上不成立的零假设时,所犯的错误称为第二类错误,其概率用β表示。
当样本含量一定时,α愈大,β愈小,反之,α愈小,β愈大。
1-β称为检验效能或把握度,其意义是两总体确有差别,按α水准能发现它们有差别的能力。
6.运用相对数时要注意哪些问题?
应用相对数时应注意以下几个事项(1)计算率和构成比时观察单位不宜过小;(2)注意正确区分构成比和率,不能以比代率;(3)对率和构成比进行比较时,应注意资料的可比性;(4)当比较两个总率时,若其内部构成不同,需要进行率的标准化;(5)两样本率比较时应进行假设检验。
7.方差分析后进行两两比较能否用t检验?为什么?
t检验仅用在单因素两水平设计(包括配对设计和成组设计)和单组设计(给出一组数据和一个标准值的资料)的定量资料的均值检验场合;而方差分析用在单因素k水平设计(k≥3)和多因素设计的定量资料的均值检验场合。
方差分析有十几种,不同的方差分析取决于不同的设计类型。
t检验进行两两比较
其一,将多因素各水平的不同组合、简单地看作单因素的多个水平(即视为单因素水平),混淆了因素与水平之间的区别,从而错误地确定了实验设计类型;其二,分析资料时,常错误用单因素多水平设计或仍采用多次t检验进行两两比较。
误用这两种方法的后果是,不仅无法分析因素之间的交互作用的大小,而且,由于所选用的数学模型与设计不匹配,易得出错误的结论。
8.均数的参考值范围与可信区间的区别?
(1)意义不同: 参考值范围是指同质总体中包括一定数量(如95%或99%) 个体值的估计范围。
可信区间是指按一定的可信度来估计总体参数所在范围。
(2)计算方法不同: 参考值范围用计算。
可信区间用或计算,前者用标准差,后者用标准误。
10.参数检验与非参数检验的区别何在?各有何优缺点?
(1)区别:
参数检验:以已知分布(如正态分布)为假定条件,对总体参数进行估计或检验。
非参数检验:不依赖总体分布的具体形式,检验分布位置是否相同。
(2)优缺点:
参数检验:优点是符合条件时,检验效能高。
缺点是对资料要求严格,如等级资料、分布不明或末端有不明确数据的资料不能用参数检验,要求资料的分布类型已知且总体方差相等。
非参数检验:优点是应用范围广、简便;缺点是对于符合参数统计的资料,如果用非参数统计会造成资料信息的丢失,致使检验效能下降,犯第二类错误的概率增大。
故符合参数统计条件的资料,要首先选用参数统计的方法。
当参数统计的应用条件得不到满足时,应选用非参数统计。
11.对于同一资料,又出自同一研究目的,用参数检验和非参数检验所得结果不一致时,应以何种结果为准。
当资料满足参数检验方法的条件时,应使用参数检验方法,当资料不满足参数检验方法的条件时,必须采用非参数检验方法。
12、常见的统计图有哪些?如何根据资料的性质选用适当的统计图?
常用的统计图及适用条件是: ①条图,适用于相互独立的资料,以表示其指标大小;②百分条图及远圆图,适用于构成比资料,反映各组成部分的大小;③普通线图: 适用于连续性资料,反映事物在时间上的发展变化的趋势,或某现象随另一现象变迁的情况。
④半对数线图,适用于连续性资料,反映事物发展速度(相对比)。
⑤直方图: 适用于连续性变量资料,反映连续变量的频数分布。
⑥散点图: 适用于成对数据,反映散点分布的趋势。
13.简述方差分析的基本思想。
方差分析的基本思想是: 根据研究资料设计的类型及研究目的,把全部观察值总变异分解为两个或多个组成部分,其总自由度也分解为相应的几个部分。
例如完全随机设计的方差分析,可把总变异分解为组间变异和组内变异,即SS总=SS组内+SS组间,总的自由度也分解为相应的两部分,即ν总=ν组内+ν组间。
离均差平方和除以自由度得均方MS,组间均方(MS组间)与误差均方(MS误差)之比为F值;如果各组处理的效应一样,则组间均方等于组内均方,即F=1;但由于抽样误差,F值不正好等于1,而是接近1;如果F值较大,
远离1,说明组间均方大于误差均方,反映各处理组的效应不一样,即各组均数差别有意义,至于F值多大才能认为差别有意义,可查F 界值表(方差分析用)来确定。
14. 极差、四分位数间距、标准差、变异系数的适用范围有何异同?
答:这四个指标的相同点在于均用于描述计量资料的离散程度。
其不同点为:
极差可用于各种分布的资料,一般常用于描述单峰对称分布小样本资料的变异程度,或用于初步了解资料的变异程度。
若样本含量相差较大,不宜用极差来比较资料的离散程度。
四分位数间距适用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。
标准差常用于描述对称分布,特别是正态分布或近似正态分布资料的离散程度。
变异系数适用于比较计量单位不同或均数相差悬殊的几组资料的离散程度。
名词解释
1.总体与样本:总体:根据研究目的确定的同质观察单位的全体。
更确切地说,它是根据研究目的确定的同质观察单位某种变量值的集合。
样本:由总体中随机抽取部分观察单位的变量值组成。
样本是总体中有代表性的一部分。
2.中位数:将数据排序后,位置在最中间的数值。
即将数据分成两部分,一部分大于该数值,一部分小于该数值。
中位数的位置:当样本数为奇数时,中位数=第(N+1)/2个数据 ; 当样本数为偶数时,中位数为第N/2个数据与第N/2+1个数据的算术平均值。
3、计量资料:又称数值变量,指用定量的方法测定某观察对象的某项特征,并以
数值表示大小,所得资料,称为计量资料
4、计数资料:又称为定性资料或无序分类变量资料,也称名义变量资料,是将观察单位按某种属性或类别分组计数,分别汇总各组观察单位数后而得到的资料,其变量值是定性的,表现为互不相容的属性或类别。
5、等级资料:指有一定级别的数据,如临床疗效分为治愈、显效、好转、无效,临床检验结果分为-、+、++、+++,疼痛等症状的严重程度分为0(无疼痛)、1(轻度)、2(中度)、3(重度)等,等级资料又称为半定量资料。
6.变异系数:标准差与平均数的比值称为变异系数,又称“标准差率”,记为C.V。
变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。
是衡量资料中各观测值变异程度的另一个统计量。
当进行两个或多个资料变异程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。
如果单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。
7、抽样误差:抽样方法本身所引起的误差。
当由总体中随机地抽取样本时,哪个样本被抽到是随机的,由所抽到的样本得到的样本指标x与总体指标μ之间偏差,称为实际抽样误差。
8、第一类错误与第二类错误:Ⅰ型错误又称第一类错误:拒绝了实际上成立的,为“弃真”的错误,其概率通常用表示。
可取单尾也可取双尾,假设检验时研究者可以根据需要确定值大小,一般规定=0.05或=0.01,其意义为:假设检验中如果拒绝时,发生Ⅰ型错误的概率为5%或1%,即100次拒绝的结论中,平均有5次或1次是错误的。
Ⅱ型错误又称第二类错误:不拒绝实际上不成立的,为“存伪”的错误,其概率通常用表示。
只取单尾,假设检验时值一般不知道,在一定情况下可以测算出,如已知两总体的差值(如)、样本含量和检验水准。
当假设检验拒绝了实际上成立的零假设时,所犯的错误称为第一类错误,其概率用α表示。
当假设检验接受实际上不成立的零假设时,所犯的错误称为第二类错误,其概率用β
表示。
当样本含量一定时,α愈大,β愈小,反之,α愈小,β愈大。
1-β称为检验效能或把握度,其意义是两总体确有差别,按α水准能发现它们有差别的能力
9、统计表与统计图:统计表和统计图是统计描述的重要方法。
医学科学研究资料经过整理和计算各种统计指标后,所得结果除了用适当的文字说明外,常将统计资料及其指标以表格列出(称为统计表),或将统计资料形象化,利用点的位置、线断的升降、直条的长短或面积的大小等形式直观表示事物间的数量关系(称为统计图,)。
统计表与统计图可以代替冗长的文字叙述,表达清楚,对比鲜明。
10、相关系数:相关系数是变量之间相关程度的指标。
样本相关系数用r表示,总体相关系数用ρ表示,相关系数的取值范围为[-1,1]。
|r|值越大,
误差Q越小,变量之间的线性相关程度越高;|r|值越接近0,Q越大,变量之间的线性相关程度越低。
11、决定系数:表依变数Y的变异中有多少百分比,可由控制的自变数X来解释.R2=.
相关系数的平方即为决定系数。
它与相关系数的区别在于除掉|R|=0和1情况,
由于R2<R,可以防止对相关系数所表示的相关做夸张的解释。
决定系数:在Y的总平方和中,由X引起的平方和所占的比例,记为R2(R 的平方)
决定系数的大小决定了相关的密切程度。
当R2越接近1时,表示相关的方程式参考价值越高;相反,越接近0时,表示参考价值越低。
这是在一元回归分析中的情况。
但从本质上说决定系数和回归系数没有关系,就像标准差和标准误差在本质上没有关系一样。
在多元回归分析中,决定系数是相关系数的平方。
12、相对比:为相对数指标之一。
以两个有关系的数量或指标相比,用来说明二者的比例关系。
相对比可用绝对值、相对值和平均值进行计算。
公式为:相对比=某一数量/另一数量×100%。
13、率:说明某现象的发生频率或强度,常以百分率,千分率,万分率等表示,计算公式为
率=某时期内发生某现象的观察单位数*比例基数
同时期内可能发生某现象的观察单位总数。