数理统计复习资料
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
复习资料(资料总结,仅供参考)
判断题
1.
研究人员测量了100例患者外周血的红细胞数,所得资料为计数资料。
X 2.
统计分析包括统计描述和统计推断。
3.
计量资料、计数资料和等级资料可根据分析需要相互转化。
4.
均数总是大于中位数。
X 5.
均数总是比标准差大。
X 6.
变异系数的量纲和原量纲相同。
X 7.
样本均数大时,标准差也一定会大。
X 8.
样本量增大时,极差会增大。
9.
若两样本均数比较的假设检验结果P 值远远小于0.01,则说明差异非常大。
X 10.
对同一参数的估计,99%可信区间比90%可信区间好。
X 11.
均数的标准误越小,则对总体均数的估计越精密。
12. 四个样本率做比较,2)3(05.02χχ> ,可认为各总体率均不相等。
X
13.
统计资料符合参数检验应用条件,但数据量很大,可以采用非参数方法进行初步分析。
14.
对同一资料和同一研究目的,应用参数检验方法,所得出的结论更为可靠。
X 15.
等级资料差别的假设检验只能采用秩和检验,而不能采用列联表χ2检验等检验方法X 。
16.
非参数统计方法是用于检验总体中位数、极差等总体参数的方法。
X 17.
剩余平方和SS 剩1=SS 剩2,则r 1必然等于r 2。
X 18.
直线回归反映两变量间的依存关系,而直线相关反映两变量间的相互直线关系。
19.
两变量关系越密切r 值越大。
X 20.
一个绘制合理的统计图可直观的反映事物间的正确数量关系。
21.
在一个统计表中,如果某处数字为“0”,就填“0”,如果数字暂缺则填“…”,如果该处没 有数字,则不填。
X 22.
备注不是统计表的必要组成部分,不必设专栏,必要时,可在表的下方加以说明。
23.
散点图是描写原始观察值在各个对比组分布情况的图形,常用于例数不是很多的间断性分组资料的比较。
24.
百分条图表示事物各组成部分在总体中所占比重,以长条的全长为100%,按资料的原始顺序依次进行绘制,其他置于最后。
X 25.
用元参钩藤汤治疗80名高血压患者,服用半月后比服用前血压下降了2.8kPa ,故认为该药有效( X )。
26. 在实验设计中,样本含量越大,越符合其重复原则,越能降低实验误差(X )。
填空题
1、 X ±1.96S 表示:———————————————————。
2、 S X X 58.2±表示———————————————————
3、 配对四格表资料的χ2检验采用校正公式的条件为————。
4、四格表资料的χ2检验采用校正公式的条件为————。
5、横轴上,正态曲线下,从μ-1.96σ到μ+1.96σ的面积为————。
6、横轴上,正态曲线下,从μ-1.96σ到μ+2.58σ的面积为————。
7、随机区组设计的方差分析,可将总变异分解为:———————————。
8、完全随机设计的方差分析,可将总变异分解为:———————————。
9、表示计量资料集中趋势的统计指标有————、————、————。
10、表示计量资料离散趋势的统计指标有:————、————、————、————。
11、回归系数b的假设检验,H0表示为———————。
12、相关系数b的假设检验,H0表示为———————。
13、两样本均数比较的假设检验,H0表示为———————。
14、配对t检验,H0表示为———————。
15、两样总体率比较的χ2检验,H0表示为———————。
16、两样本率比较的χ2检验,其自由度为————。
17、单样本t检验,其自由度为————。
18、成组(两样本)t检验,其自由度为————。
19、回归(相关)假设检验,其自由度为————。
20、四格表资料的χ2检验的基本条件是——————————————。
21、两个样本均数比较的u检验,其应用条件为:————————————————
—————————————————。
22、F检验的条件为―――――――――――――――――――
23、t检验的条件为―――――――――――――――――――
24、在直线相关分析中,用积差法计算相关系数的条件是:————
———————————————————————。
25、用百分位数法计算某指标的95%正常值范围,如取单侧界限,需计算的统计指标
是————————。
26、用百分位数法计算某指标的99%正常值范围,如取单侧界限,需计算的统计指标
是————或————。
27、完全随机设计多组差别比较的秩和检验的检验统计量为:
———————————。
28、常用的相对数有————、————、————。
29、 医学资料的类型有————、————、————。
30、 统计学中所指的误差,主要有————、————、————、————。
31、 σx 小表示———————————————————。
32、 比较甲乙两地血型的构成比有无差别,宜用————检验。
33、 总体———————————————————————。
34、 概率———————————————————————。
35、 平均数是——————————————————,常用平均数有————、
————、————。
36、 中位数和四分位数间距适用—————————分布资料,各反映该分布的
—————————————特征。
37、 变异系数用于①———————————————————————;
②———————————————————————。
38、 可信区间是指—————————————————————————。
39、 率的抽样误差—————————————————————————。
40、 σ是指———对μ的离散程度;X σ是指———对μ的离散程度。
41、 X 服从N (8,2
2)的正态分布,X 的5.97P 为:———。
42、 统计分析包括————和————。
43、 完全随机设计多组差别比较的秩和检验,计算统计量H 的公式为: ∑+-+=)1(3)1(122N n R N N H i
i 式中i R 表示———————————;i n 表示———————————;N 表示
———————————。
44、 用最小二乘法原理确定回归直线是使———————————————————
为最小。
45、 两样本率比较的2
χ检验中,结果为P<0.05,则在α=0.05水准上拒绝0H ,接受1H ,
P 愈小则———————————————————————。
名词解释
总体:总体(population )是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample )。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
变异:个体间测量结果的差异称为变异。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
标准差(standard deviation )是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。
(S :样本标准差,σ:总体标准差) 标准误:通常将样本统计量的标准差称为标准误。
许多样本均数的标准差X σ称为均数的标准误(standard error of mean ,SEM ),它反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小。
(p σ:率的标准误,X σ:均数的标准误,X S :标准误的点估计值)
中位数:将一组观察值由小到大排列或从大到小排列,位次居中的那个数。
四分位数间距(inter-quartile range )是由第3四分位数和第1四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。
极差(range )亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。
统计推断:通过样本指标来说明总体特征,这种通过样本获取有关总体信息的过程称为统计推断(statistical inference )。
抽样误差(均数/率的误差):由个体变异产生的,由于抽样造成的样本统计量与总体参数的差异,称为抽样误差(sampling error )。
参数估计:指用样本统计量估计总体参数。
参数估计有两种方法:点估计和区间估计。
可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。
该范围称为总体参数的可信区间(CI )。
它的确切含义是:可信区间包含总体参数的可能性是1-α,而不是总体参数落在该范围的可能性为1-α。
I 型和II 型错误:I 型错误(type I error ),指拒绝了实际上成立的H 0,这类“弃真”的错误称为I 型错误,其概率大小用α表示;II 型错误(type II error ),指接受了实际上不成立的H 0,这类“存伪”的错误称为II 型错误,其概率大小用β表示。
假设检验中P 的含义:指从H 0规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。
完全随机设计:只考虑一个处理因素,将全部受试对象随机分配到各处理组,然后观察实验效应,这种设计叫做完全随机设计。
随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象的特征相同或相近,且受试对象数与处理因素的水平数相等。
然后再将每个区组内的观察对象随机地分配到各处理组,这种设计叫做随机区组设计。
率:又称频率指标,说明一定时期内某现象发生的频率或强度。
计算公式为:
, 表示方式有:百分率(%)、千分率(‟)等。
构成比(proportion )又称构成指标,说明某一事物内部各组成部分所占的比重或分布。
计算公式为: ,通常以百分数表示。
比(ratio )又称相对比,是A 、B 两个有关指标之比,说明A 是B 的若干倍或百分之几。
计算公式为:比 ,表示方式为倍数或分数。
二项分布:若一个随机变量X ,它的可能取值是0,1,…,n ,且相应的取值概率为
k n k n
k k X P --==)1()()(ππ 则称此随机变量X 服从以n 、π为参数的二项分布(Binomial Distribution ),记为 X ~B (n ,π)。
Poisson 分布:若离散型随机变量X 的取值为0,1,…,n ,且相应的取值概率为
μμ-==e k k X P k
!)((μ>0)
则称随机变量X 服从以μ为参数的Poisson 分布(Poisson Distribution ),记为X ~P (μ)。
直线回归(linear regression )建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。
直线回归是回归分析中最基本、最简单的一种,故又称简单回归(simple regression )。
回归系数(regression coefficient )即直线的斜率(slope),在直线回归方程中用b 表示,b 的统计意义为X 每增(减)一个单位时,Y 平均改变b 个单位。
直线相关(linear correlation )又称简单相关(simple correlation ),用于双变量正态分布资料。
有正相关、负相关和零相关等关系。
直线相关的性质可由散点图直观的说明。
相关系数又称积差相关系数(coefficient of product-moment correlation ),以符号r 表示样本相关系数,ρ表示总体相关系数。
它是说明具有直线关系的两个变量间,相关关系的密切程%100⨯=单位总数可能发生某现象的观察数发生某现象的观察单位率%100⨯=观察单位总数
同一事物各组成部分的位数某一组成部分的观察单构成比A B
=
度与相关方向的指标。
方差分析:方差分析(analysis of variance ,ANOV A )就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和与自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。
通过各变异来源的均方与误差均方比值的大小,借助F 分布作出统计推断,判断各因素对观测指标有无影响。
配对四格表:配对四格表:为了控制随机误差而采用配对设计方案,将条件相似的两个受试对象配成一对,然后随机地让其中一个接受A 处理,另一个接受B 处理,每种处理的反应都按二项分类。
全部n 对实验结果的资料以表8-12表示,这样的表称为配对四格表。
表8-12 配对四格表的形式
A 处理
处理 + – +
a b – c d
等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。
等级资料又称有序资料。
如患者的治疗结果可分为治愈、好转、有效、无效、死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量。
正态分布:若资料X 的频率曲线对应于数学上的正态曲线,则称该资料服从正态分布。
通常用记号),(2
σμN 表示均数为μ,标准差为σ的正态分布。
5、简答题
1.简述二项分布、Poisson 分布和正态分布间的联系。
答:二项分布、Poisson 分布和正态分布间的联系为:
(1)在n 很大,而π很小,且n π=λ为常数时,二项分布的极限分布为Poisson 分布;
(2)在n 较大、π不接近0也不接近1时,二项分布B (n ,π)
近似正态分布(,(1))N n n πππ-,而相应的样本率P 的分布也近似正态分布2
(,)P N πσ。
(3)当λ增大时,Poisson 分布渐近正态分布。
一般而言,λ≥20时,Poisson 分布资料可作为正态分布处理。
2、假设检验中α与P 的区别何在?
答:α和P 均为概率,其中α是指拒绝了实际上成立的H 0所犯错误的最大概率,是进行统计推断时预先设定的一个小概率事件标准。
P 值是由实际样本获得的,在H 0成立的前提条件
下,出现等于及大于(或/和等于及小于)现有样本获得的检验统计量值的概率。
在假设检验中通常是将P 与α对比来得到结论,若P ≤α,则拒绝H 0,接受H 1,有统计学意义,可以认为……不同或不等;否则,若P >α,则不拒绝H 0,无统计学意义,还不能可以认为……不同或不等。
3、均数、几何均数、和中位数的适用范围?
均数:适用于对称分布,特别是正态分布资料。
几何均数:适用于成等比级数的资料,特别是对数正态分布资料
中位数:各种分布类型的资料,特别是偏态分布资料和开囗资料
4、均数的可信区间与参考值范围有何不同?
答:均数的可信区间与参考值范围的区别主要体现在含义、计算公式和用途三方面的不同,具体如下表所示。
区别点
均数的可信区间 参考值范围 意
义 按预先给定的概率所确定的未知参数的可能范围。
实际上一次抽样算得的可信区间要么包含了总体均数,要么不包含。
但可以说:该可信区间有多大(如当α=0.05时为95%)的可能
性包含了总体均数。
“正常人”的解剖、生理、生化某项指标的波动范围。
计算
公式 σ未知:/2,S X t n αν±*σ已知:/2X u n ασ±** σ未知但n >60: /2S X u n
α±** 正态分布:/2X u S α±**
偏态分布:P X ~P 100-X
用途 估计总体均数 判断观察对象的某项指标正
常与否
5、简述回归系数与相关系数的区别与联系。
答:二者的联系:
(1)对于既可作相关又可作回归分析的同一组数据,计算出的b 与r 正负号一致。
(2)相关系数与回归系数的假设检验等价,即对于同一样本,r b t t =。
(3)同一组数据的相关系数和回归系数可以相互换算:/Y X X Y r b S S =⨯ 。
(4)用回归解释相关:由于决定系数2
r =SS 回/SS 总,当总平方和固定时,回归平方和的大小决定了相关的密切程度,回归平方和越接近总平方和,则2r 越接近1,说明引入相关的效果越好。
二者的区别:
(1)资料要求上:相关要求X 、Y 服从双变量正态分布,这种资料进行回归分析称为Ⅱ型回归;回归要求Y 在给定某个X 值时服从正态分布,X 是可以精确测量和严格控制的变量,称为Ⅰ型回归。
(2)应用上:说明两变量间相互关系用相关,此时两变量的关系是平等的;而说明两变量间依存变化的数量关系用回归,用以说明Y 如何依赖于X 而变化。
(3)意义上:r 说明具有直线关系的两变量间相互关系的方向与密切程度;b 表示X 每变化一个单位所导致Y 的平均变化量。
(4)计算上:YY XX XY l l l r /=,XX XY l l b /=。
(5)取值范围:11≤≤-r ,∞<<∞-b 。
(6)单位:r 没有单位,b 有单位。
6、为什么假设检验的结论不能绝对化?
答:因为通过假设检验推断作出的结论具有概率性,其结论不可能完全正确,有可能发生两类错误。
拒绝H 0时,可能犯I 型错误;“接受”H 0时可能犯II 型错误。
无论哪类错误,假设检验都不可能将其风险降为0,因此在结论中使用绝对化的字词如“肯定”,“一定”,“必定”就不恰当。
7、在完全随机设计方差分析中SS 组间、SS 组内各表示什么含义?
答:SS 组间表示组间变异,指各处理组样本均数大小不等,是由处理因素(如果有)和随机误差造成的;SS 组内表示组内变异,指各处理组内变量值大小不等,是由随机误差造成的。
8、随机区组设计的方差分析与完全随机设计方差分析在设计和变异分解上有什么不同? 答:
区 别 点
完全随机设计 随机区组设计 设计 采用完全随机化的分组方法,将
全部试验对象分配到g 个处理组
(水平组),各组分别接受不同的
处理。
随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个处理组受试对象数量相同,区组内均衡。
变异分解
三种变异: SS SS SS =+总组间组内
(误差处理总SS SS SS +=)
四种变异: SS SS SS SS =++处理区组总误差
9、试举例说明均数的标准差与标准误的区别与联系。
答:例如某医生从某地2000年的正常成年男性中,随机抽取25人,算得其血红蛋白的均数X 为138.5g/L ,标准差S 为5.20g/L ,标准误X S 为1.04g/L 。
在本例中标准差就是描述25名正常成年男性血红蛋白变异程度的指标,它反映了这25个数据对其算术均数的离散情况。
因此标准差是描述个体值变异程度的指标,为方差的算术平方根,该变异不能通过统计方法来控制。
而标准误则是指样本统计量的标准差,均数的标准误实质是样本均数的标准差,它反映了样本均数的离散程度,反映了样本均数与总体均数的差异,说明了均数的抽样误差。
本例均数的标准误 5.20
1.0425X S S n ===,
此式将标准差和标准误从数学上有机地联系起来了,同时还可以看出:当标准差不变时,通过增加样本含量可以减少标准误。
10、正态分布与标准正态分布联系与区别?
答:二种分布均为连续型随机变量的分布。
正态分布、标准正态分布均为对称分布。
标准正态分布是一种特殊的正态分布(均数为0,标准差为1)。
一般正态分布变量经标准化转换后的新变量服从标准正态分布。
11、常用的相对数有哪几种?简述各种相对数指标的含义,计算方法及特点。
答:有强度相对数(率)、结构相对数(构成比)、相对比三种。
率的含义:某现象实际发生的例数与可能发生的总例数之比,说明某现象发生的频率或强度。
其特点为:说明某现象发生的强弱。
计算公式:=⨯某时期内发生某现象的观察单位数率比例基数同期可能发生某现象的观察单位总数
构成比的含义:事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各构成部分在总体中所占的比重或分布,通常以100为比例基数,又称为百分比。
其特点为:①一组构成比的总和应等于100%,即各个分子的总和等于分母;②各构成部分之间是相互影响的,某一部分比重的变化受到两方面因素的影响,其一是这个部分自身数值的变化,其二是受其他部分数值变化的影响。
计算公式:100%=⨯某一组成部分的观察单位数构成比同一事物各组成部分的观察单位总数
相对比的含义:是两个有关指标之比,说明两指标间的比例关系。
其特点为:两个指标可以是性质相同,也可以是性质不同;两个指标可以是绝对数、相对数或平均数。
计算公式:
100%=⨯甲指标相对比()乙指标
12、应用相对数时应注意哪些问题?
答:
(1)算相对数时分母应该有足够数量;
(2)分析时不能以构成比代替率;
(3)分别将分子和分母合计求合计率或平均率;
(4)相对数的比较应该注意其可比性;
(5)样本率或构成比比较时应做假设检验
13、对于四格表资料,如何正确选用检验方法?
答:(1)首先应分清是两样本率比较的四格表资料还是配对设计的四格表资料。
(2)对于两样本率比较的四格表资料,应根据各格的理论值T 和总例数n 的大小选择
不同的2
χ计算公式:① 当40≥n 且所有的5≥T 时,用2χ检验的基本公式22
()A T T χ-=∑或四格表资料2χ检验的专用公式22()()()()()ad bc n a b c d a c b d χ-=++++;②当40≥n 但有51<≤T 时,用四格表资料2χ检验的校正公式22(0.5)c A T T
χ--=∑或22
2()()()()()n c |ad -bc|-n =a+b c+d a+c b+d χ,或改用四格表资料的Fisher 确切概率法;③当40<n ,或1<T 时,用四格表资料的Fisher 确切概率法。
若资料满足两样本率u 检验的条件,也可用u 检验。
(3)对于配对设计的四格表资料,若检验两种方法的检测结果有无差别时①当()40
b c +≥时,2
2()b c b c χ-=+;②当()40b c +<时,c b c b c +--=22)1(χ。
14、什么叫做非参数检验?它和参数检验有什么区别?
答:非参数检验对总体分布不作严格假定,不受总体分布的限制,又称任意分布检验,它直接对总体分布(或分布位置)作假设检验。
如果总体分布为已知的数学形式,对其总体参数作假设检验则为参数检验。
15. I 型错误与II 型错误有何区别与联系?了解这两类错误有何实际意义? I 型错误是指拒绝了实际上成立的H 0所犯的“弃真”错误,其概率大小用α表示。
II 型错误则是指“接受”了实际上不成立的H 0所犯的“取伪”错误,其概率大小用β表示。
当样本含量n 确定时,α愈小,β愈大;反之α愈大,β愈小。
了解这两类错误的实际意义在于,若在应用中要重点减少α(如一般的假设检验),则取α=0.05;若在应用中要重点减少β(如方差齐性检验,正态性检验或想用一种方法代替另一种方法的检验等),则取α=0.10或0.20
甚至更高。
6、计算题
1、某医生随机检测了某地225名健康成年男子的血清胆固醇含量,得
X=4.0(mmol/L),S=0.6(mmol/L),
S=0。
X
(1)、指出本研究的总体、观察单位(或研究单位)和变量。
总体:所有成年男子。
观察单位: 一名成年男子。
变量:一个成年男子的血清胆固醇含量(2)、本研究的抽样误差为多少?0.04
(3)、试估计某地健康成年男子的血清胆固醇含量总体均数的95%的可信区间。
4.0±1.96×0.04
(4)试估计某地健康成年男子的血清胆固醇含量的95%的医学参考值范围。
4.0±1.96×0.6
(5)已知健康成年男子的血清胆固醇含量的标准值为4.08(mmol/L),用统计学专业术语回答某地健康成年男子的血清胆固醇含量是否不同于标准值?
(α=0.05=1.96,u0.01=2.58;采用t检验方法,t值为2.00。
)
由u0.05=1.96,u0.01=2.58; t=2.00
得P>0.01,按α=0.01水准,不拒绝H0 ,无统计学意义,尚不认为某地健康成年男子的血清胆固醇含量不同于标准值。
2.某市20岁男学生160人的脉搏数(次/分钟),经正态性检验服从正态分布。
求得X76.10,S=9.32。
试估计脉搏数的95%、99%参考值范围。
=
解:脉搏数的95%正常值范围为:S
±=76.10±1.96(9.32)=57.83~94.37
X96
.1
脉搏数的99%正常值范围为:S
±=76.10±2.58(9.32)=52.05~100.37
X58
.2
3、某医院现有工作人员900人,其中男性760人,女性140人,在一次流感中发病者
有108人,其中男性患者79人,而女性患者29人。
试计算:
⑴该院总流感发病率?
⑵男、女流感发病率?
⑶男、女患者占总发病人数的百分比?
⑴该院总流感发病率为:(108/900)×100%=12%
⑵男性流感发病率为:(79/760)×100%=10.39% ;
女性流感发病率为:(29/140)×100%=20.71%
⑶ 男性患者占总发病人数的百分比为:(79/108)×100%=73.15% ;
女性患者占总发病人数的百分比为:(29/108)×100%=26.85%
4、用甲乙两种方法检查已确诊的乳腺癌患者120名。
甲法的检出率为60%,乙法的 检出率为50%,甲、乙两法一致的检出率为35%,问:
1、该资料为何种类型的资料?计数资料
2、欲比较甲、乙两法何者为优,宜用何种假设检验方法?配对设计χ2检验
3、列出计算检验统计量的计算表。
甲法
乙法 + – +
a b – c d
算出a =42 b =30 c =18 d =30 ()40b c +≥,2
2()b c b c
χ-=+; 4、若计算得的检验统计量小于相应于P=0.05的检验统计量的值时(检验水准α=0.05),应如何下结论?
即 P >0.05,按α=0.05水准,不拒绝H 0 ,无统计学意义,尚不认为两种方法有差别。
5、据你所作的结论,可能犯何种类型的统计错误?Ⅱ型
5、测得8名健康人和8名Ⅰ期矽肺病人血清粘蛋白含量(毫克/100亳升)如下所示:
健康人 Ⅰ期矽肺病人
64.26 69.63
42.84 69.73
52.48 65.65
48.19 96.34
69.61 95.20
48.61 80.44
58.90 80.44
80.22 74.97
1、 指出该研究的总体、样本含量、变量、和资料类型。
总体:所有健康人 样本含量: 8 资料类型:计量资料
所有Ⅰ期矽肺病人 8
2、描述健康人(8名)血清粘蛋白含量的集中趋势,该计算哪种平均数?比较健康人与
Ⅰ期矽肺病人血清粘蛋白含量的变异度,该计算哪种统计指标?
均数标准差
3、欲比较健康人和Ⅰ期矽肺病人血清粘蛋白含量是否有差别,如采用成组t检验,请指出其适用条件?
各样本来自正态分布各样本均数方差齐性
4、若计算得到的检验统计量大于相应于P=0.01的检验统计量的值时(检验水准α=0.01),此时如果拒绝H0,可能犯何种类型的统计错误?犯错误的概率有多大?
Ⅰ型 0.01
5、健康人组的样本含量增加到16人,计算的总体参数的1—α可信区间的估计精度该如何变化?为什么?
精度提高,样本含量增加,可信区间变窄。
6.为了解某一新降血压药物的效果,将28名高血压病患者随机分为试验组和对照组,试验组采用新降压药,对照组则用标准药物治疗,测得治疗前后的舒张压(mmHg)如下表:
两种药物治疗前后的舒张压(mmHg)
新药病人号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 治疗前102 100 92 98 118 100 102 116 109 116 92 108 102 100 治疗后90 90 85 90 114 95 86 84 98 103 88 100 88 86
标准药病人号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 治疗前98 103 110 110 110 94 104 92 108 110 112 92 104 90 治疗后100 94 100 105 110 96 94 100 104 109 100 95 100 85
问:
(1)新药是否有效?
(2)新药和标准药的疗效是否不同?
(要求:1.写出统计假设检验步骤;2.正确选定假设检验方法公式;)3.不必计算出统计量的精确值,可就假定的统计量的值作出结论.)7、用某中药预防流感,用药组与对照组的流感发病情况如下表:
组别观察人数发病人数。