统计假设测验
统计假设测验的基本原理
第六章 统计假设测验的基本原理一、统计假设测验基本概念由一个样本或一系列样本所得的结果去推断总体,即统计推断。
统计推断包括参数估计和假设测验两个方面。
参数估计是由样本结果对总体参数作出点估计和区间估计。
点估计是以统计数估计相应的参数,例如以x 估计μ;区间估计是以一定的概率作保证估计总体参数位于某两个数值之间。
但是试验工作更关心的是有关估计值的利用,即利用估计值去作统计假设测验。
此法首先是根据试验目的对试验总体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,作出在概率意义上应接受哪种假设的推断。
由于此种测验法首先对总体提出假设,所以称为统计假设测验。
二、统计假设测验基本方法(一)提出假设统计假设测验首先要对研究总体提出假设。
假设一般有两种,一种是无效假设,记作H 0;另一种是备择假设,记作H A 。
无效假设是设处理效应为零,试验结果所得的差异乃误差所致。
备择假设是和无效假设相反的一种假设,即认为试验结果所得的差异是由于真实处理效应所引起。
1、单个平均数的假设 假设一个样本平均数x 是从一个已知总体(总体平均数为0μ)中随机抽出的,记作H 0:0μμ=,对H A :0μμ≠。
例如,有一个小麦品种产量总体是正态分布的,总体平均667m 2产量0μ为360kg ,标准差σ为40kg 。
但此品种经多年种植后出现退化,必须对其进行改良,改良的品种种植16个小区,得其平均667m 2产量王为380kg 。
试问这个改良品种在产量性状上是否和原品种相同。
此乃单个平均数的假设测验,是要测验改良品种的总体平均667m 2产量μ是否还是360kg 。
记为H 0:0μμ=(360kg ),H A :0μμ≠。
2、两个平均数相比较的假设 假设两个样本平均数1x 和2x 是从两个具有平均数相等的总体中随机抽出的,记为H 0:12μμ=,H A :12μμ≠。
例如要测验两个小麦品种的总体平均产量是否相等,两种农药的杀虫效果是否一样等等。
统计假设测验(显著性检验)
判定是否属小概率事件的概率值叫显著水平 (significant level), 一般以α表示。农业上常取0.05 和0.01。凡计算出的概率p小于α的事件即为小概率 事件。
统计上,当1%<p ≤5%称所测差异显著, p ≤1%称差异极显著, p>5%称差异不显著,
所以,统计假设测验又叫差异显著性测验 (difference significance test)
在实际检验时,计算概率可以简化,因为在标准正态分布下:
P(|u|>1.96)=0.05, P(|u|>2.58)=0.01, 因此,在用u分布作检验时, |u|≥1.96,表明概率P<0.05,可在0.05水平上否定H0; |u,|≥表2.明58P,>表0.明05概,率可P接<受0.H001。,不可必在再0.计01算水实平际上的否概定率H0。|u|<1.96
第二节 单个平均数的假设检验
单个平均数的假设检验就是检验某一样本所 属总体平均数是否和某一指定的总体平均数相同 ,检验所依据的理论基是平均数的抽样分布
一 单个平均数u检验
(一)应用条件: 1 总体参数μ0和σ2为已知 。 2 总体参数μ0已知, σ2 为未知,但
为大样本(n≥30),可用S2估计。
此错误的概率为β。
β
β
x1 x1 μ0
x2 x2μ
x
否定区间
接受区间
由图可见,β的大小与|μ-μ0|、α有反比关系;而与标准
误
有 正比关系。
x
n
实际中控制犯两类错误的措施有以下几种:
①适当增大水平间差距,即增大|μ-μ0|。
②增加n。
③根据试验目的,通过调整α的大小来控制犯错 误的概率。即 当试验者主观希望获得差异显著(不显著) 的检验结果时,(此时易接受第一类(二类)错 误),应适当减小(增大) α。
spss假设检验
SPSS假设检验1. 简介SPSS(Statistical Package for the Social Sciences)是一种非常常用的统计软件,被广泛应用于社会科学研究中。
其中,假设检验是SPSS中常用的统计方法之一,用于验证研究者对总体或样本的某种假设。
2. 假设检验的概念假设检验是统计学中的一种重要方法,用于判断一个统计推断是否与样本数据一致。
在假设检验中,通常会提出一个原假设(H0)和一个备择假设(H1),然后根据样本数据对两个假设进行检验,以确定是否拒绝原假设,从而对总体进行推断。
3. SPSS中的假设检验SPSS中提供了丰富的假设检验方法,涵盖了多种统计推断的情况。
下面将介绍几种常见的假设检验方法。
3.1 单样本 t 检验单样本 t 检验用于判断一个样本的均值是否与一个已知的常数有显著性差异。
在SPSS中,进行单样本 t 检验的步骤如下:1.导入数据:在SPSS中打开或导入数据文件。
2.选择变量:选择要进行 t 检验的变量。
3.进行检验:选择菜单栏上的“分析”-“比较均值”-“单样本 t 检验”。
4.设置参数:选择相关的变量和检验参数,点击“确定”进行分析。
5.查看结果:SPSS将显示 t 检验的结果,包括均值、标准差、t 值、自由度和显著性等。
3.2 独立样本 t 检验独立样本 t 检验用于判断两个独立样本的均值是否存在显著性差异。
在SPSS中,进行独立样本 t 检验的步骤如下:1.导入数据:在SPSS中打开或导入数据文件。
2.选择变量:选择需要进行对比的两个变量。
3.进行检验:选择菜单栏上的“分析”-“比较均值”-“独立样本 t 检验”。
4.设置参数:选择相关的变量和检验参数,点击“确定”进行分析。
5.查看结果:SPSS将显示独立样本 t 检验的结果,包括均值、标准差、t 值、自由度和显著性等。
3.3 配对样本 t 检验配对样本 t 检验用于判断同一组个体在两个不同时间点或条件下的均值是否存在显著性差异。
简述统计假设测验的步骤
简述统计假设测验的步骤简述统计假设测验的步骤一、编制测验题目(What to make of the test)二、根据假设去选择题目(How to select the test)三、选定一个正确的概念和数据(What the test is going to measure)四、由问卷填充人(或有关专家)对应调查人(或有关专家),把原始材料进行分类(A:处理调查报告B:输入问卷调查内容C:按提出的概念顺序整理资料,制作统计图表A:输入测试问卷内容B:与人员交谈,研究其意见或建议C:制作统计图表如果测验项目较多,要确保其结构合理,便于读者理解,但也不能过多,并且项目之间应有明显的界限。
一般来说,可以将测验项目分为四大类,即名词、动词、形容词和副词。
五、计算标准差(Mean difference)六、推断出预测值(Predicted value)七、得出正确答案(Wrong Answer)八、制成测验量表(Measure-form)九、预计发生错误的机率(Predictive error)十、计算及推论的技巧(Calculation and inference skills)十一、制作测验量表(Measure-form)首先应根据被试的实际水平和当前的任务选择适当的测验项目。
一份高质量的测验,必须具备“两性”:测验难度的难易程度和广度;测验的长度。
测验难度的选择,应考虑到测验的教育性、科学性、思想性、政治性和可接受性等因素。
不同年龄的被试有不同的最佳难度,即他们在不同的年龄阶段,对同一个测验往往有不同的最佳难度。
但是,测验的难度一般只能达到60%左右。
测验广度,是指对所要测量的范围和测验种类而言。
测验广度越大,就能够更好地揭示出测验对象的心理特点。
所以,测验广度不能超过两个以上。
测验长度与内容、时间、难度相互联系。
选定一个正确的概念和数据在进行测验编制时需要认真筛选有关资料,使用信息准确、完整、合乎逻辑。
假设检验的定义和步骤
假设检验的定义和步骤
假设检验是统计学中一种常用的推断方法,用于判断样本数据
是否支持对总体参数的某个假设。
通过对样本数据进行分析,假设
检验可以帮助我们判断我们所做的假设是否合理,并据此对总体参
数进行推断。
假设检验的步骤通常包括以下几个步骤:
1. 提出假设,首先,我们需要明确提出一个关于总体参数的假设,通常包括原假设(H0)和备择假设(H1)两种。
2. 选择检验统计量,根据所提出的假设,选择适当的检验统计量,该统计量应能够在原假设成立时具有已知的概率分布。
3. 确定显著性水平,确定显著性水平(α),即拒绝原假设的
概率阈值。
通常选择0.05作为显著性水平。
4. 计算统计量的值,利用样本数据计算出所选检验统计量的值。
5. 做出决策,根据检验统计量的值和显著性水平,做出决策,
即是拒绝原假设还是不拒绝原假设。
6. 得出结论,根据做出的决策,得出对原假设的结论,判断样本数据是否支持原假设。
总的来说,假设检验是一种通过对样本数据进行统计分析,以判断对总体参数的假设是否成立的方法。
通过严格的步骤和逻辑推理,假设检验可以帮助我们做出合理的推断和决策。
简述统计假设测验的步骤
简述统计假设测验的步骤统计假设测验是用来检查不能直接用频数描述的统计量(参数),或者用作推断总体参数之间关系的统计方法。
这种统计测验一般由2个测验构成:第一测验先给被试呈现一些刺激或者未知数,第二测验则要求被试对第一测验中呈现的结果做出解释。
1、确定假设的总体,并根据研究目的和问题,确定问题的可能性水平。
最常见的测验工具为二项分布、正态分布和X 2分布等。
有时还要确定问题的类型和抽取样本的数量。
例如,为了回答“你在进行某次聚会时,是否去过卡拉OK”的问题,应该采用正态分布,因为在高于1的概率下你应该去过卡拉OK。
然而,在回答“你在进行某次聚会时,是否饮过酒”的问题时,应该采用二项分布。
这样才有助于回答“你在进行某次聚会时是否去过卡拉OK”的问题。
又例如,为了回答“你是否进行过某项运动”的问题,应该采用正态分布。
2、提出概率度量,即确定样本观察值(X值)的标准差,从而确定“样本估计值”的标准差。
例如,如果希望用Y=10代替X的正态分布的总体,应该提出的标准差为20,而希望用Y=25代替X 2分布的总体,则提出的标准差为5。
有了标准差之后,我们就可以算出总体的期望和方差。
此外,应该提出适当的置信区间,以便进行假设检验。
假设检验的第一步,也就是要先求出总体X的均值和方差。
方差σ的公式为σ=∑x/X3、计算“样本观察值”的平均值,并且用这个平均值除以标准差,得到“样本观察值”的期望值(ΔL),再将样本观察值代入假设检验的第一个公式,得到两个参数之间的相互关系。
样本观察值的标准差用它除以期望值,就可以得到平均变异数,这个平均变异数就是抽样平均误差,它等于样本观察值的标准差乘以总体均值与样本观察值的期望值的比值,或者等于样本观察值的标准差除以方差。
如果只有正态分布和X 2分布的总体,而没有说明总体期望值的大小,则需要用样本容量(N)除以样本标准差(σ/2)得到样本均值,然后把均值代入样本观察值,即得到样本的期望值。
统计学中的假设检验
统计学中的假设检验(Hypothesis Testing in Statistics)统计学中的假设检验是一种统计推断方法,用于验证对总体参数或某个结论提出的假设是否是合理的。
它可以用来评估样本数据是否可以支持或反驳特定的假设,从而对研究问题进行分析和决策。
在假设检验中,我们通常提出一个零假设(null hypothesis)和一个备择假设(alternative hypothesis)。
零假设是一种无效假设,即我们认为没有关联或没有差异存在。
备择假设是一种我们希望证明的假设,即存在某种关联或差异。
在进行假设检验时,我们首先收集样本数据。
然后,我们基于这些数据计算一个统计量,该统计量可以用于判断是否可以拒绝零假设。
统计学家们使用最常见的统计量是p值(P-value)。
p值是在给定零假设成立的条件下,观察到结果或更极端结果的概率。
如果p值小于预先设定的显著性水平α(通常为0.05),我们可以拒绝零假设,并接受备择假设。
举例来说,假设我们想要研究某药物对某种疾病的治疗效果。
零假设可以是该药物对治疗效果没有明显影响,备择假设可以是该药物对治疗效果有显著影响。
我们收集了一组患有该疾病的患者,并将其随机分为两组,对其中一组使用药物进行治疗,另一组使用安慰剂进行治疗。
然后,我们比较两组的治疗效果。
通过对比两组的数据,我们可以计算出一个p值。
如果p值小于我们设定的显著性水平α,我们可以拒绝零假设,即药物对治疗效果具有显著影响。
反之,如果p值大于α,我们无法拒绝零假设,即药物对治疗效果没有明显影响。
在假设检验中,还有两种错误可能性:第一类错误和第二类错误。
第一类错误是当真实情况下零假设正确时,我们错误地拒绝了它。
第二类错误是当真实情况下备择假设正确时,我们错误地接受了零假设。
通常,我们在设计假设检验时将第一类错误的概率控制在一个较小的水平上(如0.05),而第二类错误的概率则可能较大。
在实际应用中,假设检验是一种重要的工具,被广泛用于各种领域和学科,如医学研究、社会科学、工程等。
假设检验练习题
假设检验练习题在统计学中,假设检验是一种常用的数据分析方法,用于通过样本数据对总体参数的假设进行验证。
通过进行假设检验,我们可以确定样本数据是否足够支持对总体参数的某种特定假设。
一、背景介绍假设检验的基本思想是:假设总体参数服从某种特定的概率分布,然后利用样本数据对这一假设进行检验。
在进行假设检验时,我们通常会提出原假设(H0)和备择假设(H1),其中原假设是我们要进行检验的假设,备择假设则是对原假设的否定或补充。
二、假设检验的步骤1. 提出假设:根据问题的需求和背景,明确原假设和备择假设。
2. 选择显著性水平:显著性水平α代表我们对假设检验结果的接受程度,通常选择0.05或0.01。
3. 计算检验统计量:根据样本数据和所选的假设检验方法,计算出相应的检验统计量。
4. 确定拒绝域:根据显著性水平和假设检验的方法,确定拒绝域的临界值。
5. 判断结论:将计算得到的检验统计量与拒绝域进行比较,根据比较结果作出结论。
三、假设检验的类型1. 单样本检验:当我们只有一个样本数据,想要对总体参数是否符合某个特定值进行判断时,可以使用单样本检验。
2. 独立样本检验:当我们有两个独立的样本数据,并且希望比较两个总体参数是否有差异时,可以使用独立样本检验。
3. 配对样本检验:当我们有两组相关的样本数据,并且希望比较两个总体参数的差异时,可以使用配对样本检验。
四、常见的假设检验方法1. t检验:用于对总体均值进行假设检验,可以进行单样本t检验、独立样本t检验和配对样本t检验。
2. 方差分析(ANOVA):用于比较多个样本均值是否有差异,适用于有两个以上样本的情况。
3. 卡方检验:用于对分类变量的比例进行假设检验,适用于两个或更多分类变量的情况。
4. 相关分析:用于检验两个变量之间是否存在线性相关性。
五、实例分析为了更好地理解假设检验的应用,我们举一个实际例子。
假设一个制药公司研发了一种新药,声称该药物的疗效显著优于市场上已有的药物。
统计学假设检验练习题
例3.7.9从一大批相同型号的金属线中,随机选取10根,测得它的直径(单位:mm)为:1.23 1.24 1.26 1.29 1.20 1.32 1.23 1.23 1.29 1.28(1)如果金属线直径X~N(μ,0.042),试求平均直径μ的置信度为95%的置信区间.(2)如果金属线直径X~N(μ, σ2),σ2未知,试求平均直径μ的置信度为95%的置信区间.例3.7.10随机取某牌香烟8支,其尼古丁平均含量为3.6mg,标准差为0.9mg.试求此牌香烟尼古丁平均含量μ的95%的置信区间.(假设尼古丁含量服从正态分布).4.某种袋装食品的重量服从正态分布.某一天随机地抽取9袋检验,重量(单位:g)为510 485 505 505 490 495 520 515 490(1) 若已知总体方差σ2=8.62,求μ的置信度为90%的置信区间;(2) 若已知总体方差未知,求μ的置信度为95%的置信区间.5.为了估计在报纸上做一次广告的平均费用,抽出了20家报社作随机样本,样本的均值和标准差分别为575(元)和120(元),假定广告费用近似服从正态分布,求总体均值的95%的置信区间.6.从某一班中随机抽取了16名女生进行调查.她们平均每个星期花费13元吃零食,样本标准差为3元,求此班所有女生每个星期平均花费在吃零食上的钱数的95%的置信区间.(假设总体服从正态分布)7.一家轮胎工厂在检验轮胎质量时抽取了400条轮胎作试验,其检查结果这些轮胎的平均行驶里程是20000k m,样本标准差为6000k m.试求这家工厂的轮胎的平均行驶里程的置信区间,可靠度为95%.8.为了检验一种杂交作物的两种新处理方案,在同一地区随机地选择8块地段.在各试验地段,按两种方案处理作物,这8块地段的单位面积产量是(单位:k g)一号方案产量: 86 87 56 93 84 93 75 79二号方案产量: 80 79 58 91 77 82 74 66假设两种产量都服从正态分布,分别为N(μ1, σ2) ,N(μ2, σ2), σ2未知,求μ1-μ2的置信度为95%的置信区间.9.为了比较两种型号步枪的枪口速度,随机地取甲型子弹10发,算得枪口子弹的平均值=500(m/s), 标准差s1=1.10(m/s); 随机地取乙型子弹20发,得枪口速度平均值=496(m/s),标准差s2=1.20(m/s). 设两总体近似地服从正态分布,并且方差相等,求两总体均值之差的置信水平为95%的置信区间.10.为了估计参加业务训练的效果.某公司抽了50名参加过训练的职工进行水平测验,结果是平均得分为4.5,样本方差为 1.8;抽了60名未参加训练的职工进行水平测验,其平均得分为3.75,样本方差为2.1. 试求两个总体均值之差的95%的置信区间.(设两个总体均服从正态分布).11、风驰汽车制造厂的装配车间安装车门仍需人工操作,不同工人的装配时间不同,同一工人的装配时间也有差异,为测定安装车门所需时间,每隔一定时间抽选一个样本,共抽取了10个样本,其数据如下(单位:秒):41 43 36 26 20 21 46 39 37 211. 以置信度95%,估计安装一个车门所需平均时间的置信区间,2.若要求估计平均装配时间的误差不超过2秒,置信度为95%,应抽选多大的样本?3.若费用为200元,观察每个样本的费用为4元,置信度为95%,则允许误差限是多少?4.假设上月测定的平均时间为35秒,则a=0.05时,检验其平均时间是否有显著缩短?12、万里橡胶制品厂生产的汽车轮胎平均寿命为40,000公里,标准差为7500公里。
假设检验的原理和方法
第四章
do
something
第四章 统计推断
统计推断
由一个样本或一糸列样本所得的结果来推断总体的特征
假设检验
参数估计
统计推断的过程
分析误差产生的原因
任务
确定差异的性质
排除误差干扰
对总体特征做出正确判断
第四章
第一节
第二节
第三节
第四节
第五节
330
实例
?
三、假设检验的步骤
治疗前 0 =126 2 =240
N ( 126,240 )
治疗后 n =6 x =136 未知 那么 =0 ? 即克矽平对治疗矽肺是否有效?
例:设矽肺病患者的血红蛋白含量具平均数0=126(mg/L), 2 =240 (mg/L)2的正态分布。现用克矽平对6位矽肺病患者进行治疗,治疗后化验测得其平均血红蛋白含量x =136(mg/L)。
1 、提出假设
对立
无效假设/零假设/检验假设
备择假设/对应假设
0 =
0
误差效应
处理效应
H0
HA
例:克矽平治疗矽肺病是否能提高血红蛋白含量?
检验治疗后的总体平均数是否还是治疗前的126(mg/L)?
本例中零假设是指治疗后的血红蛋白平均数仍和治疗前一样,二者来自同一总体,接受零假设则表示克矽平没有疗效。
可能错误
例:上例中 P=0.1142>0.05所以接受H0,从而得出结论:使用克矽平治疗前后血红蛋白含量未发现有显著差异,其差值10应归于误差所致。
P( u >1.96) =0.05
P( u >2.58) =0.01
数学中的假设检验
数学中的假设检验假设检验是统计学中一种重要的方法,用于对统计样本数据进行推断与判断。
它可以帮助我们判断某个假设是否成立,从而为决策提供依据。
本文将通过介绍假设检验的基本概念、步骤和应用案例,深入探讨数学中的假设检验方法。
一、假设检验的基本概念假设检验是根据样本数据对总体进行统计推断的方法。
它基于两个互为对立的假设:原假设(H0)和备择假设(H1)。
原假设通常是我们认为成立的假设,而备择假设则是我们希望验证的假设。
在进行假设检验时,我们首先假设原假设成立,然后利用统计方法计算出样本数据的观察值,根据观察值与预期值之间的偏差,判断原假设的合理性。
如果观察值与预期值之间的差异显著大于正常情况下的偏差范围,我们就可以拒绝原假设,接受备择假设。
二、假设检验的步骤假设检验包括以下几个基本步骤:1. 确定假设:根据问题的背景和研究目的,明确原假设和备择假设。
2. 选择显著性水平:显著性水平(α)是假设检验中一个重要的参数,用于确定拒绝原假设的标准。
一般情况下,α取0.05或0.01。
3. 计算统计量:根据样本数据,选择合适的统计量进行计算。
常用的统计量有t值、F值和卡方值等。
4. 判断拒绝域:根据显著性水平和统计量的分布特性,确定拒绝原假设的临界值。
5. 比较统计量和临界值:将计算得到的统计量与拒绝域的临界值进行比较,判断是否拒绝原假设。
6. 得出结论:根据比较结果,给出对原假设的结论,并解释其统计意义和实际意义。
三、假设检验的应用案例1. 以某医院为例,研究员想要验证该医院使用的一种新型药物是否比常规药物更有效。
设定原假设为“新型药物不比常规药物更有效”,备择假设为“新型药物比常规药物更有效”。
收集一组患者的数据,比较两组患者接受新型药物和常规药物后的治疗效果,通过假设检验确定是否接受备择假设。
2. 在金融领域,分析师经常使用假设检验来验证股票市场的有效性。
他们可以将原假设设定为“股票市场不存在明显的投资机会”,备择假设设定为“股票市场存在明显的投资机会”。
概率统计中的假设检验
概率统计中的假设检验是一种重要的统计方法,它可用于判断某个统计推断是否成立或拒绝某项假设。
假设检验是基于样本数据对总体或种群参数的推断,通过对样本数据的观测来判断假设是否成立。
在进行假设检验时,首先需要明确两个假设:原假设(H0)和备择假设(H1或Ha)。
原假设通常是对问题的默认假设,而备择假设则是对原假设的否定。
例如,在检验某种药物的疗效时,原假设可以是“该药物对症状无效”,备择假设可以是“该药物对症状有效”。
接下来,根据所采集的样本数据,计算得到一个统计量(test statistic),该统计量可以用来量化样本数据与原假设之间的差异。
然后,通过对该统计量和概率分布进行比较,计算出一个概率值(p-value),该概率值表示样本数据在原假设下获得该统计量或更极端结果的概率。
最后,根据概率值与预先设定的显著性水平(significance level)进行比较,来判断是否拒绝原假设。
显著性水平通常以alpha(α)来表示,一般常见的显著性水平是0.05或0.01。
当概率值小于显著性水平时,就可以拒绝原假设,否则则不能拒绝原假设。
假设检验在统计学中扮演了重要的角色。
它不仅可以用于科学研究,还可以用于市场调研、医学实验、质量控制等各个领域。
通过假设检验,可以对某个特定问题进行量化推断,提供客观的统计结论。
然而,需要注意的是,假设检验并不能确切地确认原假设是否完全正确或错误。
它只能基于概率进行判断,并有一定的错误概率。
当概率值小于显著性水平时,我们可以推断样本数据与原假设之间存在显著差异,但并不能完全排除随机性导致的误差。
此外,假设检验的结果还依赖于样本的选择和数据的收集方式。
不同样本可能会得到不同的结果,因此,假设检验的结论具有一定的主观性。
为了降低这种主观性带来的影响,通常需要进行多次独立的实验或重复样本采集,以增加可靠性和准确性。
综上所述,概率统计中的假设检验是一种重要的统计方法,可以用于判断某个统计推断是否成立。
实验一、统计假设测验及方差分析--6
姓名: 学号: 成绩:
学院: 专业 级 班 实验时间: 实验一、统计假设测验及方差分析
1、分别计算以下两个玉米品种果穗长度(cm )的x 、n 、1-n σ、n σ、12-n σ、n 2σ、2)(x x -∑,并比
结果:
回答问题:采用哪种变异度可衡量试验指标相同、不同的样本变异度大小?
2、将以穗红花苜蓿一分为二,半穗接受8h ,4.4mm 蒸汽汞压处理,另外半穗接受8h,9.9mm 蒸汽汞压处
回答问题:根据所学的平均数抽样分布,简述两样本平均数假设测验的种类及计算公式。
3、测定4种密度下金皇后玉米的千粒重(g )各4次,得结果如下表。
试对4种密度下的千粒重进行方差分析。
采用新复级差法多重比较。
表1.金皇后玉米千粒重(g ) 表2.金皇后玉米千粒重的方差分析表。
生物统计学 第五章
D. 否定错
A. 说明两样本均数差别愈大 理由认为两总体均数不同
C. 说明两总体均数差别愈大 理由认为两样本均数不同
B. 愈有 D. 愈有
关于两样本均数比较的 t 检验,正确的说 法是 (C )。
解: F 检验:假设: H 0 :σ 1 =σ 2 ; H A :σ 1 ≠σ 2
A.要求两样本来自同一总体 总体均服从正态分布
A.抽样指标等于总体指标
B.估计量抽样分布的数学期望等于总体的 参数
C.样本平均数等于总体平均数
D.样本比例等于总体比例
在构造某一总体均值的置信区间时,取一个 容量为 n 的简单随机样本,用样本均值作为 估计量,如果发现置信区间太宽,其主要原 因是( )。 A
A.样本容量太小 择的估计量有偏
B.选
假设 是 的一个无偏且一致的估计量, 当用 95 %的置信度建立置信区间后,则( )。 A
C.不会影响置信区间 D.可能缩小也可 能增大置信区间
假设 为总体 X 的一个未知参数,
和
是两个样本统计量,
是 的置信度为 区间,则有(C )。
的置信
利用 t 分布构造置信区间的条件是( )。 B
A.总体服从正态分布,且方差已知
B.总体服从正态分布,且方差未知
C.总体不一定服从正态分布,但要求是大 样本
,
,则( )。 A
A.
是 u 的无偏估计量
B.
是 的无偏估计量
C. 是 的无偏估计量 D.以上全不对
A. 比 有效
有效
C. 与 的有效性相同 判断
B. 比 D.无法
假设
,
都
是总体均值 的样本容量 n=2 的无偏估计
量,则(A )。
第五章 统计推断5-2 - 新
第五章 统计推断统计推断的意义和内容统计推断是据统计数的分布和概率理论,由样本统计数推论总体参数的方法。
先根据试验目的,对试验总体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的估算,做出在概率意义上应接受那种假设的推断。
由于种测验首先对总体提出假设又叫统计假设测验。
统计推断的前提条件:资料必须来自随机样本;统计数的分布规律必须已知。
&5.1 统计假设测验概述统计假设:在科学研究中,往往首先要提出一个有关某一总体参数的假设。
这种假设称为统计假设。
一、数据结构从服从正态分布N(μ0=300,σ=75)的原品种总体中,随机抽取n 个个体构成样本,则样本观察值可表示为 xi = μ0 + εi (i=1,2 ,… ,n)而从新品系总体中随机抽取的样本观察值,则为 xi = μ + εi (i=1,2 ,… ,n) (5.2) 新品系与原品种的产量差异为τ = μ - μ0 (5.3) 将(5.3)代入(5.2)得xi = μ0 + τ + εi (i=1,2 ,… ,n) (5.4) 二、统计假设测验的基本原理 对一个样本的n 个观察值xi 求平均数因x i = μ0 + τ + εi (i=1,2 ,… ,n)iix x εμμμετμ+-=-++=∴)()(0上式说明,x 与 μ0的表面差异(x - μ0)是由真实差异(μ- μ0 )和试验误差εi 构成。
小机率原理:概率很小的事件,在一次试验中是不至于发生的。
统计假设测验:是指据某种需要,对末知的或不完全清楚的总体提出一些假设,由样本实际结果经过一定的概率测验,作出接受或否定假设的推论。
三、统计假设测验的基本步骤例5.1 设某地区的当地小麦品种一般亩产300kg ,多年种植结果获得标准差为75kg 。
现有某新品种n=25,平均数330kg ,问新品种样本所属总体与当地品种这个总体是否差异显著。
第一步 统计假设H0:0μμ=第二步 计算统计量225/75300330/0=-=-=n x u σμu=2> u0.05=1.96,即对应的概率p <0.05。
第四章 假设检验
大,就越容易将试验的真实差异错判为试验误差。
显著性检验的两类错误归纳如下:
表4-1 显著性检验的两类错误
客观实际
H0 成立 H0 不成立
检验结果
否定 H0 Ⅰ型错误( )
接受 H0 推断正确(1- )
推断正确(1- ) Ⅱ型错误( )
与0 有差异而因为试验误差大被掩盖了。
为了降低犯两类错误的概率,一般从选取适当的显
著水平 和增加试验重复次数 n 来考虑。因为选取数 值小的显著水平 值可以降低犯Ⅰ类型错误的概率,
但与此同时也增大了犯Ⅱ型错误的概率,所以显著水
平 值的选用要同时考虑到犯两类错误的概率的大小。
对于田间试验,由于试验条件不容易控制
y1 510
y2 500
我们能否根据 y1 y2 10 就判定这两
个水稻品种平均产量不同?结论是,不一定。
因为两个水稻品种平均产量 y1 、y2 都 是从试验种植的10个小区获得,仅是两个品种
有关总体平均数 1, 2 的估计值。由于存在
试验误差 ,样本平均数并不等于总体平均数 , 样本平均数包含总体平均数与试验误差二部分, 即
∣u∣≥2.526的两尾概率,所以称为 u 检验.
三、显著水平与两种类型的错误
(一)显著水平
用来否定或接受无效假设的概率标准叫显著水
平,记作 。 在生物学研究中常取 =0.05,称为 5% 显著水平; 或 =0.01,称为1% 显著水平或极显著水平。
对于上述例子 u的检验来说,若∣u∣<1.96 ,
则说明试验的表面差异属于试验误差的概率p>0.05,
即表面差异属于试验误差的可能性大,不能否
医学统计学 第四章课后测验
医学统计学第4章医学参考值,假设检验第4章课后测验1、正态分布N(u,02),当u恒定时, o越大则A.曲线沿横轴越向右移动B.曲线沿横轴越向左移动oC.曲线形状和位置不变D.曲线越"瘦高"E.曲线越"矮胖”正确答案是:曲线越"矮胖"2、正态分布的均数和中位数的关系为A.均数与中位数相等B.均数与几何均数相等C.中位数与几何均数相等D.均数与中位数不相等E.均数与中位数可能相等也可能不相等正确答案是:均数与中位数相等3、正态曲线下,横轴上从均数到+oo的面积为A.不能确定(与标准差的大小有关)B.97.5%c.99%D.50%E.95%正确答案是:50%4、若随机变量X服从N(u,02)的正态分布,则X的第97.5百分位数等于A. u-1.640B. u-1.960c. u-oD. L+1.960E.u+1.640正确答案是:u+1.9605、某项指标95%医学参考值范围表示的是A.在人群中检测指标有5%的可能超出此范围B.在"异常"总体中有95%的人在此范围之外C.在"正常"总体中有95%的人在此范围D.在此范围"异常"的概率大于或等于95%E.在此范围"正常"的概率大于或等于95%正确答案是:在"正常"总体中有95%的人在此范围6、确定某项指标的医学参考值范围时,"正常人"指的是A.排除了影响研究指标的疾病或因素的人B.排除了患过某种疾病的人C.健康状况良好的人D.患过疾病但不影响研究指标的人E.从未患过疾病的人正确答案是:排除了影响研究指标的疾病或因素的人7、某人群某项生化指标的医学参考值范围,该指标指的是A.在所有正常人中的波动范围B.在少部分正常人中的波动范围C.在一个人不同时间的波动范围D.在绝大部分正常人中的波动范围E.在所有人中的波动范围正确答案是:在绝大部分正常人中的波动范围8、要评价某地区一名5岁男孩的身高是否偏高,其统计学方法是A.用均数来评价B.用变异系数来评价C.用中位数来评价D.用参考值范围来评价E.用几何均数来评价正确答案是:用参考值范围来评价9、若正常成年人的血铅值X(已知Y=lgX)近似服从对数正态分布,根据200名正常成年人的血铅值确定95%参考值范围,计算公式最好采用Ax士1.96SB.,o-1(y+1.64Sy)C"lg-"(P士1.96Sy)eD lg-'(Y -1.64Sy)Ex+1.64S正确答案是: la-1(Y+1.64Sy)l10、某市1974年238名居民的发汞含量(umol/kg)如下,则该地居民发汞值的95%医学参考值范围是Ax土1.96S .B.(P55,P97.5)C.<P95D.>P5;正确答案是:<P95。
统计推断或假设检验的常见问题
统计推断或假设检验的常见问题连续变量和分类变量1.所有测量值可以分为四水平:定类(NOMINAL),定序(ORDINAL),定距(INTERVAL),和定比(RATIO).前面两类是分类变量,后面两类是连续变量. 2.定类变量是只能决定类别,例如白人和黑人,民主党和共和党,男人和女人等.定序变量比定类变量进了一步,因为不但可以决定类别,还可以决定各水平的次序.例如高收入,中等收入,和低收入;非常满意,比较满意,比较不满意,和非常不满意等等.但是各个水平间的距离并无意义.例如痛苦程度用1到10表示.用7表示的痛苦大于5,后者又大于3.但你不能说7和5表示的痛苦和5和3表示的痛苦是等距离的.定距变量又进了一步,不但可以知道次序而且可以知道各个水平间距离,而且各个水平间距离有意义.如100度的开水和90度的温水之间等于90度和80度之间的差别.但是注意0度的水不等于无温度.而定比变量则是最高级水平,具有所有定距变量的特性还加上一个0是本身有意义的.例如重量0克等于0重量.凡是定比变量都可以比较两个量的比值.例如重量:4克的物质是2克物质的2倍.但100度的水不是50度水的两倍热,因为它不是定比变量.社会科学中最好的定比变量例子是收入.年薪十万就是五万的两倍.0收入就是没有收入.:5.有人做了一个实验以决定抗生素是否会增加小牛体重. 下列变量是每头牛的测量值:性别, 初始体重, 体重增加数, 肉质品位等级, 其中肉质品位等级以A, B, 或C表示. 这些变量的测量类型是:a)定类, 定比, 定距, 定类b)定类, 定比, 定比, 定类c)定类, 定比, 定比, 定序d)定序, 定比, 定比, 定序e)定序, 定比, 定比, 定类6.有一项研究调查的是火力发电厂对水质的影响. 研究人员先抓鱼并加以标记再把它们放了. 对每条鱼都作了下列记录:性别(0=雌鱼, 1=雄鱼), 鱼身长度(cm), 成熟度(0=幼小, 1=成熟), 体重(g).这些测量值属于:a.定类, 定比, 定类, 定比b.定类, 定距, 定序, 定比c.定类, 定比, 定序, 定比d.定序, 定比, 定类, 定比e.定序, 定距, 定序, 定比无效和备择(或对立)假设7.无效假设和备择(或对立)假设的内容应该由管理决策问题决定.一般来说是由无效假设当稻草人,而真正目的是看备择(或对立)假设能否成立.8.既然无效假设是稻草人,在设立时要使它可能被推翻.办法是令无效假设等于, 大于或小于一个具体的数值(如销售额增加<15, 广告效应=0, 今天的市场分额=昨天的分额,或婴儿出生体重=8斤,)而不是模棱两可的(如销售额增加不等于0, 广告效应不等于0, 今天的市场分额不等于昨天的分额,或婴儿出生体重不等于8斤).9.备择(或对立)假设一定要和无效假设对应,使得一旦无效假设推翻以后就只能接受备择(或对立)假设.10.参看Excel”统计复习2”工作簿Solution一表中关于假设的例题.11.为了保证对应性,一般说来备择(或对立)假设和无效假设符号要相反,内容要一致,即他们是关于同一事件的不同可能性.12.何时作出假设?研究者应该事先决定假设再作检验.这相当于先设立靶子再射击.不能先测验假设中途又改变它!13.* 当假设表示为一个等号后面跟具体数值的时候就称为简单假设.反之不是等号而是大于,小于,或不等号时就称为合成假设.所有两尾备择(或对立)假设都是合成假设.一尾备择(或对立)假设也是合成假设.多数无效假设都是简单假设*14.参看Excel”统计复习2”工作簿Solution一表关于假设的题目一尾测验还是两尾测验?15.当你对某事件了解不多,或无清楚的理论指导,或无过去经验可供参照,或常识/逻辑不能帮忙时,一般都应该用两尾测验.反之可以用一尾.16.例如加了工资以后消费支出一般不大可能降低,公路加宽后不大可能增加交通事故,打了广告后不大可能减低销售额等等都可以用一尾测验.17.能从假设中看出用一尾还是两尾吗?答案是肯定的.要看备择(或对立)假设.如果备择(或对立)假设是带方向性的(如销售额<300,000, 进口车耗油量<国产车,广告后市场份额>广告前等等=就用一尾.反之不带方向性用两尾.18.什么是临界值? 临界值就是门槛值. 就是在概率分布的横轴上的一个或几个关键值. 没有越过那个值就属于大概率事件, 而一旦越过那个值就变成小概率事件, 就认为那里的事件是由机会引起的而不是真实(即大概率)事件.19.为什么要重视临界值? 因为在概率分布给定时, 每个概率值都对应于一个确定的临界值. 概率值用概率曲线下的面积表示, 而临界值用直线即横轴上的值表示. 后者比前者更方便求取. 故在假设检验时都把概率值化为临界值.20.与两尾测验相比,一尾测验需要比较小的临界值即可以达到显著. 统计上把这个现象称为高检验力度(Power). 直观的说, 一尾测验相当于把两个尾部的概率集中到一个尾部. 比如两尾测验时你需要z=1.96才能达到5%的显著水平, 而一尾时只要z=1.645即可. 后者比1.96更加接近概率分布的中部而不是尾部.也就是说我们把门槛值向左移动了.21.参看Excel”统计复习2”工作簿Solution一表中”下列情况的t或z的临界值是什么”那一节中的例题22.在用Excel函数求临界值时,都是假定你已经决定了显著水平而要求相应临界值.这时需要用Normsinv, Tinv, or Chiinv. 注意前两个函数要考虑一尾还是两尾测验. 而卡方测验只有一尾. 因为卡方分布没有负数.23.一定记得把显著水平即概率值除以2以便得到两尾检验的临界值. 而如果是一尾检验直接代入显著水平即可. 例如求5%显著水平的正态分布一尾临界值其公式是Normsinv(0.05), 而求两尾临界值则用Normsinv(0.05/2). 注意不是Normsinv(0.05)/2, 因为不是临界值的1/2, 而是概率即显著水平的1/2. 再说一次: 两尾检验其概率要除以2, 一尾就不需要!24.参看Excel”统计复习2”工作簿Solution一表中”下列情况应该用何检验”那一节中的例题.25.决定用t测验还是正态z检验取决于两个条件, 一是群体方差是否已知, 二是样本大小. 一般大样本即大于50人以上都可以用正态检验. 否则用t检验.26.参看Excel”统计复习2”工作簿Solution一表关于何种检验的总结表I类错误和II类错误27.I类错误称为拒真错误, II类错误则是纳伪错误. 其中的拒真和纳伪都是指无效假设而言. 即当无效假设是真实时你推翻它(I 类错误), 或当无效假设是错误时你未能推翻它(II类错误).28.II类错误概率用β表示, 而I类错误的概率就是显著水平, 用α表示. I类错误的概率可以人为控制; 而II类错误则受三个因素影响: [1]显著水平(即I类错误概率), 一般α越大β越小; [2]样本大小, 一般样本越大β越小即犯II类错误的概率越小; 和[3]效应大小. 后者是指群体真值和无效假设值的差数, 或两个样本间平均数或其它统计值的差异; 一般效应越大则β越小.29.I类错误和II类错误的方向相反. 例如显著水平=0.05时犯II类错误的概率要比显著水平=0.10时要大. 所以一般而言你不能同时减少两类错误的概率.但是如果你有大样本就可以达到这一目标.30.检验力度(Power)等于1-beta, 其中beta是II类错误的概率. 虽然求II类错误也有公式, 但求起来比较难, 因为我们必须知道对立假设下的分布. 所以我们一般不去求它. 只需要知道I类和II类错误的关系, 知道II类错误和检验力度的关系即可.31.I类错误概率, II类错误概率, 检验力度, 以及效应大小的关系看Churchill的PPT最好理解.关于概率分布32.连续变量常常服从正态分布或其它连续分布,例如对数正态(LOGNORMAL), T分布,F分布等.分类变量服从二项分布,多项分布等.33.样本统计值常常用比例表示,比例常常服从二项分布.例如抽烟和不抽烟,听过(或见过)广告和没有见过广告,喜欢和不喜欢某产品,以及是大学生和不是大学生等等.二项分布有两个特点.第一它可以用正态分布逼近.其原因用抛硬币实验很容易理解.如果我们抛一枚硬币6次,纪录正面出现次数,则N=6,P=0.5因为硬币每次出现正面和负面的概率应该相等.则在6次中有3次是正面的概率是33!6!()(1)(3)0.5*0.5!()!3!(3!)6*5*4*3*2*(.125)*(.125).3125(3*2)*(3*2)r n rnP r Pr n rππ-=-==-==类似地其它概率,比如出现1次,0次,2次等等都可以按此公式计算出来.请看E XCEL工作簿”E XCEL统计推断”中”如何计算事件概率”那个表格.这些概率就形成概率分布,后者虽然服从二项分布但可以用正态分布逼近. 34.样本比例的方差特别容易计算,直接等于P*Q(其中Q=1-P).有了方差则标准差和标准误就都好计算了.我们在假设检验中常常要用到这个特性来求方差,标准差和标准误,非常方便!其标准误捷径公式是pσ=标准差捷径公式是σ=方差捷径公式是(1)Vππ=-.其中的π和1-π是指群体的”成功”比例,即某事件出现次数占总次数的比例.对样本来说就是P和Q.请见E XCEL”统计推断2”工作簿中”S OLUTION”一表,其中关于可锐职业顾问公司的例子35.如果变量服从正态分布则大约68%的值位于正负一个标准差之间,大约95%的值位于正负两个标准差之间,大约99%的值位于正负三个标准差之间.其全距(即极大值和极小值之间差数)是大约六个标准差(最后这一点对于计算样本容量很有用)36.对于服从二项分布的变量,不必用”全距等于6个标准差”这一点来求标准差.应该直接代入样本比例求标准差.自由度问题37.自由度是指样本个体中可以自由变化的程度. 每当你的样本增加一个个体你就多了一个自由度, 反之每当你模型中增加一个变量就用去了一个自由度.在求标准差时要计算平均数, 所以N-1就是标准差的自由度.38.计算自由度的方法要看你的检验方法而定. 下列是常见公式.a.如果你有表格数据, 又只有一个变量, 则应该用分类变量水平数目减去一即是自由度. 例如你用表格列出收入变量. 该变量有六类, 则你的自由度等于6-1=5b.如果你有表格数据, 又有两个变量交叉列表, 则应该用行数减一乘以列数减一得到表格自由度. 例如你用表格列出收入和教育水平. 收入有六水平, 教育5水平, 那么你的表格自由度就是(6-1)(5-1)=20.c.求样本方差和标准差时, 其分母都是N-1, 这是因为标准差和方差都是以平均数为基础, 而求平均数要用去一个自由度. 当然求群体方差和标准差时则不需要自由度, 因为群体大, 用不用自由度关系不大.更主要的是群体参数是需要从样本估计的. 虽然样本统计数要用去自由度, 群体参数却不要. 例如群体平均数等于所有样本平均数的平均数. 对于一个样本来说无需减去自由度以求群体平均数.d.T测验一般是用来检验样本平均数是否等于某一群体平均数, 或者检验两个样本平均数是否相等. 这些情况下常常只需要一个自由度来计算平均数. 所以其自由度一般等于1.e.对于回归模型, 要看模型含有多少变量, 总的原则是用了多少变量就失去多少自由度. 不过要记住加上截距所用的一个自由度. 所以其公式是N-k-1, 其中k等于自变量个数. 例如你的回归模型含有两个自变量, 则k=2, 则模型一共用去三个自由度.标准差和标准误39.群体的标准差(或称标准误差)用σ表示,样本的则用S表示.它们是用来测量一个群体或样本中的变异程度的.顾名思义,标准差就是标准化了的差数.那么什么是差数呢?差数是对平均数而言的.换句话说,标准差就是一个群体或样本中的标准化了的偏离平均数的程度.40.标准误和标准差有两件事不一样.第一,标准差是测量每个个体偏离平均数的程度,而标准误是测量每个样本平均数偏离群体平均数的程度.不过这两者的差别其实比听起来小,因为一个样本只能有一个标准差(不论样本有多大),也只能有一个标准误.第二,因为标准差是测量样本内的变异程度,我们无需重复抽样,仅仅用标准差描述手里这个样本.而标准误则是测量样本之间的变异程度,所以一定要引入重复抽样的概念.即假定我们可以或已经抽取了许多独立样本,每次得到一个平均数,然后看这些平均数偏离群体平均数的程度.41.要求标准差,先求方差.其群体方差公式是:22()xNμσ-=∑,其对应样本方差公式是:22()1x xSn-=-∑.有了方差,只要对它开方就有了标准差.而再把标准差除以根号的样本容量就有了标准误:xS=.42.可以求两个样本的方差是否相等,用F检验.如果方差相等在比较样本平均数时就可以用两样本方差的平均数做分母.正态分布43. 正态分布特点是: [1]分布对称, [2]平均数等于中数(M EDIAN )或中位数,众数(M ODE ), [3]大约68%的值位于正负一个标准差之间, 大约95%的值位于正负两个标准差之间,大约99%的值位于正负三个标准差之间, [4]其全距是大约六个标准差(最后这一点对于计算样本容量很有用)44. 正态分布用的最广,乃因为许多其它分布在大样本下都接近正态分布.比如T 分布, 卡方分布,二项分布等.更重要的是不论原群体分布是何性状,如从该群体反复抽样,把各个样本的平均数(或中位数,或众数)记下来得到平均数的抽样分布,其性状都趋近正态. 这个现象是归因于中央极限定理.45. 正态分布另一个特点是参数比较少,只需两个即可以描述分布: 平均数和标准差.46. 正态分布可以是基于原始数据也可以是标准化的数据. 后者平均数是0, 方差为1.只有标准化的正态分布临界值才能直接用于查表求概率. 标准化的公式是: ()x x z s-=. 47. 在E XCEL 中用函数S TDEV ()估计样本标准差, 用S TDEVP ()估计群体标准差, 或S TDEVA ()估计样本标准差, 且要包括逻辑变量或文字内容. 同理, 用V AR ()求样本方差, 用V ARP ()求群体方差, 或V ARA ()如果包括逻辑变量或文字内容.检验假设显著性的三种方法48. 有三种方法检验假设: 临界值法, 概率法, 置信限法 49. 临界值法就是你求出统计值(如t 值, 卡方值, z 值等), 然后求出5%或1%显著水平下的临界值, 再用统计值去比较临界值. 比较的结果是”不怕临界值小, 就怕临界值大”因为临界值越大概率越小. 如果统计值大于临界值,说明结果显著, 应该推翻无效假设. 反之统计值小于临界值, 说明结果不显著, 不能推翻无效假设.50. 临界值法缺点是你只知道结果是否显著,并不知道精确概率.51. 概率法也是先求统计值, 再根据统计值及其相应的自由度求出概率值. 这个方法随着计算机的普及现在最普遍. 以前要查表才能知道概率, 现在只要输入统计值,用Excel 函数即可以求概率. 它的好处是可以知道精确概率值.52. 如何理解概率值? 最容易的方法是把所得概率值看成是机会引起的事件概率. 例如概率=0.33, 说明有33%的机会所观察到的平均数或其它统计值是有机会引起的. 这个概率相当大, 所以我们不能推翻无效假设. 而如果概率=0.01, 说明只有1%的可能是由机会引起. 这说明机会引起的可能性很小. 所以可以推翻无效假设. 总的说来是”不怕概率大, 只怕概率小”, 小了就可以推翻无效假设.53. 置信限法是先求样本统计值如平均数等, 再求样本标准差和标准误. 根据这些样本统计值就可以求群体参数的置信限为样本平均数加上正负两倍的标准误. 如果在置信限中包括0, 说明无效假设不能被推翻. 反之如果置信限不包括0, 说明群体参数不等于0. 该法多用于回归模型参数检验是否为0, 即某一自变量对因变量效应是否为0.54.所有测验(如t测验, 卡方测验, F测验, 正态测验等)统计值都是可以直接和临界值比较的值! 它们只是告诉你在横坐标上的数值而不是概率.55.临界值不是概率, 但每个临界值都对应相应的概率! 所以知道了临界值再求概率是不难的(求法见后).56.注意不要一看到1.96, 2.58等就认为它们代表0.05或0.01的概率. 1.64,1.96还有2.58都是在标准正态分布下才代表0.1, 0.05和0.01等概率. 在其它分布下它们对应的概率要看自由度而定.57.标准正态分布下的临界值我们用字母z表示. 其它分布时一般不用z表示.例如t分布下的临界值就用字母t表示, F分布下的临界值用字母F表示, 卡方分布下的临界值就是卡方值.58.显著水平和置信水平有何关系? 两者都是概率值. 不过显著水平是指尾部的概率而置信水平是指从左到右的累积概率. 换句话说, 当显著水平等于0.05时, 置信水平就等于1-0.05=.95.59.如何计算不同置信水平下的z值?办法有两个. 一是常用的可以直接记忆.如在标准正态分布下的三个z值是很容易记忆的: 1.64, 1.96, 2.58, 分别表示当置信水平是90%, 95%和99%时的临界值. 对于大多数问题来说记忆法就足够了. 第二种方法是用Excel函数计算. 不论函数用的是那种分布, 在Excel的函数名称里都有一个INV, 表示是把计算过程倒过来, 从概率值求临界值(一般是有了临界值即统计值要求概率值. 所以从概率值求临界值就是反过来了).60.套用Excel函数公式时, 其括号内的值就是你的概率值或置信水平. 有两点要注意, 所有求临界值的Excel函数都是基于累积概率, 即从无穷小到所求的那一点. 也就是从左到右. 但另一方面, 这些函数又都假定两尾概率. 所以其通用公式是(1-alpha/2)=(1-显著水平/2).61.例如要求显著水平=0.1时的临界值, 则在标准正态分布下输入的概率值或置信水平就是Normsinv(1-0.1/2)=Normsinv(0.95)=1.6448. 同理当你的置信水平=0.95时则Normsinv(1-0.05/2)=Normsinv(0.975). 最后如置信水平=0.99时有Normsinv(1-0.01/2)=Normsinv(0.995)=2.5758. 62.如果你不想要两尾置信水平, 只要一尾概率, 那么其公式就是(1-alpha). 例如求置信水平=0.95时的一尾临界值z值, 直接把0.95代入Excel函数有Normsinv(0.95)=1.6448. 又如求置信水平=0.99的一尾临界值z值, 直接代入0.99有Normsinv(0.99)=2.326. 上述例子可见一尾测验时的临界值永远小于两尾时的临界值. 换句话说所以统计学家们说一尾检验力度更大.63.在用Excel函数求临界值时,都是假定你已经决定了显著水平而要求相应临界值.这时需要用Normsinv, Tinv, or Chiinv. 第一个函数只要输入概率即可. 第二个和第三个都需要概率加上自由度.64.用Excel函数求概率时, 用NORMSDIST, TDIST和CHIDIST. 和临界值相似, 第一个函数只要输入z值即可. 第二个不但要t值, 还要自由度和一尾还是两尾, 共需三个参数. 最后的卡方分布概率因为是非对称分布, 且卡方不能为负数, 所以不可能用两尾. 只要卡方值加上自由度即可.65.用Excel求置信限没有简单函数,需要求出平均数和标准差,标准误等以后在手工计算置信限.66.最后Excel还有一套直接求概率的函数, 称为TTEST(), FTEST(),CHITEST() 和ZTEST(). 这些函数要求你给出数据所在位置再直接得出其显著性概率. 例如TTEST()第一个参数是数据范围, 第二个是1或2表示是一尾还是两尾检验, 第三个是测验类型, 共有三类: 第一类是成对比较, 第二是不成对但方差相等, 第三是既不成对方差也不等. 所以TTEST(a1:e22,1,1)表示数据范围是从A1到E22,用一尾检验,成对比较, 而TTEST(a1:b22,2,2)表示数据范围是A1到B22, 用两尾检验, 不成对但方差相等.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
效是相等的。
7
上述假设称为无效假设。假设效应是抽 样误差。 备择假设:和无效假设相对应的一个假 设。记作HA:μ≠ μ0或HA:μ1 ≠ μ2。 意思是说,如果否定了无效假设,则必 须接受备择假设,反之亦然。
8
二、统计假设测验的基本方法
设某地区的当地小麦品种667m2产300kg,即当地品
参数估计:由样本统计数对总体参数作出估计。
3
第一节 统计假设测验的基本原理
统计假设 统计假设测验的基本方法 两尾测验与一尾测验
统计假设的两类错误
4
一、统计假设
由于总体多是无限的,往往需要用样本推断总体,
因此首先需要提出一个有关其总体参数的假设。
例如假设某小麦新品种的产量和原品种的产量一
样。下面是一些统计假设的例子:
当一事件的概率很小时,可认为该事件在一次试
验中几乎是不可能发生的事件。故当 y -μ由随 机误差造成的概率小于5%或1%时,就可认为它不 可能属于抽样误差,从而否定假设,接受备择假
设,样本平均数不是原总体中的一个样本。 用来测验假设的概率标准5%或1%等,称为显著水 平,以α表示。
_
α= 0.05为显著,α =0.01为极显著
> y
_
μ0 时, 需要否定H0;但如果 不
_
y
< μ0 ,
即可能是一批不合格产品。因此,测验的假设应为H0:μ
> μ0(产品合格); HA:μ<μ0 (产品不合格)。这样否定
区在左尾。 反之,如果H0:μ < μ0 ; HA:μ>μ0 。这时否定区就只 有右尾。
17
左 尾 测 验
否定区
α=0.05
接受H0:μ1=μ2,即A、B两种取样方法所得每平 方米产量没有显著差异。
37
2、在两个样本的总体方差
12
和
22
为未知,
而两个样本容量小于30,用t 测验。
首先,从样本算出平均数差数的方差 s e 2
,作为对σ2的估计。
s e2
( y1 y1 ) 2 ( y 2 y 2 ) 2 (n1 1) (n2 1)
15
两尾测验示意图
fN (y) 0.03
否定区域 2.5%
0.02
否定区域 2.5%
0.01
接受区域
95%
0.00 255 y
270
285
300
315
330
345
270.6
329.4
16
但在某些情况一下,两尾测验不一定符合实际需要。例如,某 型计算机的使用时数要求> μ0 。如果进行抽样测验,则在
误或α错误。
19
如果H0是错误的,通过测验没有发现其不真实而接 受了它,即犯了一个接受不真实的H0的错误。这叫 第二类错误或II型错误或β错误。 现以P79上的例子说明β值的计算。
270.6 315 329.4 315 u1 2.96 u2 0.96 15 15 P(u 0.96) P(u 2.96) 0.8315 0.0015 0.83
t 测验:按t 分布进行的假设测验。
28
标准化正态分布与自由度为4的t分布曲线
0.45
0.40 0.35 0.30 0.25 0.20 0.15 0.10
正态分布
t分布(df=4)
0.00 -4 -2 0 2 4
29
二、单个样本平均数的假设测验
这是测验某一样本所属的总体平均数是否和
某一指定的总体平均数相同。 [例5.1]某春小麦良种的千粒重μ0 =34g,现自外 地引入一高产品种,在8个小区种植,得其千粒 重(g)为:
13
三、两尾测验与一尾测验
在提出一个统计假设时,必有一个相对应的备
择假设。例如上述单个平均数测验,若H0:μ=
μ0 ,则备择假设为HA:μ≠μ0 。后者即指该
新品种的总体平均产量不是300kg,这包括大 于300kg和小于300kg两种可能性。
14
因而在假设测验时所考虑的概率为正态曲 线左边一尾概率(小于300kg)和右边一尾概 率(大于300kg)的总和。这类测验称为两尾 测验,它具有两个否定区域。
地良种千粒重指定值无显著差异。
33
三、两个样本平均数的假设测验
这是根据两个样本平均数的差,来测 验这两个样本所属的总体平均数有无显著 差异。测验的方法分为:成组数据的平均数 比较和成对数据的比较。
34
(一)成组数据的平均数比较
如果两个处理彼此独立,不论两个处 理的样本容量是否相同,所得数据皆称 为成组数据,以平均数作为相互比较的 标准。 1、在两个样本的总体方差已知时或样本容 量大于30时,用u测验。
计σ2,则
( y ) 的分布不呈u分布,而作t分布: s_
y
_
y t s_
y
_
s s_ y n
27
t-分布:一组对称曲线,以自由度确定 某一特定的分布。自由度用ν和df表示。当 ν大于30时,t-分布接近于正态分布。
t-分布与正态分布曲线比较:t-分布曲
线稍扁平,峰顶略低,尾部稍高。
5
(一)单个平均数的假设
一个样本是从平均数为μ0的总体中随
机抽出的,记作H0:μ=μ0。
例如:某一小麦新品种的产量具有原
地方品种的产量,其平均产量μ等于某
一指定值μ0,记为: H0:μ= μ0
6
(二)两个样本平均数相比较的假设
两个样本是从两个具有相同的总体中
随机抽出的,记为H0:μ1= μ2
例如:(1)两个小麦品种的产量是相同
自由度为df=n1-1+n2-1=n1+n2-2
38
s_
y1 y2
_
s s n1 n2
_
2 e
2 e
( y1 y 2 ) ( 1 2 ) t s_ _
y1 y2 _
_
y1 y 2 t s_ _
y1 y 2
39
_
[例5.4]研究矮壮素使玉米矮化的效果,在抽穗期测定喷 矮壮素小区8株、对照区玉米9株,其观察值如下表:
y1(喷施矮壮素)
y2(对照)
160
170
160
270
200
180
160
250
200
270
170
290
150 210
270 230 170
从理论上判断,喷施矮壮素只可能矮化无效而不可能促
进植物长高。
H0:μ1≥μ2 ,即喷施矮壮素的株高与未喷的相同或更高;
HA:μ1<μ2 ,即喷施矮壮素的株高较未喷的为矮。
种的总体平均数μ0=300kg,并从多年种植结果获 得其标准差σ=75kg,而现有某新品种通过25个小 区的试验,样本平均产量为每667m2产330kg,即 y =330,那么新品种样本所属总体与原总体是否有显 著差异呢?
_
9
(一)提出统计假设。
H0:μ=μ0
即新品种与老品种之间不存在真实的差异,样本平均数
36
H0 :μ1=μ2 ;HA:μ 1≠μ α =0.05
2
测验计算: 12 0.4; 22 0.4, n1 12, n2 8,
y1 y2
_
_
0.4 0.4 0.2887kg 12 8
1.2 1.4 u 0.69 0.2887
推断: |u|<u0.05,故P>0.05。
第五章 统计假设测验
1
上章主要讨论了从总体到样本的问题,本章 将讨论从样本到总体的问题,即统计推断 问题。
统计推断:根据效应是误差的概率而作出 推论的方法 。统计推断包括统计假设测验和
参数估计两个方面。
2
统计假设测验:先作无效假设(处理的 效应是由误差造成),再依据该假设概 率大小来判断接受或否定该假设的过程 。
2、在n和显著水平α相同的条件下,总体平均数μ 和假设平均数μ0 相差愈大,则犯第二类错误的概率 β愈小。 3、为了降低犯两类错误的概率,需要采用一个较低 的显著水平,如α=0.05;同时适当增加样本容量, 或适当减小总体方差,或两者兼有之。 4、如果显著水平α已经确定,则改进试验技术和增 加样本容量,可以有效地降低犯第二类错误的概率。
24
第二节 平均数的假设测验
t 分布 单个样本平均数的假设测验 两个样本平均数的假设测验
25
一、 t 分布
以前讲过,在µ σ2为已知或样本容量n>30 和
时,用s2估计σ2 ,则从总体中抽样所得样本
_
平均数 y 的分布为正态分布,具有N(μ,
σ2 /n)。所进行的测验为u测验。
26
当σ2为未知,而样本容量n<30时,如以样本方差s2估
接受区 0.95
μ0
否定区
_
y
接受区
0.95
α=0.05
右 尾 测 验
_
μ0
y
18
Байду номын сангаас
四、统计假设的两类错误
统计假设测验是根据一定的概率标准对总体特征
作出推断。否定了H0,并不等于已证明H0不真实;接 受了H0 ,也不等于已证明H0是真实的。 如果H0是正确的,通过测验却否定了它,就犯了 一个否定真实假设的错误。这叫第一类错误或I型错
y1 y2
_ _
2 1
n1
2 2
u
( y1 y 2 ) ( 1 2 )
_
_
n2
y1 y2
_
_
35
u
y1 y 2