第二部分 单样本和双样本假设检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一类错误和二类错误
• 前面提到,如果p值远小于0.05,我们拒绝了零假设,但 我们还是要承担一定的风险。 • 比如,我们通过考试来评估学生能力,90分对应着p=0.05, 那么我们则会认为90分以上的学生为好学生。但是如果一 些学生参加了考试辅导,老师帮他们赌到了一些考试题, 使得他们平均分高于90。在统计检验中,我们发现p小于 0.05,那我们会得到结论,这些同学能力高于一般水平。
A基本概念
• 总体标准差未知的大样本z检验
• t分布 • 单样本t检验
• 估计总体均数
• 上边我们讲到,如果我们把单一样本的均数和总体均数比 较,且已知研究变量的标准差,则适合的统计检验是单样 本z检验。 • 但是如果总体标准差未知呢? • 举例,已知上个世纪九十年代中国人均寿命为70岁(这样 的信息从网上很容易查到,但是标准差往往查不到),现 在你想调查一下目前中国人是否人均寿命增长了。随机抽 取了100个今年死亡的人,发现平均寿命为73,标准差为 15。那么中国人比以前长寿了吗?
• 这时,我们显然犯了一个错误。也就是我们拒绝了这些学 生水平的一般的假设(零假设),而零假设才是真的,这 种错误称为一类错误。虚报、存伪
• 如果另一组学生平时学习很好,但是由于考试当天 集体食物中毒,拉肚子,导致考试成绩不高,p大于 0.05,统计推断结果接受零假设,这些学生成绩一 般。 • 这种情况下,我们就犯了二类错误,即零假设为假 而我们却接受了它。漏报、去真
计算假设检验量
z
X
X
X
Nwenku.baidu.com
做出统计推断
• 单侧:如果z大于或小于临界z分数,则拒绝零假 设; • 双侧:如果z的绝对值大于正的临界z分数,则拒 绝零假设。 • 有时也可给出p值,特别是边缘显著。
单样本z检验的前提条件
• 因变量以等距或等比量尺测量
• 样本通过随机抽样获得 • 所测量变量在总体中为正态分布
• 正确的做法是在做假设检验之前确定是做单侧 (操作导致更好或者更差)检验,还是双侧检验 (操作会引起差异,不管好坏)。
B基本统计过程
• 提出假设 • 选择统计检验和显著性水平 • 选择样本和收集数据
• 求拒绝区域
• 计算检验统计量 • 做出统计推断 • 解释结果 • 单样本z检验的前提条件
提出假设
单侧检验和双侧检验
• 如果前面提到的那位导师挑选的学生平均智商是 90,这时我们不会拒绝零假设。
• 那此时我们是不是就接受零假设,认为这个导师 眼光一般呢? • 我们不能,因为还有另一种可能,该导师眼光很 差。 • 这样问题就修正为要验证该导师眼光特殊(很好 或者很差)。
• 在之前的检验中,我们要验证该导师的眼光很好,用的单 侧(单尾)检验,也就是在Z大于0的一侧。
研究者的决定 实际情况 零假设为真 接受零假设 拒绝零假设 正确决定p=1- α 一类错误p= α 零假设非真 二类错误p=β 正确决定p=1-β
• 一类错误会产生误导。 • 比如你的实验结果证明你的某种训练可以提高注 意力,而注意力的集中有利于学习成绩的提高。 那么别人就可能认为你的训练有利于提高学习成 绩。 • 但是如果在你的实验中犯了一类错误,那么其他 人用你的训练方法时并不能提高学生的成绩。 • 降低一类错误的方法就是多次重复实验或者测量, 反复证明训练对注意力提高的有效性。
• 我们可以通过如下方式进行检验:让他通过自己 的方式挑出25个学生,然后比较这些学生的智商 是否真的较高。
被试组选择
• 要验证该导师的说法,我们要让他选25个他认为 高智商的同学,但是这种选择需要加以限制。
• 如果该导师直接奔向基地班,那这种选择显然是 无效的。可选择的办法是,把学校所有学生的照 片都找来,让其通过相貌来确定。
• 这样学校的每一个学生都有相同的机会被选到, 而且每一次选取独立于其他的选取。也就是遵循 随机取样的原则。
• 如果该导师选出的学生的平均智商确实高于总体 平均,我们能否确认他确实眼光很准呢?
• 答案是不能。原因在于,我们随便找一个人去选, 选出的学生的平均智商都不太可能等于总体平均 数。从均数的抽样分布,我们可以得知,高于总 体平均数的可能占50%。 • 也就是说该导师选出的学生平均智商高于总体均 数的原因可能是随机因素。
• 首先给定一个希望推翻的零假设。
• 以IQ作为因变量,总人口的平均IQ为100 • 零假设H0:μ=100
• 备择假设HA:双侧:μ≠100,单侧; μ>100或者 μ<100
选择统计检验和显著水平
• 如果我们把单一样本的均数和总体均数比较,且 已知研究变量的标准差,则适合的统计检验是单 样本z检验。
• 最简单的假设检验是将一组被试与总体进行比较, 且总体均数和标准差已知。
• 举个例子,硕士研究生考试包含笔试和面试,面 试在最终录取中起到了很大的作用,因为导师更 看重素质而不是分数。
• 有个导师声称,他的眼光很准,他可以看一下学 生的眼睛,就能找到好的学生。我们要对他的说 话进行验证。
• 如果我们用智商来代表一个学生的素质(尽管可 能并不合适),那么刚才的问题就变成了那个导 师可以通过看学生的眼睛来判断他的智商。
• t分布
• 由于均数的抽样分布为t分布,所以假设检验量不 再是z分数,而是t分数。
t X sX
sX
s N
• 公式和大样本z检验一样,也会得到一样的数值, 那么大样本z检验和t检验的不同在哪里? • 不同在于,服从不同的分布,相同的α值会得到不 同的拒绝区间。
• 与标准正态分布不同,t分布依赖于其所采样本的 自由度,df=N-1
• 因为推断的做出是基于概率的,如果要得到该导 师的选择是无效的,也就是说该组学生的平均智 商高于总体是随机抽样造成的,我们需要冒一定 的风险。小概率事件也时有发生。
• 我们需要承担的这个风险量被称为α水平。 α 是我 们愿意承担的零假设成立的概率。如果实际算出 的概率要低于α,那么我将会拒绝零假设。
• 现在的问题就变成了双侧(双尾)检验,也就是要看分布 的两端。 • 计算样本z分数,单侧和双侧无区别,差别在于p值,双侧 是单侧的2倍。
• 在刚才的例子中,我们犯了一个错误,那就是我 们先假设那个导师眼光好,用了单侧检验,发现 不能拒绝零假设;然后我们改变主意做了双侧检 验。这样做增大了一类错误的概率。单侧的0.05 加上双侧中另一侧的0.025。
• 另一种降低一类错误的方法就是选取更低的α水平。 • 但是降低α水平会导致更多的二类错误。 • α水平人为地设为0.05实际上在一类错误和二类错误的可 能负性后果之间寻求一种妥协。
• 在某些特殊的研究中,比如治疗癌症的药物研发中,应选 取较大的α值。因为这种情况下犯二类错误的后果是相当 严重的。
• 计算检验统计量
• 做出统计推断
• 练习:已知去年大学教师人均收入为50000元, 现在随机抽取16名大学教师,调查得知他们今年 的平均收入为60000元,标准差为10000元,问大 学教师今年比去年待遇提高了吗?
• 很显然,上边的练习中样本数目不够大,其均数 的抽样分布不符合正态分布,因此不适用大样本 的z检验。 • 值得庆幸的是,当样本数目较少时,其均数的抽 样也满足一个比较规律的分布,即t分布。 • t分布类似于标准正态分布。它也是呈钟形、对称、 向两端无限延伸,且均值为零。t分布也是一个完 全遵从某个数学公式的抽象数学概念。
• 一个心理学家测量了一个班级25个孩子的智商, 想看其是否与同龄人有差异,已知智商平均数为 100,标准差为15. (1)如果事先对该班孩子不了解,后测得其平均智 商为105,这群孩子智商特殊吗? (2)如果事先知道这班孩子是快班的,后测得其平 均智商为105,这群孩子智商特殊吗?
第六章 区间估计和t分布
• 所抽样总体的标准差与所比较总体的标准差相同
单样本检验的多样性
• 检验一个已经存在的群体
• 完成一个单样本实验
为什么单样本检验很少采用
• 单样本检验的主要问题在于很难从研究的总体中 抽取一个真随机的样本; • 实验处理加到某一样本上,由于没有对照组很难 排除混淆变量。
• 练习:
• 一个精神分析师正在检验一种新的抗焦虑药物, 这种药物有降低心率的副作用。50个学生服药六 周后的平均心率为70,。如果总体的平均心率为72, 标准差为12,那么这个精神分析师可以下结论说 新药物会显著降低心率吗?
• 这时,我们可以先做出一个假设,对其进行验证: 选取学生的平均智商并不显著高于总体均数,其 差异是随机抽样产生的,并不涉及一个特别的选 择过程。这就是零假设检验。
• 接下来,我们要做的就是随机选取25个学生测其 智商,重复n次,看有多少次能选到比那个导师选 取的学生平均智商更高。也就是确定其概率。
• 上述的做法会得到智商均数的一个分布,由于这 个分布显示的是零假设(没有特殊操作,随机选 取)为真时发生的情况,因此被称为零假设分布。
• 在单样本检验且总体标准差已知的情况下,这个 零假设分布就是均数的抽样分布。
• 通过这个零假设分布,我们可以算出选出比那个 导师选择的学生组平均智商更高的概率是多少。
• 通过z分数来计算,比如该导师选取的25个学生平 均智商为104,总体均数为100,标准差为15.那 么 104 100 z 1.33 15 / 25 • 查表可知,对应的概率为0.0918。这个概率是通 过随机选择而得到该分数的概率,被称为p值。
统计决定
• 算出其概率之后,我们要做的是做出个统计推断。
• 心理学中,每20次中有1次机会能抽到的α水平被认为是能 接受的最大风险值。也就是0.05.
• 如果采用0.05的α水平,且实验p值小于0.05,那么我们可 以再0.05的显著水平上拒绝零假设。也就说,那位导师的 眼光显著好于一般人。 • 如果p大于0.05,我们会认为那位导师的挑选完全无效吗? 一般情况下,我们会说没能拒绝零假设(证据不足)。这 是数学家Fisher的观点:认为我们要么拒绝零假设,要么 保留做出决定的权利。
第五章
假设检验导论:单样 本的z检验
A基本概念
• 零假设检验
• 统计决定 • 一类错误和二类错误 • 单侧检验和双侧检验
• 在前四章中,我们对描述性统计做了介绍。特别 是通过z分数我们可以计算个体在总体分布中的位 置和样本在抽样分布中的位置。换句话说,我们 可以描述个体或者样本的特殊性。
• 那么处于怎样的位置才算是特殊呢?这种特殊性 有怎么来验证呢? • 这些问题是假设检验所要解决的问题。
• 随着df增加,t分布越来越接近正态分布。 • 从图中可以看到,对于位于尾端区域的任何一个 z值,t分布的p都要大于正态分布,且df越小,p 越大。也就是,样本较小时更难达到显著性水平。
• 如果总体标准差已知,我们可以轻松计算
z
X
X
X
N
• 现在σ未知,怎么办? • 我们可以用样本的无偏标准差来代替σ
X z sX
sX
s N
• 这就是大样本z检验,前提条件样本要足够大。
对上边提到的问题进行运算:总体均数70,样本数目100, 均数73,标准差15,z(0.05)=1.65, z(0.025)=1.96 • 提出假设 • 选择统计检验和显著性水平 • 求拒绝区域
• 而Neyman和Pearson则认为,应该提出与零假设互补的 备择假设,因此拒绝其中一个就表明倾向于接受另一个。
• 在上边的例子中,我们把智商转换成了z分数,然 后进行统计检验。这种情况下,z分数被称为检验 统计量。(后边我们还会讲到t分布)。
• 检验统计量的分布被认为是零假设分布。
• Z分数越大,p值越小,差异越显著。
• α水平如无特殊要求,设为0.05
选择样本和收集数据
• 为了保证检验的有效性,必须从所要研究的总体 中随机抽取一个样本。 • 样本越大,假设检验的结果越准确。降低二类错 误 • 基于实际操作的考虑,样本大小会受到必要的限 制。
求拒绝区间
• 拒绝区间可依据临界z分数确定。
• 临界z分数指z分数之外的面积正好等于α值所对应 的那个z分数。 • 双侧:临界z分数为1.96和-1.96,两侧各对应 0.025;单侧:临界z分数分别为1.65或-1.65. • 单侧比双侧更容易拒绝零假设。