统计学第9讲 第9章 推论统计导论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第9章 推论统计导论
9.1 抽样问题 问题1:你是一位临床心理学者,你想在某一社区进 行心理治疗,你希望了解什么? 答案:社区的情绪问题和发病率。 问题2:如果你感到身体不适,医生想给你验血,医 生想了解什么? 答案:医生想了解你是否患了某种疾病。 以上问题的共同点是什么? 答案:你想知道某总体的参数,通过参数得到结论
我们关心的“总体”主要是指一个假设整体。在典 型的实验情境中,真实的总体是不存在的。而我们 想得到的是假设这个总体存在时,总体的一些性质 。 例如我们随机抽取一组病人(样本)服用某种药物, 我们希望什么?
我们希望试验结果可以给可能使用这种药物的每一 个人。当然这里是假想的总体。 因为我们无法对总体进行详细研究,只有根据样 本统计量得出关于总体参数的结论。几乎所有的 研究都是对有限的个体进行观察和测量,从中了 解总体的情况。
人们往往认为Ⅱ类错误容易接受,因为没有证明 自变量的影响,但是这样做也可能产生一些负面影响 。例如,由于Ⅱ类错误人们很可能放弃一种实际有意 义的研究结论。降低Ⅱ类错误的最可靠方法是增大样 本容量。
需要牢记的术语 总体 样本 抽样分布 二项分布
显著性水平 α水平
虚无假设H0 备择假设H1 双尾概率值 Ⅱ类错误(β错
方向性假设 无方向性假设 单尾概率值 误)
Ⅰ类错误 (α错误)
9.3 统计假设的检验----显著性水平
图9-2 从三个 不同总体中 抽取样本量 分别为2、4 、30时的抽 样分布,无 论总体分布 怎样,随着 样本量增加 ,平均数的 分布都接近 正态
例题:假设一个完美的硬币,投掷10次,请预测: “不是5次正面5次反面的概率”是多少?
0.28 0.24 0.2 0.246 0.205 0.205
1. 虚无假设(H0) 表示一个或多个总体参数的假设值 2. 备择假设(H1) 表示总体参数不是虚无假设中的值, 而是另有其值 H0:μ=4.0 (虚无假设) H1:μ≠4.0 (备择假设) H1可以是无方向的(nondirectional) 或双尾(two-tail) 假设。 H1也可以是有方向的(directional) , 不仅表示参数值 不等于H0假设中的值,还说明差异的方向。 H0:μ≤4.0 (虚无假设) H1:μ>4.0 (备择假设)
9.4 统计假设的检验 9.4.1 虚无假设和被择假设 我们研究的目的:由样本推论总体 我们希望:如果样本平 均数=6.0,那么总体平 均数必定为6.0 我们只能说:如果 μ=4.0,那么得到一个 样本平均数不同于总 体的概率是多大?
X 6
总体
样本
假定μ=4.0
总体
样本
X 6
推论统计的两种假设
P(9次正面)+P(10次正面)+P(1次正面)+P(0次正面)= 0.010 +0.001 + 0.010 +0.001 =0.02
投掷硬币10次,出现9次正面这种罕见事件的双尾概 率大约=0.02。如果选择α=0.05,我会认为这个结果 是由非偶然因素造成的(硬币有偏向)。 如果选择α=0.01,则我们不能够判定是偶然所致。 注意:选择什么样的α水平,在研究设计阶段就要确 定下来。我们不能先进行一项研究,然后分析结果 ,得到一个概率值后再去确定α水平。
3. H0:μ=4.0,α=0.01,双尾检验,计算得双尾p=0.1 。统计结论:因为p>0.01,所以无统计学意义,不拒 绝H0。假设虚无假设实际为假,则所犯错误为( )错误。 4. H0:μ=4.0,α=0.05,双尾检验,计算得双尾 p=0.06。统计结论:因为p>0.05,所以无统计学意义 ,不拒绝H0。假设虚无假设实际为真,则所犯错误 为( )错误。
9.2 抽样分布的概念 从总体中随机抽取N个样本,根据样本统计量推论总 体参数。这些样本统计量可能出现的所有情况,称 为“抽样分布”。每一种统计量都有抽样分布,例 如平均数、标准差、方差、比例、中位数等。 例如,从一个μ=4,σ=1的总体中随机抽取一个相 同容量的样本,大多数的样本平均数会接近4.0, 也可能有极个别的偏离4.0,异常平均数的大小取 决于样本大小。
随机抽取的个 体的分数分布
样本平均数与 总体平均数相 差较大
X XX XXX XXXX
X XX XXX XXXX
N=2
样本平均数与总 体平均数相差较 小
X X X X XX X X XX XX
N=20
X X X X X X X
X X X X
样本平均数与 总体平均数相 差小
N=40
为什么抽样分布如此重要? 答案:一旦知道样本统计量的抽样分布,你就可以 作出各种不同的假设检验。 例题:调查某地化工厂排放污水对环境所致影响, 已知附近的野生海龟平均体重为μ=4,σ=1,理论 上大约65%的海龟在3-5磅之间。
当评估一项研究结果时,无论备择假设是否有方向, 应该使用单尾概率值(one –tail probability value )
9.4.2 间接证明的思想 如果将一枚硬币投掷10次、1000次,如果出现5次或 500次正面,我们能‘证明’它是可靠或无偏向吗? 只能说:我们没有理由拒绝”硬币是可靠的”这一假 设 同样,我们能否证明备择假设正确与否呢? 在一张纸上画两条直线,比较其长度是否存在差异? 你该怎么回答呢? 答:“它们不一样长,长度一定存在差异” 通过拒绝长度相等(虚无假设),你可断定存在差异
答:可以知道,只有再次研究,如果得到类似结果 ,可肯定没有犯Ⅰ类错误。
需要指出的是,科学研究领域中,重复研究是一个 薄弱环节,人们对研究持有一种普遍观点,即:一 个好的研究必须与众不同并且对科学文献有所建树 。为此,科研人员独自进行研究设计以重复验证研 究结果时,其结果通常不对外公开。
小结
统计的基本问题就是通过样本统计量估计总体参数 在推论统计中,常常需要将获得值与期望值进行 比较。期望值是由恰当的抽样分布得出的,而抽 样分布是样本统计量取值的理论概率分布。我们 知道怎样通过抽样分布来解释样本统计量,而且 还了解了样本大小对抽样分布的影响。小样本往 往与总体参数差别比较大,样本越大,样本平均 数越接近总体平均数。 每个实验中都包含两个完全对立和排斥的假设。 虚无假设和备择假设。
如果实验结果十分不寻常,或者说是一个稀有事件, 我们就拒绝虚无假设。否者就不拒绝虚无假设。我们 决不能说“证明”了虚无假设。 拒绝一个真实的虚无假设所犯的错误,称为Ⅰ类错误 接受一个虚假的虚无假设所犯的错误,称为Ⅱ类错误 科学家的保守态度常常使得他们选择一个比较低 的显著性水平,这就导致犯Ⅱ类错误的概率。如果不 进行重复实验,就不知道什么时候犯Ⅰ类错误。即使 进行了重复研究,也不能宣称知道了绝对真相。
称为0.05的显著性水平(0.05 significance level)或5% 的显著性水平。
2. 在一个抽样分布中,如果一个事件发生的概率≤0.01 时,研究者认为该事件不是偶然因素所致。而是其他 因素引起,例如是对自变量的操纵引起的。称为0.01的 显著性水平(0.01significance level)或5%的显著性水平 实验者推论非偶然因素在某事件所起的作用的显著性 水平称为α水平(αlevel ) ,例如α=0.05或0.01 在投掷硬币中,出现9次正面甚至更为极端情况的概 率是多少呢?
答:肯定的,“科学永远是一种概率”。
如果投掷10次硬币,碰巧会出现10次正面,这个硬币 很可能不存在偏向。如果投掷1024次,平均说来,投 掷10次会出现10次正面。如果选择0.05水平,则当H0 为真时,当我们拒绝H0时,犯错误的概率是0.05。 9.5.1 Ⅰ型错误(α错误) 拒绝一个真实的虚无假设时,所犯的错误。 心理或医学常取0.05的显著性水平,在诸如心理治疗 、咨询或医疗实践中, Ⅰ型错误可能导致更大的风 险或使患者承受更大的痛苦。因此可取0.01的显著性 水平。
罕见的情况使我们怀疑这种情况不是偶然因素所致 ,而是硬币有问题。 这里有一个重要问题:“从投掷硬币的问题,我 们能否得出推论的界限在哪里?” 答案:科学的本质是讲概率的,没有所谓绝对的 科学,在科学领域,多数研究者会采纳下列两个 临界点中的一个作为对非偶然性因素的作用进行 推论的依据。 1. 在一个抽样分布中,如果一个事件发生的概率 ≤0.05时,研究者认为该事件不是偶然因素所致。 而是其他因素引起,例如是对自变量的操纵引起 的。
Fra Baidu bibliotek
下面4个例子各犯了什么错误? 1. H0:μ=4.0,α=0.05,双尾检验,计算得双尾 p=0.03。统计结论:因为p<0.05,所以具有统计学意 义,拒绝虚无假设。假设虚无假设实际为真,则所犯 错误为( )错误。 2. H0:μ=4.0,α=0.05,双尾检验,计算得双尾 p=0.04。统计结论:因为p<0.05,所以具有统计学意 义,拒绝虚无假设。假设虚无假设实际为假,则所犯 错误为( )错误。
9.5.2 Ⅱ型错误(β错误)
接受了一个虚假的虚无假设,那么就犯了Ⅱ类错误 如果α越低(高)那么犯Ⅰ类错误的概率越小(大),而 犯Ⅱ类错误大概率越大(小)。 事实上,选择检验水平反映了科学家的保守倾向, 换句话说,科学家更容易当研究结果为真时,拒绝 研究结果(Ⅱ类错误)。
H0的真实情况 接受H0 决策 拒绝H0 H0为真 正确 1-α Ⅰ类错误 α H0为假 Ⅱ类错误 β 正确 1-β
1问:实际操作中,怎么知道究竟犯了什么错误呢? 答:无从得知,因为无法得知总体参数的真实情况 2问:我们能否识别研究文献中的两类错误呢?
答:无从得知,因为作者的显著水平定为0.05或0.01 ,出现这种错误不可避免。并非作者责任。所以科学 从来就不是绝对正确的。由于这个原因,为了验证结 论的有效性,必须进行独立重复性的研究。 3问:如此说来,我们是否就无法知道哪个实验报告 的统计显著性哪个精确?哪个不精确?
只有25%出现 0.16 0.117 5次正面,不 0.12 0.08 是对半的概率 0.044 是75% 0.04 0.0010.01
概率
0 1 2 3 4
0.117 0.044 0.010.001 8 9 10 11
5 6 7 正面向上的次数
如果出现9次正面1次反面,如何对看待这个结果? 答案:我们怀疑这个硬币的可信度,因为太罕见
随机抽取一个比较大的海龟的样本,海龟重量接近4 磅。样本平均数越接近总体平均数 假如我们抽样发现海龟重量大约是6磅,大样本也 是如此,你会有什么想法? 答案:这些海龟已经不属于4磅的那个群体了。 另外一个问题,由样本估计总体,误差有多大?如 何估计误差?需要把样本结果与预计的结果进行比 较。而预计结果是根据抽样分布得出的。 抽样分布的性质: 1. 加大样本量,统计量的分布越接近参数分布。 2. 分布形态越对称,接近钟形分布。
什么情况拒绝虚无假设呢? 使用0.05的显著性水平,当特定结果发生的概率小于 或等于0.05时,就拒绝虚无假设,同时也就接受备择 假设了。下面给出检验步骤。
1. 假设H0为真 2. 计算抽样分布中样本统计量发生的概率 3. 如果概率足够小,则拒绝虚无假设H0,接受H1. 9.5 统计假设检验:两类错误 问:当拒绝虚无假设时,从统计上讲很难发生的事件 ,偶然会发生呢?
9.1 抽样问题 问题1:你是一位临床心理学者,你想在某一社区进 行心理治疗,你希望了解什么? 答案:社区的情绪问题和发病率。 问题2:如果你感到身体不适,医生想给你验血,医 生想了解什么? 答案:医生想了解你是否患了某种疾病。 以上问题的共同点是什么? 答案:你想知道某总体的参数,通过参数得到结论
我们关心的“总体”主要是指一个假设整体。在典 型的实验情境中,真实的总体是不存在的。而我们 想得到的是假设这个总体存在时,总体的一些性质 。 例如我们随机抽取一组病人(样本)服用某种药物, 我们希望什么?
我们希望试验结果可以给可能使用这种药物的每一 个人。当然这里是假想的总体。 因为我们无法对总体进行详细研究,只有根据样 本统计量得出关于总体参数的结论。几乎所有的 研究都是对有限的个体进行观察和测量,从中了 解总体的情况。
人们往往认为Ⅱ类错误容易接受,因为没有证明 自变量的影响,但是这样做也可能产生一些负面影响 。例如,由于Ⅱ类错误人们很可能放弃一种实际有意 义的研究结论。降低Ⅱ类错误的最可靠方法是增大样 本容量。
需要牢记的术语 总体 样本 抽样分布 二项分布
显著性水平 α水平
虚无假设H0 备择假设H1 双尾概率值 Ⅱ类错误(β错
方向性假设 无方向性假设 单尾概率值 误)
Ⅰ类错误 (α错误)
9.3 统计假设的检验----显著性水平
图9-2 从三个 不同总体中 抽取样本量 分别为2、4 、30时的抽 样分布,无 论总体分布 怎样,随着 样本量增加 ,平均数的 分布都接近 正态
例题:假设一个完美的硬币,投掷10次,请预测: “不是5次正面5次反面的概率”是多少?
0.28 0.24 0.2 0.246 0.205 0.205
1. 虚无假设(H0) 表示一个或多个总体参数的假设值 2. 备择假设(H1) 表示总体参数不是虚无假设中的值, 而是另有其值 H0:μ=4.0 (虚无假设) H1:μ≠4.0 (备择假设) H1可以是无方向的(nondirectional) 或双尾(two-tail) 假设。 H1也可以是有方向的(directional) , 不仅表示参数值 不等于H0假设中的值,还说明差异的方向。 H0:μ≤4.0 (虚无假设) H1:μ>4.0 (备择假设)
9.4 统计假设的检验 9.4.1 虚无假设和被择假设 我们研究的目的:由样本推论总体 我们希望:如果样本平 均数=6.0,那么总体平 均数必定为6.0 我们只能说:如果 μ=4.0,那么得到一个 样本平均数不同于总 体的概率是多大?
X 6
总体
样本
假定μ=4.0
总体
样本
X 6
推论统计的两种假设
P(9次正面)+P(10次正面)+P(1次正面)+P(0次正面)= 0.010 +0.001 + 0.010 +0.001 =0.02
投掷硬币10次,出现9次正面这种罕见事件的双尾概 率大约=0.02。如果选择α=0.05,我会认为这个结果 是由非偶然因素造成的(硬币有偏向)。 如果选择α=0.01,则我们不能够判定是偶然所致。 注意:选择什么样的α水平,在研究设计阶段就要确 定下来。我们不能先进行一项研究,然后分析结果 ,得到一个概率值后再去确定α水平。
3. H0:μ=4.0,α=0.01,双尾检验,计算得双尾p=0.1 。统计结论:因为p>0.01,所以无统计学意义,不拒 绝H0。假设虚无假设实际为假,则所犯错误为( )错误。 4. H0:μ=4.0,α=0.05,双尾检验,计算得双尾 p=0.06。统计结论:因为p>0.05,所以无统计学意义 ,不拒绝H0。假设虚无假设实际为真,则所犯错误 为( )错误。
9.2 抽样分布的概念 从总体中随机抽取N个样本,根据样本统计量推论总 体参数。这些样本统计量可能出现的所有情况,称 为“抽样分布”。每一种统计量都有抽样分布,例 如平均数、标准差、方差、比例、中位数等。 例如,从一个μ=4,σ=1的总体中随机抽取一个相 同容量的样本,大多数的样本平均数会接近4.0, 也可能有极个别的偏离4.0,异常平均数的大小取 决于样本大小。
随机抽取的个 体的分数分布
样本平均数与 总体平均数相 差较大
X XX XXX XXXX
X XX XXX XXXX
N=2
样本平均数与总 体平均数相差较 小
X X X X XX X X XX XX
N=20
X X X X X X X
X X X X
样本平均数与 总体平均数相 差小
N=40
为什么抽样分布如此重要? 答案:一旦知道样本统计量的抽样分布,你就可以 作出各种不同的假设检验。 例题:调查某地化工厂排放污水对环境所致影响, 已知附近的野生海龟平均体重为μ=4,σ=1,理论 上大约65%的海龟在3-5磅之间。
当评估一项研究结果时,无论备择假设是否有方向, 应该使用单尾概率值(one –tail probability value )
9.4.2 间接证明的思想 如果将一枚硬币投掷10次、1000次,如果出现5次或 500次正面,我们能‘证明’它是可靠或无偏向吗? 只能说:我们没有理由拒绝”硬币是可靠的”这一假 设 同样,我们能否证明备择假设正确与否呢? 在一张纸上画两条直线,比较其长度是否存在差异? 你该怎么回答呢? 答:“它们不一样长,长度一定存在差异” 通过拒绝长度相等(虚无假设),你可断定存在差异
答:可以知道,只有再次研究,如果得到类似结果 ,可肯定没有犯Ⅰ类错误。
需要指出的是,科学研究领域中,重复研究是一个 薄弱环节,人们对研究持有一种普遍观点,即:一 个好的研究必须与众不同并且对科学文献有所建树 。为此,科研人员独自进行研究设计以重复验证研 究结果时,其结果通常不对外公开。
小结
统计的基本问题就是通过样本统计量估计总体参数 在推论统计中,常常需要将获得值与期望值进行 比较。期望值是由恰当的抽样分布得出的,而抽 样分布是样本统计量取值的理论概率分布。我们 知道怎样通过抽样分布来解释样本统计量,而且 还了解了样本大小对抽样分布的影响。小样本往 往与总体参数差别比较大,样本越大,样本平均 数越接近总体平均数。 每个实验中都包含两个完全对立和排斥的假设。 虚无假设和备择假设。
如果实验结果十分不寻常,或者说是一个稀有事件, 我们就拒绝虚无假设。否者就不拒绝虚无假设。我们 决不能说“证明”了虚无假设。 拒绝一个真实的虚无假设所犯的错误,称为Ⅰ类错误 接受一个虚假的虚无假设所犯的错误,称为Ⅱ类错误 科学家的保守态度常常使得他们选择一个比较低 的显著性水平,这就导致犯Ⅱ类错误的概率。如果不 进行重复实验,就不知道什么时候犯Ⅰ类错误。即使 进行了重复研究,也不能宣称知道了绝对真相。
称为0.05的显著性水平(0.05 significance level)或5% 的显著性水平。
2. 在一个抽样分布中,如果一个事件发生的概率≤0.01 时,研究者认为该事件不是偶然因素所致。而是其他 因素引起,例如是对自变量的操纵引起的。称为0.01的 显著性水平(0.01significance level)或5%的显著性水平 实验者推论非偶然因素在某事件所起的作用的显著性 水平称为α水平(αlevel ) ,例如α=0.05或0.01 在投掷硬币中,出现9次正面甚至更为极端情况的概 率是多少呢?
答:肯定的,“科学永远是一种概率”。
如果投掷10次硬币,碰巧会出现10次正面,这个硬币 很可能不存在偏向。如果投掷1024次,平均说来,投 掷10次会出现10次正面。如果选择0.05水平,则当H0 为真时,当我们拒绝H0时,犯错误的概率是0.05。 9.5.1 Ⅰ型错误(α错误) 拒绝一个真实的虚无假设时,所犯的错误。 心理或医学常取0.05的显著性水平,在诸如心理治疗 、咨询或医疗实践中, Ⅰ型错误可能导致更大的风 险或使患者承受更大的痛苦。因此可取0.01的显著性 水平。
罕见的情况使我们怀疑这种情况不是偶然因素所致 ,而是硬币有问题。 这里有一个重要问题:“从投掷硬币的问题,我 们能否得出推论的界限在哪里?” 答案:科学的本质是讲概率的,没有所谓绝对的 科学,在科学领域,多数研究者会采纳下列两个 临界点中的一个作为对非偶然性因素的作用进行 推论的依据。 1. 在一个抽样分布中,如果一个事件发生的概率 ≤0.05时,研究者认为该事件不是偶然因素所致。 而是其他因素引起,例如是对自变量的操纵引起 的。
Fra Baidu bibliotek
下面4个例子各犯了什么错误? 1. H0:μ=4.0,α=0.05,双尾检验,计算得双尾 p=0.03。统计结论:因为p<0.05,所以具有统计学意 义,拒绝虚无假设。假设虚无假设实际为真,则所犯 错误为( )错误。 2. H0:μ=4.0,α=0.05,双尾检验,计算得双尾 p=0.04。统计结论:因为p<0.05,所以具有统计学意 义,拒绝虚无假设。假设虚无假设实际为假,则所犯 错误为( )错误。
9.5.2 Ⅱ型错误(β错误)
接受了一个虚假的虚无假设,那么就犯了Ⅱ类错误 如果α越低(高)那么犯Ⅰ类错误的概率越小(大),而 犯Ⅱ类错误大概率越大(小)。 事实上,选择检验水平反映了科学家的保守倾向, 换句话说,科学家更容易当研究结果为真时,拒绝 研究结果(Ⅱ类错误)。
H0的真实情况 接受H0 决策 拒绝H0 H0为真 正确 1-α Ⅰ类错误 α H0为假 Ⅱ类错误 β 正确 1-β
1问:实际操作中,怎么知道究竟犯了什么错误呢? 答:无从得知,因为无法得知总体参数的真实情况 2问:我们能否识别研究文献中的两类错误呢?
答:无从得知,因为作者的显著水平定为0.05或0.01 ,出现这种错误不可避免。并非作者责任。所以科学 从来就不是绝对正确的。由于这个原因,为了验证结 论的有效性,必须进行独立重复性的研究。 3问:如此说来,我们是否就无法知道哪个实验报告 的统计显著性哪个精确?哪个不精确?
只有25%出现 0.16 0.117 5次正面,不 0.12 0.08 是对半的概率 0.044 是75% 0.04 0.0010.01
概率
0 1 2 3 4
0.117 0.044 0.010.001 8 9 10 11
5 6 7 正面向上的次数
如果出现9次正面1次反面,如何对看待这个结果? 答案:我们怀疑这个硬币的可信度,因为太罕见
随机抽取一个比较大的海龟的样本,海龟重量接近4 磅。样本平均数越接近总体平均数 假如我们抽样发现海龟重量大约是6磅,大样本也 是如此,你会有什么想法? 答案:这些海龟已经不属于4磅的那个群体了。 另外一个问题,由样本估计总体,误差有多大?如 何估计误差?需要把样本结果与预计的结果进行比 较。而预计结果是根据抽样分布得出的。 抽样分布的性质: 1. 加大样本量,统计量的分布越接近参数分布。 2. 分布形态越对称,接近钟形分布。
什么情况拒绝虚无假设呢? 使用0.05的显著性水平,当特定结果发生的概率小于 或等于0.05时,就拒绝虚无假设,同时也就接受备择 假设了。下面给出检验步骤。
1. 假设H0为真 2. 计算抽样分布中样本统计量发生的概率 3. 如果概率足够小,则拒绝虚无假设H0,接受H1. 9.5 统计假设检验:两类错误 问:当拒绝虚无假设时,从统计上讲很难发生的事件 ,偶然会发生呢?