第七章假设检验社会统计学总结

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2019/1/9
14
在统计检验中,通常把被检验的那个假设称为 零假设(用符号H0表示,也称虚无假设), 并用它和其他备择假设(用符号H1表示)相对 比。备择假设也可以称之为研究假设,研究 假设通常是研究者想要收集证据予以支持的 假设,但是很多时候人们很难直接对其进行 检验,于是就先通过检验与研究假设相对立 的虚无假设是否成立来间接的确认研究假设 是否被接受。虚无假设是整个研究假设的起 点。
2019/1/9 16
例3 学生中经常上网的人数超过25%吗? (属于研究中的假设,先提出备择假设)
提出原假设: H0: 25 选择备择假设: H1: : 25
2019/1/9
17

注意:备择假设通常用于支持你自己的看 法,比如你在做一项研究,并想使用假设 检验支持你的说法,就应该把你认为正确 的看法作为备择假设。假如你开发了一种 新药以提高疗效,如果你想要提供这种药 物疗效有显著提高的证据(这是你自然想 要支持的),就应把你想支持的说法假设 作为备择假设。
2019/1/9 6
③ E(X)=μ=np, D(X)= σ2= npq ④ 二项分布受 p 和 n 变化的影响,只要确定了 p 和 n,成功次数 X 的分布也随之确定。因此,二项分 布还可简写作 B(x;n,p)。 ⑤二项分布的概率值除了根据公式直接进行计算 外,还可查表求得。二项分布表的编制方法有两种: 一种依据概率分布律 P(x) 编制(见附表2);另一种依 据分布函数 F(x) 编制(见附表3)。 其中
统计检验的依据是 小概率原理:一是认为 小概率事件在一次观察 中是极少出现的;二是 如果在一次观察中出现 了小概率事件,那么应 该否定原有事件具有小 概率的说法或者假设。
2019/1/9
10
二、假设检验的过程
提出假设 作出决策
拒绝假设! 别无选择.
Βιβλιοθήκη Baidu总体
我认为人口的平 均年龄是50岁


2019/1/9
18
关于建立假设的认识总结



1、原假设与备择假设是一个完整事件组。 2、通常先确定备择假设,再定原假设。 3、等号总放在原假设。 4、两者的选择本质上带有主观色彩。 5、假设检验的目的主要是收集证据拒绝原 假设。
2019/1/9
19


假设检验得出的统计结果都是根据原假设 进行阐述的: 要么拒绝原假设 要么不拒绝原假设(从不说接受原假设, 因为这只能说明样本提供的证据还不足以 推翻原假设,并不等于我们承认原假设是 对的。当我们不拒绝原假设时,实际上并 未给出明确的结论)
2019/1/9 9
统计检验是指先建立一个关于总体情况的假设, 继而抽取一个随机样本,然后以样本的统计量或者统 计性质来检定假设。


大数定理表明:就大量观察 而言,事件的发生具有一定 的规律性。 根据概率的大小,人们处理 的态度和方式很不一样。 在日常生活中,人们往往习 惯于把概率很小的事件,当 作一次观察中是极不可能看 到的事件。例如,人们出门 做事就有可能遇到不测事故, 但却很少人因此而不敢出门。 原因是:小概率事件极不可 能发生。
2019/1/9
15
例1,采用新技术生产后,将会使产品的使用寿命明 显延长到1500小时以上 属于研究中的假设 建立的原假设与备择假设应为 H0: 1500 H1: 1500 例 2 ,改进生产工艺后,会使产品的废品率降低到 2%以下 属于研究中的假设 建立的原假设与备择假设应为 H0: 2% H1: < 2%
同理,我们也可以求出 这个二项试验中硬币刚好为 0,1,2,…,8次面朝上的 各种宏观结果的概率,全部 写出来就是右表。
2019/1/9
5
2. 二项分布讨论
X P(X) 0 1 2 … … n 合计
① 二项分布为离散 型随机变量的分布。每 当试验做的是在相同的 条件下n次重复的贝努利 试验时,随机变量X共 有n+1个取值。二项分 布可以用分布律(见上表) 和折线图(见右图)来表 示。 ②当P=0.5时二项分 布的图形是对称的。
13
1.建立假设 统计检验是将抽样结果和抽样分布相对照而作出判 断的工作。取得抽样结果,依据描述性统计的方法就足 够了。抽样分布则不然,它无法从资料中得到,非利用 概率论不可。而不对待概括的总体和使用的抽样程序做 某种必要的假设,这项工作将无法进行。比如通过掷硬 币的实验得到二项分布,必须假设:①样本是随机的, 试验中各次抛掷相互独立;②硬币是无偏的(或称是诚 实的),即p=q=0.5。概括地说,必须首先就研究总 体和抽样方案都做出假设,再加上概率论,我们就可以 对各种可能结果做具体的概率陈述了。
2019/1/9
1
第一节 二项分布
二项分布是从著名的贝努里试验中推导而来。所谓 贝努里试验,是指只有两种可能结果的随机试验。在实际 问题中,有许多随机现象只包含两个结果,如男与女,是 与非,生与死,同意与不同意,赞成与反对等等。通常, 我们把其中比较关注那个结果称为“成功”,另一个结果 则 称为“失败”。每当情况如同贝努里试验,是在相同的条 件 下重复n次,考虑的是“成功”的概率,且各次试验相互 独 立,就可利用与二项分布有关的统计检验。虽然许多分布 较之二项分布更实用,但二项分布简单明了,况且其他概 率分布的使用和计算逻辑与之相同。所以要理解统计检验 以及它所涉及的许多新概念,人们几乎都乐意从二项分布 2019/1/9
第七章 假设检验
我们在第一章就已经知道,推论统计有两个基本 内容:①假设检验;②参数估计。有了概率和概率分 布的知识,接下来我们要逐步掌握统计检验的一般步 骤。既然按照数学规则得到的概率都不能用经验方法 准确求得,于是,理论概率和经验得到的频率之间肯 定存在某种差别,这就引出了实践检验理论的问题。 随机变量的取值状态不同,其概率分布的形式也就不 同。本章我们不仅要引出二项分布和正态分布这两个 著名的概率分布,并且要将它们与抽样调查联系起 来,以领会统计检验,并逐步拓宽其应用面。
2
1. 二项分布的数学形式
从掷硬币的试验入手。假定二项试验由重复抛掷n次 硬币组成,已知硬币面朝上(成功)的概率是p,面朝下(失 败)的概率是q (显然有 q=1―p)。这样,对试验结果而 言,成功的次数(即硬币面朝上的次数)X是一个离散型 随机变量,它的可能取值是0,1,2,3,…,n。而对X的 一个具体取值x而言,根据乘法规则,我们立刻可以就试 验结果计算出一种特定排列方式(先x次面朝上,而后n―x 次面朝下)实现的概率,即
2019/1/9 22
两类错误及其关系
在统计检验中,无论是拒绝或者接受原假设,都不 可能做到百分之百的正确,都有一定的错误。第一类错 误是,零假设H0实际上是正确的,却被否定了(弃真错误)。 第二类 错误则是,H0实际上是错的,却没有被否定(纳伪错误)。 遗憾的是,不管我们如何选择否定域,都不可能完 全避免第一类错误和第二类错误,也不可能同时把犯两 类错误的危险压缩到最小。对任何一个给定的检验而 言,第一类错误的危险越小,第二类错误的概率就越 大;反之亦然。一般来讲,不可能具体估计出第二类错 误的概率值。第一类错误则不然,犯第一类错误的概率 是否定域内各种结果的概率之和。
ppp…pqqq…q=pxqn-x
2019/1/9 3
由于正确解决概率问题,光考虑乘法规则是 不够的,还要考虑加法规则,于是就x次成功和 (n―x)次失败这个宏观结果而言所包含的所有 排列的方式数,用符号表示
这样,我们就得到了二项试验中随机变量X的 概率分布,即
2019/1/9
4
譬如,二项试验是将一 枚硬币重复做8次抛掷,假 设这枚硬币是无偏的,即p =q=0.5,那么恰好得到5 次面朝上的概率是
20

2019/1/9
2.求抽样分布 在做了必要的假设之后,我们就能用数学推理 过程来求抽样分布了。比如在这一章开头,在硬币重 复抛掷n次的理想实验中,我们计算了成功次数为x的 宏观结果所具有的概率,得到二项分布。如果前提假 设变动了,还可以求出其他形式的概率分布,如正态 分布、泊松分布、卡方分布等等,它们都有特定的方 程式。由于数学上已经取得的成果,实际上统计工作 者要做的这项工作往往并不是真的去求抽样分布的数 学形式,而是根据具体需要,确定特定问题的统计检 验应该采用哪种分布的现成的数学用表。
2019/1/9
12
根据以往多年的统计表明,某大 学学生的英语平均成绩为90分,今年 随机抽取100个学生,其平均成绩为80 分,问今年学生的英语成绩是否下降?
所所 包有 含统 的计 步检 骤验
(1)建立假设 (4)计算检验统计量 (2)求抽样分布 (5)判定 (3)选择显著性 水平和否定域
2019/1/9
抽取随机样本
均值 X = 20
2019/1/9 11

假设检验思想在统计学中的描述:经过抽 样获得一组数据(即样本):根据样本计 算的统计量,如果:原假设成立的条件下 几乎不可能发生的,就拒绝或否定原假设; 如果在原假设成立的条件下,根据样本计 算的统计量发生的可能性不是很小,则接 受原假设 。
硬币面朝 上数x
0 1 2 3 4 5 6 7 8 合计
概率P(X=x)
1/256= 8/256= 28/256= 56/256= 70/256= 56/256= 28/256= 8/256= 1/256= .004 .031 .109 .219 .274 .219 .109 .031 .004 1.000
2019/1/9
21
3.选择显著性水平和否定域
在统计检验中,我们通过将样本观测值出现的概 率和小概率事件的标准(显著性水平)进行比较来 确定是否拒绝虚无假设,这个样本观测值出现的概 率称为P值(P value).也可以根据显著性水平及检 验统计量服从的抽样分布,计算出发生小概率事件 的检验统计量的取值范围——拒绝域(rejection region)也称为否定域。 根据样本观测值计算出来的检验统计量的取值落 在拒绝域,就拒绝虚无假设。否则,就接受虚无假 设,拒绝研究假设。 (显著性水平和p值检验二者无实质差异,但p值提 供了更多的信息,它可以与任何一种需要的显著性 水平作比较,而且统计软件业能很方便的计算出p 值,所以,p值检验得到了很广泛的应用。SPSS的 假设检验是用p值来进行决策的)
2019/1/9
7
[例] 某特定社区人口的10%是少数民族,现随机 抽取6人,问其中恰好2人是少数民族的概率是多少? [解] 解法一:根据(7.3)式直接计算

解法二:根据附表2中纵列n=6和横行p=0.1所 对应x值,可直接查得B(x;6,0.1)的概率值 B (2;6,0.1)=0.0984 解法三:根据附表3求得 B (2;6,0.1)=F(2) ―F(3 ) = 0.1143―0.0159=0.0984
2019/1/9 8
第二节 统计检验的基本步骤
二项分布是用数学或演绎推理的方法求得的一种理论分布。认识到 概率分布是先验的理论分布这一点很重要,因为我们不禁要问,既然试 验或抽样调查的结果仅与随机变量可能取值中的一个相联系,那么实际 试验或样本调查对结果的概率分布及前提假设有没有一个检验的问题? 具体来讲,对于一枚硬币被重复抛掷8次的二项试验,经验告诉我们,一 共有9种可能的结果,而且实现这些结果的机会是大不相同的。研究者实 际上从来不用经验的方法求得概率分布,因为通常我们只对一项试验进 行一次或几次,抽取样本也是一个或至多不过几个。既然二项分布是按 照数学规则得到的,那么对这9种结果的可能性我们应该作出何种评价呢? 如果实际试验(或抽样)得到的结果偏巧就是先验概率预示的最不可能 出现的结果,那么我们是认定纯属巧合,还是开始对用数学或演绎推理 方法求得的概率以及理想试验的种种前提假设产生怀疑?更准确地说,在 一枚硬币被重复抛掷8次的这个二项试验中,究竟出现什么结果时,我们 应该对二项分布及其前提假设产生怀疑呢?是不是只要不是得到4次成功4 次失败这个最大可能性结果就开始怀疑,还是仅当出现8次成功或一次也 不成功这两个极端情况时才产生怀疑呢?这就是统计检验的核心问题。
相关文档
最新文档