不同群体的差异比较抽样调查课件课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
– 峰度系数g2表示峰型
– 若g1 =0且g2 =0则为正态分布
• D检验法
• 计算步骤(频数表资料)
– 无效假设H0:总体服从正态分布 – 计算统计量D值
D n
1 fxT n2 fx 3
fx
2
fx n
2
其中,x 为各组组中值,f 为各组频数,T 为各组平 均秩次,n 为总例数
第一节 假设检验概述
• 主要内容 • 掌握假设检验的概念、基本思想和步骤;
• 熟悉假设检验的分类;假设检验的两类错 误和注意事项;正态性检验的原理和方法 ;
• 了解假设检验的思维方法和数据转换的方 法。
7.1.1假设检验的概念、基本思想和步骤
1、假设检验的原因 由于个体差异的存在,即使从同一总体中严格的随机
三、选择统计方法和计算统计量
• 根据资料的类型选择选择不同的统计方法,并计算 不同的统计量。 • 如两个样本均数的假设检验,样本均数与总体均数 的假设检验选用t检验法,计算t值 • 多个均数的假设检验,选用方差分析,计算F值
四、求p值
• 意义:如果总体状况和H0一致,样 本信息支持H0的概率。具体来说: • 如果H0成立,抽得现有样本差别的 概率P,亦就是现有样本差别是由于 抽样原因引起的概率P。
灵活确定水准
• 一般取=0.05
• 对于组间方差齐性检验或资料的正态性检 验,研究者期望得到阴性结果,为了减少 假阴性结果二类错误,由于一类错误和二 类错误呈反比关系, 取0.10,0.20或更大 较为适宜。
根据样本特点,选用不同假设检验方法
• (1)计量资料的两均数进行比较时,一般 可选用t检验和u检验。对两小样本均数比较 必须满足两个条件:正态性和方差齐性。
7.2.2 软件操作
• Descriptive –Explore 考察“统计分析案例” 的“男、女” “环境分数”的正态分布 • Analyze-Nonparametric Test-K-s考察“统计分 析案例”的“男、女” “环境分数”的正 态分布,分组用Split –File • Graph-Legacy “环境分数”的正态分布,” “性 别”分类,”年级聚类“
单侧检验和双侧检验
• 两者是研究者根据分析目的和专业知识等信息采 用的两种不同检验形式。 • 如:要了解新研制的某中药对肝炎的治疗效果。 如果试验组是在西药治疗的基础上加新研制的中 药,中西药的疗效不会低于西药组,就可以用单 侧检验,双侧检验特别适用于对预试验结果进行 分析。 • 在同一检验水准下,单侧检验比双侧检验的界值 小,单侧拒绝域比双侧的拒绝域大,比双侧检验 更易得出拒绝H0,从而得出差别有统计学意义。
• •
H1:
1 2
二、确定检验水准
• 检验水准,用希腊字母α 表示。 • 显著性水平()就是我们用来区分大概率事件和小概 率事件的标准,是人为规定的。当某事件发生的概 率小于时,则认为该事件为小概率事件,是不太 可能发生的事件。通常 取0.05 或 0.01。 • α为犯第一类错误的概率,第一类错误即为拒绝了 实际上成立的H0。
7.1.2 假设检验的两类错误
推断结论和两类错误
实际情况 拒绝H0 H0真 H0不真
检验结果 不拒绝H0 结论正确(1—) 第Ⅱ 类错误
第 类错误 结论正确(1—)
型错误:拒绝了实际上成立的H0 ,
这类“弃真”错误称为型 错 误,其概率大小用 表示。
Ⅱ 型错误:“接受”了实际上不成立 的H0 ,这类“存伪”错误称为 Ⅱ 型 错误,其概率大小用 表 示
4.假设检验思想的剖析
•
• 假设检验的基本思想类似于逻辑论证的反证法。 它的程序是在检验一个假设是否成立时,先假定这 个假设成立,如果由此导出一个不合理的现象(出理 了小概率事件),就拒绝这个假设;如果没有导出不 合理的现象(未出理小概率事件),则不能拒绝原来 假设。 数学中逻辑论的反证法是由假设推导出与公理、定理 或已知条件相矛盾的结论。从而推翻假设。 统计中的假设检验则是由假设推出一个概率事件(并 不是绝对矛盾)而拒绝假设。 从这里也看拒绝假设还是一个犯错误的概率。只是这 个概率很小而已。
CI与假设检验的区别和联系
• CI推断参数值的范围;由于CI给出了 具体的数量范围,即可回答差别有无 显著的统计学意义,还可提示差别有 无实际意义。. • 假设检验判断各参数间有无质的不同 ,可以获得较为确切的概率值。
7.1.3 正态性检验与数据转换
• 对数值变量进行假设检验时应先进行 正态性检验和方差齐性检验,必要时 还需要对资料进行数据转换,已使资 料满足数值变量资料统计方法的应用 条件——正态性和方差齐性。
•
• •
5.假设检验的一般步骤
• 一、建立假设 • 二、确定检验水准
• 三、选择统计分析方法及计算统计量 • 四、求p值
• 五、做统计结论
一、建立假设
• 假设有两种: • 1.检验假设或无效假设,记做H0(假设比较的样本 来自相同的总体,它们的差别仅是由于抽样误差 引起) • 2.备择假设,记做H1,即假设比较的样本的差别 不是抽样误差引起的,而是来自不同的总体。 • 如: 1 2 • H0:
2 2
2、Q-Q图
• 以样本的分位数作为横坐标,以按照正态 分布计算的相应分位点作为纵坐标,把样 本表现为直角坐标系的散点。如果资料服 从正态分布,则样本点应该呈一条围绕第 一象限对角线的直线。 • 以上两种方法以Q-Q图为佳,效率较高。 • 3、直方图,是否以钟形分布。 • 4、箱式图,观测离群值和中位数。 • 5、茎叶图,类似与直方图,但实质不同。
– 查D界限值表,做出结论
• Jarque-Bera检验(偏度和峰度的联合分布检 验法) nk 1 2 S K 2 • 检验统计量为 JB= 6 4 • JB过大或过小时,拒绝原假设。 • 图方法 • 1、P-P图 以样本的累计频率作为横坐标,以按照正态 分布计算的相应累计概率作为纵坐标,做 散点图。如果资料服从整体分布,则样本 点应围绕第一象限的对角线分布。
假设检验的结论不能绝对化
• 统计结论是具有概率性质的推论,不能使用 “证明”、“肯定”、“一定”、“说明” 等词。 • 有统计学意义时不一定有专业意义。 • 若样本足够大或标准差特别小,即使两均数 间相差很小,也可能得出P≤0.05的结果。
结合专业知识作出推论
• 假设检验能够帮助研究者做出 较合理的推断,但不能代替研 究者做出专业结论。
假设检验的注意事项
• • • • 一、事先进行严密的统计学设计 基本原则:对照、随机、重复、均衡。 没有对照就没有鉴别。 随机:就是总体中的同质单位,都有同等机会被抽 到,随机可以保证样本对总体有代表性,避免主 管偏向性。 • 重复:就是适当的样本含量,样本含量过少不能发 现规律性,过多造成浪费,样本含量根据实验或 抽样调查要求,可查表或按公式计算求得。 • 均衡:亦就是除处理因素外,其他因素都应保持基 本相同。
2 1 2 2
df n 1
还可以计算为:
t
X1 X 2 d d / n nn 1
2 2
df n 1
(2) 两样本独立
t X1 X 2 n1 S n2 S n1 n2 n1 n2 2 n1 n2
通常情况下Ⅱ型错误未知
• 对于一般的假设检验: • 定为0.05(或0.01),的大小取决 于H1。通常情况下,比较总体间有无差 异并不知道,即H1不明确,值的大小无 法确定,也就是说,对于一般的假设检 验,我们并不知道犯Ⅱ型错误的概率有 多大。
当样本容量n一定时, 越小, 越大; 越大, 越小。在实际 工作中,往往通过去控制。
,不属于小概率事件,则不拒绝H0,差别无统计学
意义,结论是不认为两总体均数不相等。
(2)如果p<,我们认为在检验假设H0成立的条件
下,得到等于或大于现有统计量u值或t值的可能性 小于,可判断为小概率事件,则拒绝H0,接受H1
,差别有统计意义,结论是两总体均数不相等,或
者某一总体均数大于(或小于)另一总体均数。
n
⑵ 两样本独立
Z
X1 X 2
12
n1
2 2
n2
2
两总体正态,标准差未知,方差齐性,n1 或n2小于30
• 总体标准差未知条件下,平均数之差的抽 样分布服从t分布。 • 计算公式为:
X1 X 2 t SE D
X
(1) 两样本相关
t X1 X 2 S S 2 r S1 S 2 n 1
抽样,X1、X2、X3、X4、、、,不同。
因此,X1、X2 不同有两种(而且只有两种)可 能: (1)分别所代表的总体均数相同,由于抽样误差造 成了样本均数的差别。 (2)分别所代表的总体均数不同。
• 2、假设检验的目的 • 判断是由于何种原因造成的不同,以做出 决策。
• 3.假设检验的思想方法
• 假设检验是用小概率事件原理做逻辑判断 的一种思想方法: • 通过统计学的计算分析,在某个假设(H0) 条件下,发生事件A的可能性不到0.05,而 在实际的研究中,一次抽样就发生了事件 A,那么研究者就认为所做假设(H0)不成立 。
• 将计算得到的u值或 t值与查表得到u或t,ν, 比较 ,得到 P值的大小。 • 如果|u|> u或| t |> u ,则 P< ; • 如果|u|< u或| t | < u ,则P> 。
五、推断结果
(1)如果p>,认为在检验假设H0成立的条件下, 得到等于或大于现有统计量u值或t值的可能性大于
第二节统计检验的前期工作——对数据分布 特征的检验
• 7.2.1正态性检验
• 矩法 • D检验法
• Jarque-Bera检验
• 图方法
• 非参数检验方法
• 矩法
• 偏度系数和峰度系数
– 偏度系数g1表示分布的对称性
• g1 =0:对称 • g1 >0:正偏态 • g1 <0:负偏态 • g2 =0:正态峰 • g2 >0:尖峭峰 • g2 <0:平阔峰
• 平均数差异的显著性检验时,统计量的基本计 算公式为:
SEDX 表示 X 之差的标准差
H0:μ 1=μ
2
X1 X 统计量 SE DX
1.两总体正态,总体标准差已知
总体标准差已知条件下,平均数之 差的抽样分布服从正态分布
⑴ 两样本相关
Z
X1 X 2
2 12 2 2 r 1 2
H1: <0 成立
1
1
界值
0
•I型错误与II型错误示意图(以单侧u检验为例)
与 间的关系
减少(增加)I型错误(),将会增加(减少) II型错误(),增大n 同时降低 与
检验效能(power of a test)
1– 称为假设检验功效,也称把握度。 意义: • 两总体确有差别,被检出有差别的能力 • 如: 1– =0.90,则意味着当H0不成立 时,理论上在每100次抽样中,在检验 水准上平均有90次能拒绝H0
第三节 两个独立样本差异的显著性检验—— 两个群体差异的比较之一
• 平均数差异的显著性检验 • 方差齐性条件下,平均数差异显著性检验
• 方差不齐性独立小样本平均数差异的显著性 检验假设检验 • 方差齐性检验 • 总体方差未知,独立样本t检验的完整过程
方差齐性条件下,平均数差异显著性检验的 统计量及计算公式
• (2)计数资料的率或构成比比较可选用 X 2 检验 • (3)等级资料可选用秩和检验
正确理解统计推断的意义
• 统计推断的结论是依据现有的设计、现有 的研究方法与条件、现有的资料及其分析 目的和要求,所取的检验水准,所采用的 统计分析方法等所做出的具有相应概率意 义的解释,不宜将结论的意义扩展或缩小 。
假设检验的结果
• α为0.05或0.01作为检验水准是人为的,可根据需要 选择。 • 接受检验假设 • 拒绝检验假设 • 正确理解结论的概率性(都隐含着犯错误的可能性
): • (1)接受H0,拒绝H1,并非H1绝对不成立,只是H1 成立 的机会较小;
• (2)拒绝H0,接受H1,也并非绝对H0绝对不成立,也只 是成立的概率较小。