北大心理统计知识点总结统计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第八章访查分析
一方差分析初步
思考以下实验设计的统计方法
程序: 方差分析 (ANOVA).
●ANOVA能够处理数据的类型:在上例中有两个自变量 (称为因素): 学习的时间和
性别. 两个都是组间 (独立样本) 变量. ANOVA 亦可用于分析包含组内 (重复测量)
因素的研究设计,同时包含组间和组内因素的混合设计(e.g. 假设上例中我们对复习时间超过半年的学员纵向研究。性别是组内变量,学习的时间是组间变量).
什么是因素?什么是水平?
●在方差分析中,因素就是自变量. 包含一个自变量的研究称为单因素设计(single-
factor design). 具有多于一个自变量研究称为因素设计(factorial design).
请举一个单因素设计的例子
请前一个例子上再将这个改为多因素设计
●构成因素的个别处理条件称为因素的水平.
性别这个因素的水平?
●上述研究称为因素设计, 两个组间因素,培训的经历这个因素有 3 个水平,专业这个
因素有2个水平 (称为 3 X 2 组间设计).
ANOVA的逻辑
●与假设检验的逻辑是同样的, 只是具体内容有变化
step 1: 陈述 H0 (和H1 ??) ,确定标准: α = ?
step 2: ANOVA 检验总是单尾
step 3: 指出检验的df (有两个 df)
step 4: 查表找出临界 F统计量
step 5: 对于样本,计算 F统计量
step 6: 比较 F统计量和临界 F统计量
step 7: 对于H0 作出结论
单因素, 独立测量研究设计的例子
●检验三个不同的学习方法的效应。将学生随机分配到3个处理组
●方法 A:让学生只读课本, 不去上课.
●方法 B:上课,记笔记,不读课本.
●方法 C:不读课本,不去上课, 只看别人的笔记
●Step 1: 陈述假设和设定标准 (选择 a)
H0: μ1 = μ2 = μ3
H1: 其中一个组与另一个(或更多)的组均值不同。备择假设可能的形式很多:
μ1不等于μ2 = μ3
μ 1 = μ3 不等于μ2
μ 1 = μ2 不等于μ3
μ 1 不等于μ2 不等于μ3
因此,只需给出虚无假设就够了
●step 2: ANOVA 检验总是单尾. 因为不存在负的方差. F分布表也只有单侧的Alpha.
(F分布图)
●step 3: 找出检验的 df. 注意要考虑几个 df
●step 4: 从表找出临界 F统计量
与 t分布表类似, F分布表也是描述一族 F分布.
需要用到两个df,用一个找出正确的行另一个找出正确的列.上面一行对应于α= 0.05, 下面一行对应于α= 0.01.
●step 5: 计算样本的F统计量观测值
概念的水平的讨论:
ANOVA 非常类似两个独立样本的 t检验
tobs = 得到的样本均值间差异
期望的机会差异
对于 ANOVA检验统计量 (称为 F比率) 类似
F = 样本均值间方差 (差异)
期望的机会(误差)方差(差异)
为什么用方差?
●
●因为有多于两个组.
●如何计算一个分数来描述差异间分布? 差异不能够分割, 但是方差能够分割。这就
是ANOVA -方差分析名字的由来.
●首先考虑方差的来源.
●什么造成样本的不同(处理间变异) ?
●处理/组效应 - 处理造成的差异
●个体差异效应 - 个体差异变异
●随机误差
●每一个样本内部的变异 (处理内变异)
●个体差异效应
●随机误差
F比率可以表达为:
●F比率 =样本均值间的方差 (差异)
●期望的机会 (误差)方差(差异)
●F比率 =处理间方差
●处理内方差
●F比率 = 处理效应 + 个体差异 + 随机误差
●个体差异 + 随机误差
●注意: 有时分母叫做误差部分,其量度了由于机会造成的方差
●
如果 H0 为真,处理效应的值应该如何?
●H0: μ1 = μ2 = μ3
●如果没有差异, 效应方差 = 0
如果效应方差 = 0, F比率值?
●F比率 = 0 + 个体差异 + 随机误差 = 1.0 个体差异 + 随机
误差
●如果 H0 为假, F比率应该大于 1.
●step 6: 比较 F统计量的观测值与临界 F统计量
●如果 F统计量的观测值 (Fobs) 在统计上显著地大于 1.0 则拒绝 H0
ANOVA的专用符号
●K = 处理条件(或组)的数目
●n = 每一个组的数目(如果它们相等)
ni = 第i组的数目(如果它们不等)
N = ∑ni = 总的样本容量
Ti = ∑Xij
●G = ∑Xij =总的和
G-bar = G / N = 总的均值
●SSi = 每一个组的和方 = ∑(Xij - Xi)2
●在上例中:
●∑X2 = 106
G = 30 = 总的和
N = 15 = 总的样本容量
G-bar = 30/15 = 2 = 总的均值
K = 3 =处理条件 (或组) 的数目
●
ANOVA的过程和例题
●F比率 = 处理间方差